您的位置:首页 > 其它

谷歌开源深度学习街景文字识别模型

2017-07-12 10:01 519 查看
原文链接:http://www.sohu.com/a/138305672_465975

1.谷歌地图街景数据集:800亿张,增长率数百万张/天

2.谷歌地图任务:每天为数百万人指路并提供相应的实时信息,推荐商铺。

3.谷歌街景难题:信息随着世界变化而实时更新

4.《Attention-based Extraction of Structured Information from Street View Imagery》

任务:读取门牌号和街道名

方法:深度神经网络

数据集:多个国家的街景图,街景门牌数据集SVHN(训练读取门牌号,http://ufldl.stanford.edu/housenumbers/)
, 法国街道路标数据集FSNS(%84.2正确率,训练读取街道名,https://github.com/tensorflow/models/blob/master/street/README.md)

附加任务:读取图片中的商户名,以及其他信息。

开源地址:https://github.com/tensorflow/models/tree/master/attention_ocr

5.谷歌实习生
Zbigniew Wojna 

任务:提取街道名字和数字,自动创造和定位新的地址
难题:同一个街道可能有不同的名字,比如信工所和信息工程研究所,将文本规范成与我们日常命名习惯一致的方式。
方法:开发一个深度学习模型框架
错误率:15.8% 的错误率
6.依据名字来提供对商户的导航
任务:从街景图像中发现大规模商户
论文:Large
Scale Business Discovery from Street Level Imagery
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐