您的位置：首页 > 其它

谷歌开源深度学习街景文字识别模型

2017-07-12 10:01 519 查看

原文链接：http://www.sohu.com/a/138305672_465975

1.谷歌地图街景数据集：800亿张，增长率数百万张/天

2.谷歌地图任务：每天为数百万人指路并提供相应的实时信息，推荐商铺。

3.谷歌街景难题：信息随着世界变化而实时更新

4.《Attention-based Extraction of Structured Information from Street View Imagery》

任务：读取门牌号和街道名

方法：深度神经网络

数据集：多个国家的街景图，街景门牌数据集SVHN(训练读取门牌号，http://ufldl.stanford.edu/housenumbers/)
, 法国街道路标数据集FSNS（%84.2正确率，训练读取街道名，https://github.com/tensorflow/models/blob/master/street/README.md）

附加任务：读取图片中的商户名，以及其他信息。

开源地址：https://github.com/tensorflow/models/tree/master/attention_ocr

5.谷歌实习生
Zbigniew Wojna

任务：提取街道名字和数字，自动创造和定位新的地址
难题：同一个街道可能有不同的名字，比如信工所和信息工程研究所，将文本规范成与我们日常命名习惯一致的方式。
方法：开发一个深度学习模型框架
错误率：15.8% 的错误率
6.依据名字来提供对商户的导航
任务：从街景图像中发现大规模商户
论文：Large
Scale Business Discovery from Street Level Imagery

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 深度学习图像处理谷歌地图开源

相关文章推荐

新的分享

章节导航