对CBIR系统发展所面临的两大不适定问题--semantic gap & sensory gap 的浅显理解
2012-07-09 16:18
423 查看
不适定问题是什么?
适定问题的定义:满足下列三个要求的问题
问题解是存在的。
解是惟一的。
解连续依赖于定解条件。
这三个要求中,只要不满足一条,则称之为不适定问题。
(来源:百度百科
点击打开链接)
言归正传,对semantic gap 和 sensory gap 的理解:
Semantic gap:The semantic gap is the lack of coincidence betweenthe information that one can extract from the visual data andthe
interpretation that the same data have for a user in a given situation.
理解:semantic gap是对同一张图片来讲,是计算机和人之间的差异。计算机能够从图像中提取的低层特征信息与人能够从图像中感知高层语义信息之间的gap,因为计算机根据特征信息判断图像的语义信息有一定的困难,因此这是CBIR所要解决的问题。
Information:指的是计算机从图像中提取的信息,比如颜色、形状、纹理等低层视觉特征。
Interpretation: 指的的人从图片中感知到的诸如男人、高楼大厦等对象信息;欢乐、痛苦等表达的情感信息;篮球比赛、唱歌等事件信息。这些信息就是人能够理解的高层语义特征。
如下图:
计算机提取的低层视觉特征:
颜色:蓝色、白色和绿色
形状:
纹理:
人能够理解的高层语义特征:
对象:蓝天、白云、绿草
事件:
情感:
计算机自动提取的低层视觉特征和人所理解的高层语义特征存在巨大的差异。由于人对图像的相似性的判别依据与计算机对相似性的判别一句之间的不同,造成了人所裂解的“语义相似”与计算机理解的“视觉相似”之间的Semantic gap的产生。
Sensory gap:the gap between the object in the world and the information in a computational description derived from a recording of the scene.
理解:sensory gap 是真实世界和图像等记录间存在的差异,图像不能完整地描述真实世界而造成的鸿沟,理解的不是很透彻,也没有具体例子去理解。
下面是从一篇论文上摘下来的两种sensory gap的描述。(参考文献1.)
The 2D-records of different 3D-objects can be identical. Without further knowledge,one has to decide that they might represent the same object.
Also, a 2D-recording of a 3D-scene contains information accidental for that scene and that sensing but one does not know what part of the information is scene related.
参考文献:
1.Smeulders AWM, Worring M, Santini S, Gupta A, Jain R. Content-Based Image Retrieval at the End of the Early Years. IEEE Trans Pattern Anal Mach Intell 2000;22(12):1349-80.
适定问题的定义:满足下列三个要求的问题
问题解是存在的。
解是惟一的。
解连续依赖于定解条件。
这三个要求中,只要不满足一条,则称之为不适定问题。
(来源:百度百科
点击打开链接)
言归正传,对semantic gap 和 sensory gap 的理解:
Semantic gap:The semantic gap is the lack of coincidence betweenthe information that one can extract from the visual data andthe
interpretation that the same data have for a user in a given situation.
理解:semantic gap是对同一张图片来讲,是计算机和人之间的差异。计算机能够从图像中提取的低层特征信息与人能够从图像中感知高层语义信息之间的gap,因为计算机根据特征信息判断图像的语义信息有一定的困难,因此这是CBIR所要解决的问题。
Information:指的是计算机从图像中提取的信息,比如颜色、形状、纹理等低层视觉特征。
Interpretation: 指的的人从图片中感知到的诸如男人、高楼大厦等对象信息;欢乐、痛苦等表达的情感信息;篮球比赛、唱歌等事件信息。这些信息就是人能够理解的高层语义特征。
如下图:
计算机提取的低层视觉特征:
颜色:蓝色、白色和绿色
形状:
纹理:
人能够理解的高层语义特征:
对象:蓝天、白云、绿草
事件:
情感:
计算机自动提取的低层视觉特征和人所理解的高层语义特征存在巨大的差异。由于人对图像的相似性的判别依据与计算机对相似性的判别一句之间的不同,造成了人所裂解的“语义相似”与计算机理解的“视觉相似”之间的Semantic gap的产生。
Sensory gap:the gap between the object in the world and the information in a computational description derived from a recording of the scene.
理解:sensory gap 是真实世界和图像等记录间存在的差异,图像不能完整地描述真实世界而造成的鸿沟,理解的不是很透彻,也没有具体例子去理解。
下面是从一篇论文上摘下来的两种sensory gap的描述。(参考文献1.)
The 2D-records of different 3D-objects can be identical. Without further knowledge,one has to decide that they might represent the same object.
Also, a 2D-recording of a 3D-scene contains information accidental for that scene and that sensing but one does not know what part of the information is scene related.
参考文献:
1.Smeulders AWM, Worring M, Santini S, Gupta A, Jain R. Content-Based Image Retrieval at the End of the Early Years. IEEE Trans Pattern Anal Mach Intell 2000;22(12):1349-80.
相关文章推荐
- 编译android4.0出现jdk版本问题 & 服务器系统变量配置
- 解决访问优盘(MP3)出现 "本次操作由于受计算机的限制而被取消,请与你的系统管理员联系" 的问题
- ubifs文件系统的制作过程&&遇到的问题及解决方案总结---之三“UBIFS镜像的制作&&烧写”
- 深入理解计算机系统之异常控制流----fork打印问题
- 运维角度浅谈MySQL数据库优化一个成熟的数据库架构并不是一开始设计就具备高可用、高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善。这篇博文主要谈MySQL数据库发展周期中所面临的问题及优化方
- 探讨:2017年大数据发展前景及面临的问题!
- Linux系统cp:omitting directory`XXX'问题解决
- malloc&&free的系统运行机制及其源代码的理解
- Android中调用系统摄像并且保存到指定位置的一些问题&Uri转文件路径方法
- 深入理解云存储和云计算-I/O负载导致的分布式面临的问题
- 学生信息管理系统总结 之 "常见小问题"
- google开发新人入职100天,聊聊自己的经验&教训 个人对编程和开发的理解 技术发展路线
- struts2 <s:select>理解以及默认值的问题
- 中国风险投资发展面临的问题
- "lsass.exe-系统错误,终结点格式无效"问题
- 《可信计算的研究与发展》和《互联网信息可信性问题》的摘要与理解
- 大数据系统的浅显易懂理解
- 最接近的点配对(分治问题理解) && HDU 1007代码
- linux-->结合windows系统分区理解linux系统分区以及挂载点
- Bias && Variance及相关的问题理解