[文章摘要]Semantic Annotation of Mobility Data using Social Media
2016-01-18 09:08
274 查看
文章:Semantic Annotation of Mobility Data using Social Media
作者:F Wu, Z Li, WC Lee, H Wang, Z Huang.
来源:ACM WWW 2015.
本文利用LBSN数据来标注轨迹数据,来发现用户旅行的目的,关键问题是得到和用户移动相关的词汇,为此定义了相关函数来描述,利用频率方法、高斯混合模型方法和KDE方法对相关词汇的密度进行建模,实验证明KDE最有效。
![](http://img.blog.csdn.net/20160118090839334)
工作特点:
以前的方法是ststic方法,丢失了动态的时间信息,比如纽约的麦迪逊花园广场,可能举办各种比赛和演唱会,不同的时间有不同的活动。
LBSN数据的挑战之一是其中的文本是noisy的,含有大量不相关的信息;挑战之二是邻近区域的词频可能被少数的landmark所占据。
词频方法的不足:不能找到与位置相关的词。
高斯混合模型的不足:GMM的component数目在不同的词上面会不同;词真正的分布不一定是GMM,如受路网、经典等的影响。
KDE包含了词的局部性和相关性。
未来工作:
考虑时间的作用:
landmark和event有区别,landmark密度一直很高,但event的密度在一定时间范围内很高。
作者:F Wu, Z Li, WC Lee, H Wang, Z Huang.
来源:ACM WWW 2015.
本文利用LBSN数据来标注轨迹数据,来发现用户旅行的目的,关键问题是得到和用户移动相关的词汇,为此定义了相关函数来描述,利用频率方法、高斯混合模型方法和KDE方法对相关词汇的密度进行建模,实验证明KDE最有效。
工作特点:
以前的方法是ststic方法,丢失了动态的时间信息,比如纽约的麦迪逊花园广场,可能举办各种比赛和演唱会,不同的时间有不同的活动。
LBSN数据的挑战之一是其中的文本是noisy的,含有大量不相关的信息;挑战之二是邻近区域的词频可能被少数的landmark所占据。
词频方法的不足:不能找到与位置相关的词。
高斯混合模型的不足:GMM的component数目在不同的词上面会不同;词真正的分布不一定是GMM,如受路网、经典等的影响。
KDE包含了词的局部性和相关性。
未来工作:
考虑时间的作用:
landmark和event有区别,landmark密度一直很高,但event的密度在一定时间范围内很高。
相关文章推荐
- KDE Connect —— 让 Android 手机成为 KDE 桌面的一部分
- 用批处理实现读取文本文件并实现超链接代码的输出[原创]_DOS/BAT_脚本之家
- 文本最末列数值乘一个数的批处理实现
- 实现两个文本同行交替输出的批处理代码
- 随日期每天自动变换的文本的js特效
- 文本、Excel、Access数据导入SQL Server2000的方法
- jQuery设置和获取HTML、文本和值示例
- PHP 文本文章分页代码 按标记或长度(不涉及数据库)
- 基于文本的搜索
- 用文本作数据处理
- extjs表格文本启用选择复制功能具体实现
- jQuery往textarea中光标所在位置插入文本的方法
- jQuery取得设置清空select选择的文本与值
- JQuery将文本转化成JSON对象需要注意的问题
- php将数组存储为文本文件方法汇总
- jQuery实现文本展开收缩特效
- hta实现的二进制文件转换为文本
- 基于文本的留言簿
- 基于文本的访客签到簿