数据科学论文翻译笔记2-比较不同微博网站基于社区的信息采纳和扩散
主要内容:
随着社交媒体的广泛使用,利用社交媒体数据研究社会科学问题成为一种趋势。但是,由于文化、语言、政治等因素,单一社交媒体平台有封闭性,要想获得真正全面的人口样本,不能依赖单一社交媒体平台数据。
我们构建了一个异构社交网络信息采纳模型,并利用InfoMap算法进行社区划分以提取社区特征,由此提出四个假设:
1.推特和微博用户可以通过不同的关系和路径被连接,从中提取的特征对预测每组用户的信息采纳是重要的。
2.对于从某种关系中提取的某个相同特征对推特和微博用户的信息采纳贡献是不同的。
3.如果用户i属于社区k,那么从社区k中提取的特征对预测用户i的信息采纳有统计学意义。
4.社区内部和外部特征对于预测社交网络中的信息采纳是重要的,社区内外部的特征对信息采纳贡献是不同的。
在实验部分,我们分别收集了连续九天新浪微博和推特的消息,并提取用户信息、标签和关系信息,进行数据清理之后,将其中的前七天数据作为训练数据,后两天数据作为测试数据。利用随机森林分类器生成四个模型——区分是否基于社区,并比较模型性能。之后进行变量重要性测量,比较不同特性对两个平台的重要性。为了探究标签采纳行为的潜在因素,我们采用结构方程建模进行验证性因子分析。
我们通过实验结果验证了四个假设。发现推特和微博用户的信息采纳模式不同,推特注重“回复”,微博注重“@”;对推特和微博用户来说,社区内部特征对信息采纳预测都很重要。
未来研究:
提高标签质量,更复杂的社区检测方法以提取更多特征,区分标签和实体。
知识点:
社交媒体泡沫Filter bubble
社交媒体信息挖掘的已有领域
异构社交网络:转发、回复、@、标签
原文:
Comparing Community-based Information Adoption and Diffusion Across Different Microblogging Sites
链接:https://pan.baidu.com/s/14qhPCI4s3FBvbO0f3gNh6A
- 数据科学论文翻译笔记7-提高在线社交网站隐私和安全的有效途径
- 数据科学论文翻译笔记5-降低易受攻击性以保护社交网站用户隐私
- 数据科学论文翻译笔记6-降低社交网站用户易受攻击性
- 数据科学论文翻译笔记8-对话隐私
- 数据科学论文翻译笔记4-千禧一代和非千禧一代脸书用户对隐私和安全的感知
- 数据科学论文翻译笔记3-特征离散化对网络用户识别随机森林分类器准确率的影响
- 【图像识别】【论文】残疾人手语交流辅助系统手语识别与翻译&&基于数据手套的虚拟手的实现
- 2018-3-8(论文--网络评论中的非结构化信息表示与研究)笔记-----基于证据理论的网络评论综合方法
- 数据科学个人笔记:推荐系统之推荐算法(基于内容+标签+半监督学习模型)
- 基于逻辑的数据模型datalog 的递归应用 (论文摘要笔记)
- 数据科学个人笔记:推荐系统之推荐算法(基于协同过滤)
- 网站数据分析:基于用户细分的比较分析zz
- 网站数据分析:基于用户细分的比较分析
- 数据科学个人笔记:推荐系统之推荐算法(基于图+隐语义)
- [论文笔记](东北大学)基于组合服务执行信息的服务选取方法研究(计算机学报, 2008)
- 2018-3-5 (论文—网络评论中结构化信息处理的应用于研究)笔记三(互信息,信息增益,期望交叉熵,基于词频的方法,CHI统计)
- 计算机毕业设计论文网站综合比较
- 论文写作以及专业英语翻译网站
- JAVA笔记40——引用类型比较1:内置数据类型比较+comparable接口+comparator接口
- 数据分享中的差分隐私保护 论文笔记