您的位置：首页 > 其它

社交标签技术的研究

2011-12-03 09:46 183 查看

Survey on Social Tagging Techniques--Manish Gupta, Rui Li, Zhujun Yin and Jiawei Han
这篇文章对标签技术进行了深入的研究，包括tag streams的属性、标签模型、标签语义、基于标签的推荐、标签可视化、标签的应用以及运用标签时
存在的问题。
1.简介（对tag技术的感性认识）
在W亡 b2.0中，用户不仅可以通过豆瓣来分享图书、通过土豆来共赏视频，而且可以通过博客发表博文、通过Flickr发布照片、通过Youtube上传视频等方式来创造内容。用户的这些活动有一个共同的特征，即用户会自由地选择一些词(Term)或短语 (Phrase)来标注相关网络信息资源。我们称用户的这种行为为“标注 (tagging)”，用户所选择的词或短语为“标签(tag)”，提供标注行为的系统为“社会标签系统” (SocialTaggingSystem)。从某个用户来看，标注过程本身非常简单，是个体行为，但这种个体行为的结果一标签具有重要的意义，正是这些标签连接起了用户和资源。一旦标签被hitemct汇集在了一起，形成了社会标签，这个时候，汇集在一起的社会标签可以看作是社会大众对某个目标的理解、观点或者看法。
对于一个特定的web对象或资源，加标签就是用户给其指定标签的过程。很多网站越来越流行采用社交标签。不同的社交系统所支持的标签资源不同。Flicker中，用户能够对自己或他人上传的图片进行标签；而在Delicious中，则允许用户对每个URL进行个性化标签。Flicker有固定的一套标签，而Delicious则是有用户自定义的。在博客系统中，也允许对用户提交的博客添加标签。最近，又出现了三元标签，格式如下key=value，例如：高度=1.8。
还有一种事实标签(rel-tag)，揭示了超链接的目的地。在一些多媒体网站，例如Youtube、imeem和Metacafe等，可以对直播、点播、视频和音乐进行标签。在Yahoo！上，对于结果可以进行积极和消极的标注。
1.1 元数据和固定分类的困境
不同网站共享不同的资源对象，例如图片、新闻、书灯。通常为了支持丰富的资源对象和更多的应用例如搜索，需将这些对象和元数据进行关联。但是，
手工指定的元数据需要消耗很多时间[1]。此外，元数据的定义会因为系统设计者或内容提供者或分类创建者的不同而不同，即具有差异性。除了将元数据和对象关联，在社交共享系统中建立分类也是对对象进行分类和组织的有效方法。但是固定的静态分类固定和保守。[2]条目通常并不是严格属于某个分类，层次化的分类会被分类者的认知所影响，通常带有主观性和偏见。固定的结构化分类模式不能适应不断增加和进化的条目。而且这样的社交系统需要分类专家建立固定分类，用户在创建对象的时候需要给对象进行分类指定，这样减少了用户对提交的主动分析[3]。丢失了精确性、表述差异性，忽略了用户的个性需求和观点。
1.2 大众分类法(folksomomy)
大众分类法通过提供更简单、方便和自然的方式组织web对象来避免上述问题。folksonomy=folk(people)+taxis(classification)+nomos(management),是
用户决定的分类，是自底向上的。大众分类法可以认为是时间轴上，一系列用户、一系列tag和一系列资源的集合。[4]
扁平化。大众分类法中没有对条目之间的关系进行严格定义，所有条目属于一个扁平命名空间，也就是没有结构层次，一定程度上反映了用户的词汇表。[2]
对用户认知能力要求低。标签过程不需要用户实现的认知，或者说门槛很低。
具备反馈性，tag可以作为用户之间异步沟通的一种介质；
此外tag还具备包容性，可以将条目与热门话题或长期话题关联。
同时，通过关联的tag可以找到影响不到的东西。
总的说来，大众分类法是处于传统结构化固定化分类法和无分类或元数据之间的一种分类方法。和传统的分类方法相比，其具备满足用户需求和语言的特性。
2.TAGS：why&what
为什么要用tag以及tag的意思到底是什么
2.1用户使用标签的动机
将来获取：用户通过对对象进行标签来方便以后对该对象的获取。标签还能作为对自己或他人的提醒。
分享：标签可以用来描述资源，能够把资源加入到概念化的群组中。
吸引注意：热门标签使得用户去查看具体的资源
游戏：标签可以给予内部或外部规则。例如，在ESP游戏中，用户会猜其他用户可能的标签；还有一些系统可能规定条目的标签方式，方便条目的获取。
自我表达：标签允许用户自定义来标记特定资源。
观念表达：标签中解释了用户想要想其他用户共享的价值观。
2.2tag的分类
基于内容的标签：标记资源里面实际存在的内容，或者说对象
基于情景的标签：这类标签提供对象是在哪个情景之下创建或保存的，例如描述地理位置和时间的标签
属性标签：这类标签解释对象的属性，不能和内容直接分离。这些标签指明了资源是关于什么或者谁的等
归属标签：标明哪个用户拥有该资源
主观标签：表达用户观点和情感的标签。可以据此来进行对象推荐。
组织化标签：定义个性化的东西。通常和全局其他人的tag没有关系，并和时间有关系。
组标签：通过这类标签可以产生结构化的大众分类。例如在Delicious中，用户选择一个URL作为其他URL的标签。下一级结构中的条目可以其上一级作为标签，这样如果查找某一级中哪些资源，主需要列出有该标签的资源。
2.3分类者和描述者
加标签者可以分为分类者和描述者。[5]分类者为对象分配标签，方便之后的个性化查找。他们拥有自己的词汇表。例如在Delicious就是一种通过分类者类进行元数据定义。而描述者则是方便对象被其它人搜索到。描述者的词汇表比分类者的大。但是作为一个分类者自身仍然受限于个人词汇和主观意念。分类者与描述者的直观判断：
a）用户使用标签的数量越多，他是一个描述者的可能性越高
b）标签表增长的越快，用户是一个描述者的可能性越大
c）作为分类者更倾向于用较少的信息去对资源进行“编码”
这些直观的判断能够转化为可量化的指标：标签率(tag ratio)--标签和资源之间的比率；孤立标签(orphaned tags)--被小部分资源采用的标签部分；标签熵(tag entropy)--反映了标签编码效率
2.4标签的语言学分类[6]
功能性：表述对象功能的标签，例如：枪
功能性配置：被功能所定义，但是能够被集合起来
起源配置：描述事物为何在一起。例如：储物仓、吃饭使用的盘子
功能和起源：描述对象为何出现，目的是什么，或者来自于何处
分类：用来对对象进行合理分类
形容词：对资源进行指示，例如：红色、好看、有趣等
动词：动作词汇。例如：探索、跳跃等
合适的名字：大多数标签都属于这类
2.5基于tag的游戏
ESP游戏中，有两个用户，都会看到同样一幅图片，然后进行标签，系统对比用户提交的标签，从而知道相同的标签。PhotoPlay[7]需要3-4个玩家，有四幅图片，每个玩家从7*7的词汇片中选择相关联的词语对其中任意一副图片进行描述。
但是这些游戏中，积分的时候，相同的标签越多，用户得分越高，这样导致会丢失很多有价值的语义。人们倾向于填写图片大众化的属性而不是具体的、特殊的描述，从而保证获得高分。
3. 标签产生模型
标签产生模型和很多因素相关，例如：来自其他人的标签建议、用户的背景知识、资源内容和组织影响。
3.1 Ploya Urn产生模型
直观上，第一个影响用户选择标签的因素是用户之前制定的标签。对条目进行标签的工作量也会影响用户的决定。使用建议的标签相对就减少了用户自身的工作量。Pirolli和Card的信息搜寻理论证明用户倾向于采用建议的标签来优化信息/工作量的比率。[8]用户会用最小的工作量去建立适当的结构用来便于对有用资源的快速获取。很多模型都是基于Ploya urn过程。
3.1.1 基本的Ploya Urn模型
Golder和Huberman提出了一个基于Polya urn模型的模型。假设在urn中初始有两个球，一个是红色的，一个是黑色的。每一步中，一个球从urn中取得，接着会向urn返回两个颜色一样的球。经过一系列对球的操作后，相同颜色的球颜色固定，各个部分会聚集到有限的范围之内。这个模型成功符合了已经分配的标签更有可能被再次选择。但是这个模型却不能有效满足新标签的加入。
3.1.2Yule-Simon 模型
Yule-Simon模型[9]中每个新的标签将会以概率p添加到标签流。该过程可以简单描述如下，每个离散的时间段都会向文本中加入词语：新加入的词是新词的概率是p，则有1-p的概率是已经存在于文本中，选择新加入词是基于当前其出现的频率。
3.1.3拥有记忆的Yule-Simon模型
Cattuto [10]等提出了Simon模型的一个改进。将标签流中标签的次序考虑进去。和前一个模型一样，同样是模仿前面标签的指定，但是不设置固定的概率。模型可以描述如下：在协作式标签系统中，用户对资源标签的过程可以认为是在构建一个文本，每次向该文件写入一个词。在一个时间t，新词以概率p加入到文本中，有1-p的概率是对文本已有词的拷贝，如果是已有词的拷贝则在一定时间内回退x步.
3.2语言模型
资源内容会影响标签的产生。这样，标签的产生可以通过使用某种语言模型像隐藏的狄利克雷分配模型[11]。标签是对现实世界经验的一种简单语言。Zhou等人[12]提出了一个概率产生模型用来产生文档内容和相应的标签。这有助于对条目、文档和用户进行主体性分析。这个模型可以描述如下：每个在文档d中的条目w都认为是从源x产生而来的；通过x的条件概率分布，找到一个话题z；对于给定的话题z，w最后是通过z的条件概率分布得出的。对于文档标签来说，相似的，文档d的标签w是由用户x产生的。对于特定的用户，有话题的条件分布，z就是从中选取的。隐藏的话题又最后生成了标签w。
3.3其它影响因素
除了上面的模型，还有其他因素影响人们使用标签。
Sen等人[13]提出了三个影响个人使用标签的因素：1.过去的标签行为 2.组织内其他成员的标签行为 3.标签展示的选择算法
Flicker[14]中组织对标签选择的影响可以通过Marlow的论文知道[14]。其中一个特性是用户更倾向于跟从其朋友上传的照片；而随机的用户群有更小的重复标签，当他们之间的联系越零散，该现象更具普遍意义。
4标签分析
为了更好的理解社交标签数据，已经开展了有很多针对社交标签数据的分析工作
4.1标签分布
研究者发现其中最重要的一个特性就是，幂次定律(power law)。
4.1.1 标签系统的词汇表
对很多不同数据集中标签的研究表明，标签总数上是随时间遵从幂次定律；但是最新研究表明，一定程度上是线性的。
4.1.2资源的标签增长
对于单个资源，其标签的词汇表的增长在时间上是遵从指数为2/3的幂次定律的[15]。而且标签流的频率分布也是遵从幂次定律的。[16]Cattuto等人的研究表明，不同资源词汇表的分布和指数r有关。前1000个靠前的资源分布符合参数r大约为0.71的高斯曲线。这表明排名越高的资源其增长越符合一定规律。
4.1.3 用户标签词汇增长
同样有针对特定用户使用标签的研究。Golder和Huberman[17]的研究表明当有新资源加入时用户的直接标签（用户自己定义的，不是copy别人的）增长呈线性。但是Marlow等人对多个用户的研究表明，图片中直接标签，其标签数量增长是随时间减少的。
4.2 区分标签的语义
标签是由用户定义的标识，具有语言意义。对这方面的研究包括三个方面：标识相似的标签、将标签映射到分类、对特定类型标签的抽取。
4.3标签之间成对的关系分析
为了衡量标签之间的相似性，学者们提出了很多不同的模型用来计算标签的相似性。其中很多模型都是基于一个简单假设：相似的标签会被用来标识同样的资源，相近的资源被相似的标签定义。可以建立内部标签关系图，在该图里面标签作为节点，如果两个标签同时出现，则两者有边连接，边的权重是标签之间的cosine-distance.这种结构化的标签图，为研究人们如何标签和分布式大众分类法中的语义结构提供重要参考。
4.3.1 通过标签抽取拓扑
另外一种研究标识标签语义的方式就将标签映射到已有的拓扑中。自动的对标签进行分类到语义类别中，使得我们能够更好的理解用户对对象的标注。最简单的就是字符串的匹配。Sigurbjornsson等人[18]通过字符串匹配将Flicker的标签映射到WordNet语义分类中。他们发现Flicker中51.8%的标签能够映射到语义分类中。Overell[19]等人设计一套使用wiki和open目录对标签进行自动分类的系统。使用结构化的模式例如从元数据中抽取的分类和模板来对Flicker标签进行分类。他们构建了一个分类器，将wiki中的文章分为12种语义类别。然后通过使用锚文本将Flicker的标签映射到wiki文章。由于wiki文章已经分过类别了，Flicker的标签会被分成同样的类别。他们将事物分类为what,where和when。结果表明，70%的标签都能被分类。
4.3.2抽取地点和事件语义
标签同样解释了特定的信息，例如地点和时间。Rattenbury等人[20]研究了如何通过Flicker的标签抽取地点和时间语义。对于地点l，通常是图片p产生的地方，但也有可能是图片中事物所在地；对于时间t，通常是图片p获取的时间，但也可能是图片上传的时间。需要确定，标签是否代表了地点或时间。原理就是一个事件(或地点)是和特定时间(或区域)关联的。一个事件标签的使用次数在一个小时间段内出现的次数比在其他时间段内出现的次数高很多。时间段的大小是个关键因素；其他因素还有其他时间段和特定时间段的差异性。对于地点的标识，用地点l去取代时间t。
4.4标签和关键字
标签有利于搜索，那么它和关键字的比较如何呢。在对英文文档的搜索中，用户自定义标签和关键字的性能相当。[21]绝大多数没有满足的关键字搜索，主要原因是由于用户错误拼写或自定义造成的。
5 标签的可视化
标签云已经成为web门户支持浏览的一个功能，不同的标签选择算法对标签进行选择展示。标签云具有的功能有：
1.搜索标签云可以快速的定位特定的标识某种概念的关键词
2.浏览标签云可以很好的支持无特定目地浏览
3.提要标签云可以被看做底层数据的具象表示，很多信息可以直观的得到
4.识别通过观察与某一实体相关的标签云，可以有效地识别出这一实体
5.1用于浏览和搜索的标签云
Sinclair和Cardrew[22]讨论了采用标签比搜索更好的使用场景。他们通过实验，发现如果用户找寻的信息是特定的，则倾向于用搜索；如果比较普遍，则喜欢使用标签。
标签云的好处：给用户到何处如查找信息的提示、对用户的认知能力要求相对低、让用户搜索者能很好的熟悉相关领域
标签云的坏处：标签云使有用的信息变得难以理解、用标签云响应问题的请求次数比采用搜索的次数多、很多用户认为标签云不能减少搜索范围、将近一半的文章都不能通过标签云访问到
5.2标签云中标签的选择
由于标签云占有的空间有限，所以需要对标签进行合适的选择。Hasson-Montero和Herrero-Solana描述了标签云可视化的多维系统。标签选择基于有用性，其决定因素有：对同一资源不同标签的代表地位(次序)、不同标签代表的资源多少、对其他标签未标识资源的覆盖数量。标签的语义关系是由他们的相似性决定的，相似性由Jasscard相似系数进行量化。
Begelman[23]提出了一个聚类算法，用来找寻关联性较强的标签。该算法基于对同时出现的tag对进行数量统计，设定阀值来决定是否使用。为了设置阀值：从尾部的最右端开始找到统计同时成对出现tag的数目，这些数目构成一个函数，到达一阶导数最大值的点（就是二阶导数从整数变为负数的点）而且还要查看找寻的路径是否足够长。结果保存在一个稀疏矩阵中，其中每个元素的值就是两个tag之间的相似度。
5.3标签的结构化
Caro[24]等人提出了tagFlake系统，在标签云中进行语义导航；从文本文档中抽取显著的标签和条目，然后将它们组织成结构化便于进行导航。组织的过程如下：子条目在内容上目依赖于父条目。
5.4标签云的展示格式
标签云可以以多种形式展示。Bielenberg和Zacher提出了圆形云[25]，和典型的矩形云相比，越重要的标签越是靠近中心。标签的字体和与中心的距离体现了标签的重要性，但是标签之间的距离不代表它们之间的相似度。
标签的大小通常用来代表其出现的频率，一个典型的标签云中有大大小小的文本散布着。这造成空白区域的浪费。为了避免空间的浪费，Owen和Lemire等人[26]提出了EDA算法，将区域最小化并将标签聚类。
5.5标签演变可视化
标签通常有时间维度。将其演变过程可视化，是个研究话题。Dubinko等人研究了在Flicker中标签演变可视化。通过flash的方式向用户展示其标签的演变过程。在该展示中，可以认为有河流和瀑布两种抽象的对象，时间轴(横向河流)和数量或频率(纵向河流)，标签则是在两条横向河流上的瀑布。
还可以通过展示特定资源标签随时间的变化，可以看出特定资源的标签稳定性。
5.6标签云的demo
网络上有很多将标签可视化的demo。Grafolicou(http://www.neuroticweb.com/recursos/del.icio.us-graphs/8)揭示了在Delicious上特定URL被标签的时间和次数。HubLog展示了和给定标签相关的标签图。虽然这些demo显示了社交标签的关联性，但是却没有帮助用户更好的浏览。有的标签云显示的时候对用户使用过tag进行随机展示，展示的字体大小和标签使用的次数相关。
6.标签推荐
标签系统可以向用户进行标签推荐，然后用户可以从中选择一个或者自定义新的标签。标签推荐可以提升用户体验，也可以丰富标签。标签推荐可以基于标签的质量、标签同现、
6.1标签质量
标签质量可以指导推荐过程。标签质量可以通过其覆盖面和热门程度衡量，高质量的标签可以用来推荐。Xu等人[27]提出了关于标签质量的准则，提出了基于该准则的一个联合标签推荐算法。一个好的标签合并过程要考虑到被标签对象的多样性；对一个对象的标签数量应该被最小化，合并后的标签所标注的对象也较少。考虑到有的时候会在标签中加入组织信息，需要将这些信息进行剔除。该算法推荐的标签，被大多数人采用，而且减少对重复概念的出现来对事物进行多面覆盖。
6.2标签同现
一个用来进行标签推荐的重要准则就是标签同现。某个对象同时出现的标签会被用来进行推荐。Sigurbjornsson和Zwol[18]提出了四种进行标签推荐的策略。(详见翻译)
6.3使用词语、文档和标签共同的信息
共同的信息也是进行标签推荐另一准则。Song等人使用双向泊松混合模型(Two-way Poisson Mixture Model)为资源建模，并基于此模型对目标资源进行分类，最后基于资源所在的类别内的标签排序进行标签推荐。基于资源内容的标签推荐算法推荐与资源内容相关性较大的标签，可以满足用户对资源的内容管理方面的需求。此类方法产生的推荐结果一般独立于目标用户，故在一方面，其时间性能较高，容易满足实时推荐的要求，但在另一方，对用户的标签使用偏好考虑较少，难以满足用户的个性化需求。
6.4使用对象的特性
例如从图像中提出的内容特性可以用来进行标签推荐。liu[28]等人提出了一种标签分级模式，自动地对同一图像的标签根据相关性进行分级。为了预测标签相关性，作者首先得到基于概率密度的标签初始相关性，然后通过对标签相似图的随机游走来对相关性进行修正。由于所有的标签都通过和图片的相似度来进行分级，这样通过底层的可视特征找到k个最近的邻居，用来向用户进行推荐。Wu等人[29]将标签推荐看做是一个考虑多种形态包括标签同现和视觉相关性的机器学习过程。视觉相关性来自VLM(视觉语言模型)，用来在视觉领域对标签的内容进行建模。对这些分级特性进行合并的学习是根据Rankboost算法。
7标签的应用
社交标签可以用来多个领域，包括索引、搜索、产生分类、聚集、社交兴趣发现等等。
7.1索引
标签可以用来对站点进行快速索引。用户通过对其朋友和同事访问的站点进行标签就可以不需要通过搜索引擎去访问这些站点。同时标签可以用来进行更深的索引。很多网页被标记在站点中，通常不容易被其他站点链接。Carmel等人的研究表明，在搜索时通过对标签质量的进行适当选取，搜索效率提高了。
7.2搜索
标签可以用十分方便的用来进行web搜索、个性化搜索和企业搜索。Sckenkel等人[30]提出了递增的top-k算法，通过社交和语义的扩展利用标签来响应请求。社交标签利于搜索体现在两个方面，一个是标签是对网页的很好概述，第二个是标签的数目代表了网页的热度。[31]Xu等人[32]提出了一个框架，在该框架中页面的rank不仅仅是请求和网页内容之间条目的匹配还包括用户兴趣和网页话题的匹配。
7.3产生分类
Hey-mann和Garcia-Molina提出了将大量标签转换为结构化的标签分类算法。Schmitz等人讨论了对大众分类法进行分析和结构化的方法，还有如何将结果用于拓扑学习。大众分类法可以给公共的分类添加额外价值，能够使用户在分类中对感兴趣的条目进行存储、维护和组织[33]。
7.4聚集和分类
可以将拥有相同标签的文章进行归类[34]。
7.5社交兴趣的发现
Li等人[35]研究发现用户喜欢用自己感兴趣的标签对内容进行标记。
7.6增强浏览效果
Zubiaga等人[36]建议可以利用标签进行导航：中心化浏览（围绕一个点建立信息空间）、流行导航、过滤（社交标签可以用来将用户不需要的东西过滤）。

7.7对大众分类的整合
对不同大众分类的标签可以通过标签的同时出现和聚集进行整合。分布式的用户标签云可以帮助建立更完善的用户简历[37]。TAGMAS是一个联合系统，提供对web2.0平台上分布式的标签资源整合。这样的系统可以用来进行标签的自动生成、大众分类的加载（允许从folk服务器获得一个大众分类）、资源注释和资源搜索（基于标签进行过滤从而定位资源）。
8标签过程的缺点
虽然标签很有作用，但是有很多问题存在，例如：信息垃圾、规范化和模糊问题。其他问题还有贫乏、非一致性等。
8.1垃圾
垃圾制造者可以对标签资源进行非法使用，扩散自己的兴趣。Wetzker等人发现了一个现象，单个用户对同一个博客站点进行大量标签的标注。同时还观察到用户会将这些标注短时间内上传，而且很少再次上传。他们认为这类垃圾制造者的行为具备的特征有：活跃、对较少领域进行标签、对单个资源的标注程度高、大容量提交。为了发现此类垃圾制造者，他们提出了关注度发散的概念，来减少此类垃圾而不需要进行过滤。将标签关注度定义为在某个时间内使用该标签的用户数；在标签第一次提交的时候就进行初始化，这样个人对标签喜好的影响会受到限制。
8.2规范化和模糊
由于不同的用户对文档标注不同，使得大众分类法具有模糊性。用户常常将多个单词联合成一个标签，照成信息的丢失。单个词语会丢失相应的次序。发大众分类法没有提供规范的标签选择和组织准则，包括如何使用标题和标点以及词语的次序等。此外，不同领域的人处出于不同目的会从不同的层次上对资源进行标签。
Guy和Tonkin等人指出无用的标签导致的原因包括了错误的拼写、不好的编辑（往往并不是组合）；标签并不能转换为时间和数量；个性化的标签可能无普遍意义，例如：mydog；有的单个标签在数据中只出现了一次。如何对标签进行转换，比较流行的是对地理标签的转换，一种方法就是将经纬度写成单个标签，在Flicker中有2%的标签是这样表示的。
Lars Pind提出了针对规范化的一些建议，包括：1.向用户推荐标签 2.自动找到同义词 3.帮助用户使用其他人的标签 4.将标签结构化 5.标签可以根据内容进行更新。
9.总结和愿景
9.1分析
最近的研究都是针对单个标签系统而言。但作为用户自主产生的内容，标签在微博和查询日志中肯定因人而异。例如，标签的增长在微博和图片中有何不同？微博的标签模型和图片的有何不同。
9.2对系统设计的改进
目前的标签系统只支持一种标签，研究者们已经在研究如何从扁平的标签空间中抽取结构化的拓扑。一个标签系统同样支持标签讨论方便用户探讨出资源合理的标签。结构化的标签同样得到支持，例如Key-value对。
9.3个性化的标签推荐
用户是描述着还是组织者？情景如何？基于用户的历史，用户选择新标签的可能有多大？用户之前使用的标签中，哪些是其朋友使用过的？对于某个资源，用户是否会利用已有的标签进行标注或采用新的标签？==
9.4更多应用
一些有趣的应用，例如：用户标签进行地理位置分析、对拥有相同或相似标签的资源进行mashup。。。

[1]A. Mathes. Folksonomies - cooperative classification and communication
through shared metadata. Computer
[align=left]Mediated Communication, December 2004.[/align]
[2]Emanuele Quintarelli. Folksonomies: power to
the people.
[3]M. Heckner, M. Heilemann, and C. Wolff. Personal information management vs. resource sharing:
Towards
a model of information behaviour in social tagging systems. In Int’l
AAAI Conference on Weblogs and Social Media (ICWSM), San Jose, CA, USA, May 2009
[4]Klaas Dellschaft and Steffen Staab. An epistemic dynamic model
for tagging systems. In HT ’08: Proceedings of the nineteenth ACM conference on Hypertext and hypermedia,
pages 71-80, New York, NY, USA, 2008, ACM.
[5]Christian Krner. Understanding the motivation behind tagging. ACM Student Research Competition
- Hypertext 2009, July 2009.
[6]Csaba Veres. The language of folksonomies: What tags reveal
about user classification. In Natural Language Processing and Information Systems,
volume
3999/2006 of Lecture Notes in Computer Science,
pages 58–69, Berlin / Heidelberg, July 2006. Springer.
[7]Nicholas Diakopoulos and Patrick Chiu. Photoplay: A
collocated collaborative photo tagging game on a horizontal display. preprint (2007) available
[8]Peter Pirolli. Rational analyses of information foraging on the web. Cognitive
Science, 29(3):343-373, 2005.
[9]Herbert A. Simon. On a class of skew distribution functions. Biometrika,
42(3/4):425–440, 1955.
[10]Klaas Dellschaft and Steffen Staab. An
epistemic dynamic model for tagging systems. In HT ’08: Proceedings of
the nineteenth ACM conference on Hypertext
[align=left]and hypermedia, pages 71–80, N[/align]
[align=left][11]David M.Blei, Andrew Y.Ng, and Micheal I.Jordan. Latent dirichlet allocation. J.Match.Learn.Res, 3:993-1022, 2003.[/align]
[12]Ding Zhou, Jiang Bian, Shuyi Zheng, Hongyuan
Zha, and C. Lee Giles. Exploring social annotations for information retrieval.
In WWW ’08: Proceeding of the 17th international conference on World Wide Web,
pages 715–724, New York, NY, USA, 2008. ACM.
[align=left][13] Shilad Sen, Shyong K.Lam et al. tagging, communities,vocabulary,evolution.In CSCW'06, pp.181-190, Nov 2006, ACM.[/align]
[align=left][14]Cameron Marlow et al. tagging paper, taxonomy, flickr, academic article, toread. In HYPERTEXT'06, pp.31-40, 2006, ACM.[/align]
[align=left][15]Ciro Cattuto et al. Semiotic dynamics and collaborative tagging. PNAS, 104(5):1461-1464, January 2007.[/align]
[align=left][16]Klaas Dellschaft et al. An epistemic dynamic model for tagging system. HT'08, pp.71-80, New York, NY, USA, 2008.[/align]
[align=left][17]Scott Golder and Bernardo A.Huberman. The structure of collaborative tagging systems, Aug 2005.[/align]
[align=left][18]Brkur Sigurbjrnsson et al. Flickr tag recoomendation based on collective knowledge. WWW'08, pp.327-336, 2008.[/align]
[align=left][19]Simon Overell et al. Classifying tags using open content resources. WSDM'09, pp.64-73, New York, 2009.[/align]
[align=left][20]Tye Rattenbury et al. Towards automatic extraction of event and place semantics from flickr tags. SIRIR'07.[/align]
[align=left][21]Xin Li at al. Tag-based social interest discovery. WWW'08, 2008.[/align]
[align=left][22]James Sinclair et al. The folksonomy tag cloud:when is it useful? 2008.[/align]
[align=left][23]Griogry Begelman et al. Automated clustering:Improving search and exploration in the tag space, 2006. [/align]
[align=left][24]Luigi Di Caro et al. Using tagflake for considering navigable tag hierarchies from tag clouds. KDD, pp.1069-1072, ACM, 2008.[/align]
[align=left][25]K.Bielenberg. Groups in Social Software: Utilizing Tagging to Integrate Individual Contexts for Social Navigation.[/align]
[align=left][26]Owen Kaser et al. Tag-cloud drawing:Algorithms for cloud visualization, May 2007.[/align]
[align=left][27]Zhichen Xu et al. Towards the sematic web: Collaborative tag suggestions. WWW'06, 2006.[/align]
[align=left][28]Dong Liu et al. Tag ranking. WWW'09, USA, April 2009.[/align]
[align=left][29]Lei Wu et al. Learning to tag. WWW'09, USA, 2009.[/align]
[align=left][30]Ralf Schenkel et al. Efficient top-k querying over social-tagging networks. SIGIR'08, USA, 2008.[/align]
[align=left][31]Shenghua Bao et al. Optimizing web search using social annotation. WWW'07, USA, 2007.[/align]
[align=left][32]Shengliang Xu et al. Exploring folksonomy for personalized search. SIGIR'08, USA, 2008.[/align]
[align=left][33]Louise F. Spiteri. Structure and form of folksonomy tags: The road to the public library catalogue. 2007.[/align]
[align=left][34]Chirstopher H.Brooks et al. Improved annotation of the blogsphere via autotagging and hierarchical clustering. WWW'06.[/align]
[align=left][35]Xin Li et al. Tag-based social interest discovery. WWW'08, 2008.[/align]
[align=left][36]Arkaitz Zubiaga. Enhangcing navigation on wikipedia with social tags. 09. [/align]
[align=left][37]Martin Szomszor et al. Correlating user profiles from multiple folksonomies. June, 2008.C[/align]

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航