H指数(h-index)的Python实现
2017-09-15 14:43
666 查看
H指数(h-index)是一种比较主流的科研评价方法,可用于评估研究人员的学术产出数量与学术产出水平。某人的h指数是指在其发表的N篇论文中,有h篇论文分别被引用了至少h次,其余N-h篇的引用次数均不超过h次。例如,张三发表了10篇论文,其中有5篇论文被引用次数大于等于5次,而没有6篇论文的引用次数大于等于6次,那么张三的H指数即为5。
第一种方法:实现简单,但是列表较大的话,效率较低。
''' 输入一个列表,列表内容为某人的每篇文章的引用次数。 输出H指数值 ''' def Hindex(indexList): indexSet = sorted(list(set(indexList)), reverse = True) for index in indexSet: #clist为大于等于指定引用次数index的文章列表 clist = [i for i in indexList if i >=index ] #由于引用次数index逆序排列,当index<=文章数量len(clist)时,得到H指数 if index <=len(clist): break return index test=[6,5,6,5,5,4,3,5,6,2,1] print 'H-index指数为:',Hindex(test) ''' 列表test的输出为5 在列表test中,大于等于5的值的个数为7,而大于等于6的值为2 因此列表test的H指数为5 '''
第二种方法:首先利用Counter数据结构将引用次数和对应的文章数量建立一个映射,这样构建的字典长度为固定值,即引用次数的不重复个数。剩下的计算只用计算引用次数和计数即可。
from collections import Counter def Hindex(indexList): #构建引用次数与文章篇数的映射 HCounter = Counter(indexList) #逆序字典,让引用次数高的引用次数排在前面 ReversedCounter = sorted(HCounter.iteritems(), reverse = True) #分别生成 引用次数列表CounterKeys 和 该引用次数的文章列表CounterValues CounterKeys = [i[0] for i in ReversedCounter ] CounterValues = [i[1] for i in ReversedCounter] #CounterKeys,CounterValues根据索引值一一对应,遍历索引值 for index in range(0,len(CounterValues)): #sum(CounterValues[0:index+1])为大于等于某个索引值——CounterKeys[index]的所有的文章总和 if CounterKeys[index] <= sum(CounterValues[0:index+1]): break return CounterKeys[index] test=[6,5,6,5,5,4,3,5,6,2,1] print 'H-index指数为:',Hindex(test)
相关文章推荐
- python 给DataFrame增加index行名和columns列名的实现方法
- 8 python 定制自己的类,实现查看属性,按index取值,迭代,切片等个性化类
- python 统计代码行数,注释行数的简单实现
- python+soket实现UDP协议的客户/服务端中文聊天程序
- [转载]Python实现ASP+ACCESS注入的工具源代码
- Python实现判断强密码
- 如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站
- 【Python学习系列八】Python实现线性可分SVM(支持向量机)
- python实现的登录和操作开心网脚本分享
- python实现obj模型的归一化
- [Machine Learning]Kmeans 算法 python 实现
- 再谈随机森林---python实现
- python一个进程——多线程threading的实现
- python实现求1-100的和
- Python多线程thread与threading实现
- Python实现的检测网站挂马程序
- Python实现冒泡排序
- 最小二乘法python实现
- Python socket上传文件的服务端和客户端实现
- 线程池原理及python实现