您的位置:首页 > 其它

如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)

2015-08-13 10:41 176 查看

如何获得NIPS会议上批量下载的链接?

NIPS会议下载网址:http://papers.nips.cc/

a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图



b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)


下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)

这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!

1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合







2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)


我们先把<li><a href="替换成http://papers.nips.cc 再把">替换为.pdf @@@@





-------------------------------------------------------------------------------------------------------------------------------------------------------------------
现在就得到以下的代码了,如图


而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?



接下来看小编怎么解决,这也是最重要的一步!!!!!!!!


其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因) @@@@.*替换为 (这里敲3下空格键即可,我就是要替换空白)



为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图



得到下载链接,接下来就是用迅雷批量下载即可

总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)


04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: