您的位置:首页 > 其它

chencang-----是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢

2015-05-19 12:24 495 查看
文章来源:http://tinypig.iteye.com/blog/415103

RT

目前抓了淘宝的200多万家 的店铺地址(URL)了,不知道算不算流氓爬虫。估计爬了他们 95%的店铺地址 ,仅供参考。

发现一个搞笑的店铺,整个店铺里都是卖避孕套之类的,分类到了数码相机类里面去了,哈哈

目前不知道taobao会不会把一个店铺分到多个类中,如何会分到多个类中的话,我这数值还要缩减,自己要来排重一下。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐