【实践】淘宝在收藏店铺里搜宝贝
2017-11-22 23:46
393 查看
以前淘宝是有这个功能的,比如就只用在自己收藏的店铺里面搜‘面膜’,在自己信赖的店里直接买东西非常快
但是现在这个功能非常限制= =
所以用selenium和python自己做了一个
step 1:登录淘宝
在之前写了
step 2:获取自己收藏夹里面所有的店铺信息
然后就可以设定循环次数,把每一页收藏夹的店铺链接给爬下来
step 3:打开店铺链接,点击所有宝贝,搜索你想要的东西
step 4:判断搜到了多少件 如果是0件,就pass
最后的items就是结果啦
psss:仅限于淘宝不适用于天猫哈 天猫会多弹出一个窗口,但是我不怎么爱在天猫买东西,所以就懒得弄= = 加上也是很简单的哈,用try catch把搜不出来url的放在一个list里面,再单独处理。
但是现在这个功能非常限制= =
所以用selenium和python自己做了一个
step 1:登录淘宝
在之前写了
step 2:获取自己收藏夹里面所有的店铺信息
#向下滚动到页面底部 不然会出错 driver.execute_script("window.scrollBy(0,document.body.scrollHeight)","") time.sleep(10) #获取一共有多少页 t = driver.find_element_by_xpath("//*[@id='mercury']/div[2]/div[3]/div/div[2]").text t = int(re.findall(r'\d+', t)[0])
然后就可以设定循环次数,把每一页收藏夹的店铺链接给爬下来
for link in driver.find_elements_by_class_name("shop-name-link"): url = link.get_attribute('href') print (url) urls.append(url)
step 3:打开店铺链接,点击所有宝贝,搜索你想要的东西
driver.find_element_by_partial_link_text("所有").click() driver.find_element_by_xpath("//*[@id='shop-search-list']/div/div[1]/ul/li[1]/input").send_keys(u"你想要的宝贝") # className不允许使用复合类名做参数 也就是不能有空格 driver.find_element_by_class_name("button").click()
step 4:判断搜到了多少件 如果是0件,就pass
num = driver.find_element_by_class_name("search-result").text num = int(re.findall(r'\d+', num)[0]) if (num != 0): t = driver.find_elements_by_class_name("J_TGoldData") for it in t: item = it.get_attribute('href') print item items.append(item)
最后的items就是结果啦
psss:仅限于淘宝不适用于天猫哈 天猫会多弹出一个窗口,但是我不怎么爱在天猫买东西,所以就懒得弄= = 加上也是很简单的哈,用try catch把搜不出来url的放在一个list里面,再单独处理。
相关文章推荐
- 淘宝店铺宝贝批量复制工具
- 淘宝店铺装修(首页和宝贝详情页显示不一致)
- 教你设置淘宝店铺收藏代码
- 淘宝店铺装修收藏链接代码
- 淘宝卖家如何通过宝贝详情页装修提高店铺转化?
- 淘宝店铺(宝贝描述模板)克隆攻略
- 大淘营淘宝店铺宝贝复制专家3.56 破解记录 不怕升级
- 【转】新手必看-淘宝淘宝店铺宝贝上架时间的技巧
- 淘宝互刷收藏页面,方便新手互刷收藏店铺 增加人气 流量
- 卖家新神器:淘宝宝贝复制专家。可以复制淘宝、天猫上的宝贝到自家店里卖。分分钟克隆店铺。谁要,请留言你要克隆的店铺或宝贝地址!
- c# 避开淘宝助理检测上传宝贝描述含其他店铺图片的小工具【原】
- 淘宝店铺一天内收藏人气暴增,一直没有人气的你为何不试试呢?
- 淘宝店铺设计的方法教程 宝贝描述的详细处理方法
- 淘宝店铺的运营思路和宝贝描述的要素与量子分析,开店必须要学的
- 好文收藏:哔哩哔哩大数据采集服务—Lancer系统设计与实践
- 永远有效的淘宝店铺推广方法
- 必须收藏此视频|这俩宝贝|
- 云互联(http://www.yunone.com/)淘宝店铺名[格子窝]垃圾皮包骗子公司分析