您的位置：首页 > 编程语言 > Python开发

python3 bs4 requests 腾讯新闻标题链接获取小试牛刀

2017-12-28 10:55 621 查看

import requests
from bs4 import BeautifulSoup

url =["http://ent.qq.com/","http://ent.qq.com/",
"http://finance.qq.com/","http://stock.qq.com/hk/",
"http://tech.qq.com/","http://fashion.qq.com/",
"http://mil.qq.com/mil_index.htm",]

for i in url:
wbdata = requests.get(i).text#获取文本方式的响应体实例,会使用其响应的文本编码进行解码

print (wbdata)

soup = BeautifulSoup(wbdata,'lxml')
#通过select选择器定位指定的元素，返回一个列表
news_titles = soup.select("div.text > em.f14 > a.linkto")
# print (news_titles)
#对返回的列表进行遍历
for n in news_titles:
#提取出标题和链接信息
title = n.get_text()
link = n.get("href")
data = {
'标题':title,
'链接':link
}
print (data['标题'],data['链接'])#打印抓取了哪些些内容
f = open('1.txt', 'a')#追加写入
print (data['标题'],data['链接'], file=f)
# f.write(data['标题'])#写入文件
f.close()#写入完成后,关闭文件

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 简单实用易上手

相关文章推荐

新的分享

章节导航

python3 bs4 requests 腾讯新闻 标题 链接获取 小试牛刀

print (wbdata)

python3 bs4 requests 腾讯新闻标题链接获取小试牛刀