python3 bs4 requests 腾讯新闻 标题 链接获取 小试牛刀
2017-12-28 10:55
621 查看
import requests
from bs4 import BeautifulSoup
url =["http://ent.qq.com/","http://ent.qq.com/",
"http://finance.qq.com/","http://stock.qq.com/hk/",
"http://tech.qq.com/","http://fashion.qq.com/",
"http://mil.qq.com/mil_index.htm",]
for i in url:
wbdata = requests.get(i).text#获取文本方式的响应体实例,会使用其响应的文本编码进行解码
from bs4 import BeautifulSoup
url =["http://ent.qq.com/","http://ent.qq.com/",
"http://finance.qq.com/","http://stock.qq.com/hk/",
"http://tech.qq.com/","http://fashion.qq.com/",
"http://mil.qq.com/mil_index.htm",]
for i in url:
wbdata = requests.get(i).text#获取文本方式的响应体实例,会使用其响应的文本编码进行解码
print (wbdata)
soup = BeautifulSoup(wbdata,'lxml') #通过select选择器定位指定的元素,返回一个列表 news_titles = soup.select("div.text > em.f14 > a.linkto") # print (news_titles) #对返回的列表进行遍历 for n in news_titles: #提取出标题和链接信息 title = n.get_text() link = n.get("href") data = { '标题':title, '链接':link } print (data['标题'],data['链接'])#打印抓取了哪些些内容 f = open('1.txt', 'a')#追加写入 print (data['标题'],data['链接'], file=f) # f.write(data['标题'])#写入文件 f.close()#写入完成后,关闭文件
相关文章推荐
- Python抓取新闻标题和链接
- python爬虫——获取新闻标题
- vfp9.0通过WebBrowser控件获取QQ新闻标题及链接
- 有关利用python获取网页, 以及KDD近几年论文标题与摘要链接
- python获取CSDN个人收藏的文章链接和标题,然后发送到指定邮件
- vfp9.0通过WebBrowser控件获取QQ新闻标题及链接
- 关于python网络爬虫——摘取新闻标题及链接
- Python简单抓取新浪某网页新闻链接及标题
- Python正则抓取新闻标题和链接的方法示例
- python获取新闻标题及发布时间
- python + selenium + PhantomJS 获取腾讯应用宝APP评论
- wordpress 获取分类ID,分类标题,分类描述,分类链接url函数
- python BeautifulSoup获取 网页链接的文字内容
- 【实现】[抓取知网论文标题摘要] 终于能用Sublime直接编译运行python了,可是却无法导入bs4 | BeautifulSoup
- (转)网络采集软件核心技术剖析系列(1)---如何使用C#语言获取博客园某个博主的全部随笔链接及标题
- C++和python如何获取百度搜索结果页面下信息对应的真实链接(百度搜索爬虫,可指定页数)
- python-70:使用BS4获取正文内容
- 获取当前页面的所有链接的四种方法对比(python 爬虫)
- 五.python requests ip伪装,cookie登陆获取,利用cookie进行登陆
- Python爬虫框架scrapy批量获取腾讯招聘网上面的信息