python爬虫学习(股票数据爬取)
2017-03-19 21:55
531 查看
最近在学习python爬虫方面的知识,下面是做的一个简单爬虫示例。
从沪深A股中爬取股票列表中的数据到本地
用到的库:requests库,BeautifulSoup
爬取的链接为:http://quote.stockstar.com/stock/ranklist_a_3_1_1.html
代码如下:
从沪深A股中爬取股票列表中的数据到本地
用到的库:requests库,BeautifulSoup
爬取的链接为:http://quote.stockstar.com/stock/ranklist_a_3_1_1.html
代码如下:
import re import requests from bs4 import BeautifulSoup def getHTML(url,code='utf-8'): print("in fun 1") try: r=requests.get(url) r.raise_for_status() r.encoding=code return r.text except: print("get error") return "" #查看网页源代码,获取列表信息,num表示要查找的页数 def getStockInfo(infolist,url,fpath,num=1): print("in fun 2") for i in range(num): myurl=url+str(i+1)+".html" print(myurl) html=getHTML(myurl,'GB2312') try: soup=BeautifulSoup(html,'html.parser') #print("--------") headlist=soup.find('thead',attrs={'class':'tbody_right'}) print(headlist) headname=headlist.find_all('td') ls=[] for ea in headname: ls.append(ea.string) print(ls) with open(fpath,'a',encoding='utf-8')as f:#股票数据表头 for i in range(len(ls)): if len(ls[i])!=10: t=ls[i]+' '*(10-len(ls[i])) f.write(t+'\t') f.write("\n") tbody=soup.find('tbody',attrs={'class':'tbody_right'})#限定搜索范围 trs=tbody.find_all('tr') #查找所有tr标签 for tr in trs: tds=tr.find_all('td') each=[] for td in tds: each.append(td.string)#string表示标记之间的文本 infolist.append(each) #print(infolist) except: print("erron") return "" def outputfile(infolist,fpath):#打印列表 with open(fpath,'a',encoding='utf-8')as f: for tr in infolist: for td in tr: if len(td)!=10:#将每个元素限定在10个字符以内 t=td+' '*(10-len(td)) f.write(t+'\t') f.write("\n") def main(): url="http://quote.stockstar.com/stock/ranklist_a_3_1_" num=2 infolist=[] path=r"g:/project/file1.txt" getStockInfo(infolist,url,path) outputfile(infolist,path) if __name__ == '__main__': main()
相关文章推荐
- python3.x爬虫学习:股票数据定向爬虫笔记
- 一个用Python编写的股票数据(沪深)爬虫和选股策略测试框架
- 一个月入门Python爬虫学习,轻松爬取大规模数据
- Python 爬虫实战:股票数据定向爬虫
- python学习3:获取股票历史数据
- python爬虫案例——证券之星股票数据采集
- python爬虫案例——东方财富股票数据采集
- Python爬虫入门(爬取某网页财经部分股票数据)
- python爬虫:使用Mongodb数据库存储数据学习笔记
- Python网络爬虫与信息提取-Day14-(实例)股票数据定向爬虫
- 【数据挖掘学习】 2.1 Python网络爬虫:Python安装
- Python爬虫(入门+进阶)学习笔记 1-5 使用pandas保存豆瓣短评数据
- python python 入门学习之网页数据爬虫cnbeta文章保存
- Python爬虫入门学习--(向网页提交数据)
- python股票数据爬虫requests、etree、BeautifulSoup学习
- python爬虫由浅入深9---定向爬取股票数据信息并保存至本地文件
- python爬虫笔记(七):实战(三)股票数据定向爬虫
- Python爬虫(入门+进阶)学习笔记 1-7 数据入库之MongoDB(案例二:爬取拉勾)
- python爬虫学习 之 定向爬取 股票信息
- python爬虫案例——东方财富股票数据采集