Python于allitebooks.com爬虫书籍名称导入数据库
2018-04-01 16:54
483 查看
Python于allitebooks.com爬虫书籍名称导入数据库
准备工作1.python软件
2.搭建数据库
(备注:数据库和数据表可提前创建好,也可以python代码搭建)
1 创建数据库
博主是提前在SQLyog里创建好了数据库,数据库名为python,数据表此处也取名为python,名字可任意取不影响,如下图(此处做实验只爬取了书名):2 爬取书籍名称导入数据库python
(1)爬虫分析
在查询界面点击右键,选择检查使得页面和代码可同时分析,在书籍列表点击书名或者封面图都可以进入详情,则书名和封面图任选一个,这里选择书名。我们可以通过查找class=”entry-title”定位到书名所在的h2标签,然后通过此标签的a属性即可获得书名所在的a标签,再通过a标签的string属性可获得书名。
(2)代码实现
第一步:连接数据库,以便爬虫结果直接导入数据库,该部分参见上一篇博客第二步: 爬虫数据导入数据库
r= requests.get(url) #向服务器发送请求 soup = BeautifulSoup(r.text,'lxml') #声明BeautifulSoup对象 pattern = soup.find_all('h2', class_='entry-title') #通过查找class="entry-title"定位到书名所在的h2标签 try: values = [] #初始值为空 for item in pattern: #循环批量插入记录数据 values.append(item.a.string) #将h2标签下a标签中的字符串数据插入列表 cursor.executemany('insert into python(bookName) values(%s)',values)#执行 cursor.executemany(),将数据插入数据库
3 结果
源代码:
链接:https://pan.baidu.com/s/1m1zUxONPP_8SkU4CJm005w 密码:dzyj
相关文章推荐
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(1): 基础知识Beautiful Soup
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格
- Python爬虫-爬取xixizhan.com站点的所有电影列表并写入文件和数据库mysql
- Python整站式爬虫并存储数据库练习
- 英文电子书下载:www.allitebooks.com
- python爬虫抓取MM图(www.mmjpg.com)
- HTMLParser解析网页,提取链接地址、标题名称,并插入数据库 分类: python 小练习 HTMLParser 2014-02-19 09:57 519人阅读 评论(0) 收藏
- Python实现数据库数据导入Excel
- 使用python将mdb数据库文件导入postgresql数据库示例
- 【Python爬虫】按时爬取京东几类自营手机型号价格参数并存入数据库
- Python爬虫实战六之抓取爱问知识人问题并保存至数据库
- Python第十三天 django 1.6 导入模板 定义数据模型 访问数据库 GET和POST方法 SimpleCMDB项目 urllib模块 urllib2模块 httplib模块 django和web服务器整合 wsgi模块 gunicorn模块
- Python爬虫小项目(1):抓取转转网西安二手商品的详细信息并导入mongo,绘制图表,慢更
- Python3.6 协程 aiohttp+asyncio+pysql异步爬虫的实现 爬取资源存入数据库
- python3爬虫 爬取图片,爬取新闻网站文章并保存到数据库
- python爬虫补充章,在总控节点那台机器上安装mongodb和redis数据库 都是非apt方法
- python将日志导入数据库代码案例2
- 【原创】python爬虫获取网站数据并存入本地数据库
- 运维学python之爬虫中级篇(九)Python3 MySQL 数据库连接