scrapy 将item存到mysql中(pymysql)
2017-11-23 13:04
435 查看
本文将介绍如何将抓好的item数据存入到mysql中
声明:本文使用的python交互工具为pymysql并非mysqldb,因为网上使用pymysql存入数据的相关文章较少,所以写了这篇文章供大家参考
环境:ubantu
准备工作:
items.py
将想要抓的数据累出来,下面是我要抓的数据:(我的项目名为wens)
steam.py(我的爬虫脚本)
当然也别忘了引入
至此准备工作全部完成,本文主要阐述如何将抓好的数据存入数据库,对于如何抓取数据不再赘述。
pipelines.py
别忘了在setting中注册
声明:本文使用的python交互工具为pymysql并非mysqldb,因为网上使用pymysql存入数据的相关文章较少,所以写了这篇文章供大家参考
环境:ubantu
准备工作:
items.py
将想要抓的数据累出来,下面是我要抓的数据:(我的项目名为wens)
class WensItem(scrapy.Item): # define the fields for you 4000 r item here like: # name = scrapy.Field() img_url = scrapy.Field() name = scrapy.Field() update_time = scrapy.Field() update_word = scrapy.Field() author = scrapy.Field()
steam.py(我的爬虫脚本)
当然也别忘了引入
from wens.items import WensItem
至此准备工作全部完成,本文主要阐述如何将抓好的数据存入数据库,对于如何抓取数据不再赘述。
pipelines.py
import pymysql
class writeMysql(object): def __init__(self): self.client = pymysql.connect( host='127.0.0.1', port=3306, user='root', #使用自己的用户名 passwd='123', # 使用自己的密码 db='chenguang', # 数据库名 charset='utf8' ) self.cur = self.client.cursor() def process_item(self,item,spider): # sql = 'insert into game(img_url,name,update_time,update_word,author) VALUES (%s,%s,%s,%s,%s)'%(item['img_url'],item['name'],item['update_time'],item['update_word'],item['author']) #对于上条命令感觉和下面的sql语句相同,但是就是报语法错误,如果有大神知道希望能够指出
sql = 'insert into game(img_url,name,update_time,update_word,author) VALUES (%s,%s,%s,%s,%s)' lis = (item['img_url'],item['name'],item['update_time'],item['update_word'],item['author']) self.cur.execute(sql,lis) self.client.commit() # self.cur.close() # self.client.close()
# 对于这里如果关闭的话只能能插入一条数据,也不知道应该在哪里关闭,还没有弄出来,但是不关闭也没影响 return itemsettings.py
别忘了在setting中注册
ITEM_PIPELINES = { 'wens.pipelines.writeMysql': 200, }最后建立数据库,我是用navicat(懒),创建数据库及表的方法我就不贴出来了,需要注意的是创建的字段名需要和items.py中自己定义的相同。
相关文章推荐
- Scrapy 扩展中间件: 同步/异步提交批量 item 到 MySQL
- Python MySQL安装+Scrapy爬虫将Item写入mysql数据库
- Scrapy之md5加密,多线程mysql写入,item分步处理。
- Scrapy爬数据并存储到mysql中
- python3 调用pymysql 通过ssh 链接mysql
- Python3.4使用pymysql连接MySQL
- scrapy将数据存储到mysql中
- Django(1) 2016.12.10 ubuntu安装django1.7-mysql-pymysql
- zabbix创建监控项item,触发器triger监控mysql参数特殊参数状态
- MySQL适配器PyMySQL详解
- django-mysql-pymysql 0.1
- Python中的MySQL接口:PyMySQL & MySQLdb
- Scrapy爬数据并存储到mysql中
- 关于scrapy入门级代码tutorial示例代码无法获得item的原因
- 使用pymysql在python中对mysql的增删改查操作(四)
- Scrapy系列教程(2)------Item(结构化数据存储结构)
- mysql中关于SELECT *,concat(ItemName,ProductID) as ItemName FROM `t_product`的语句最后的ItemName的值的问题解释
- python3 使用 pymysql操作mysql
- 基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL