Python3--批量爬取数据之错误回顾
2018-03-28 22:32
501 查看
在这里罗列一下在之前爬取过程中遇到的一些问题:
一、csv文件的处理问题: 1.改变文件的编码格式:csv文件用office2013打开会出现乱码,需要调整文件的编码格式然后保存。具体的做法:用记事本打开csv文件 --> 另存为 --> 在跳出的操作台中选择合适的编码格式保存 --> 重新打开csv文件即可正常显示。
2.csv文件的分隔符设置问题:这个自己是在网上百度的教程,改变电脑系统的一个默认分隔属性。
二、爬取到的文件出现乱码问题: 1.乱码原因不详,初步猜测的由于编码问题。乱码种类多样,乱码之一为转义字符问题,转义字符对照表(http://tool.oschina.net/commons?type=2)
一、csv文件的处理问题: 1.改变文件的编码格式:csv文件用office2013打开会出现乱码,需要调整文件的编码格式然后保存。具体的做法:用记事本打开csv文件 --> 另存为 --> 在跳出的操作台中选择合适的编码格式保存 --> 重新打开csv文件即可正常显示。
2.csv文件的分隔符设置问题:这个自己是在网上百度的教程,改变电脑系统的一个默认分隔属性。
二、爬取到的文件出现乱码问题: 1.乱码原因不详,初步猜测的由于编码问题。乱码种类多样,乱码之一为转义字符问题,转义字符对照表(http://tool.oschina.net/commons?type=2)
相关文章推荐
- python 批量爬取博客数据(仅供学习)
- python前情回顾,数据类型重点特性
- python 使用 mysqldb 批量插入数据
- 使用python向Redis批量导入数据
- Python 文件数据批量录入数据库(MongoDB)
- python消费kafka数据批量插入到es
- Python从数据库读取大量数据批量写入文件
- python mysql插入数据遇到的错误
- python3爬取指定百度贴吧页面并保存成本地文档(批量爬取贴吧页面数据)
- python批量导入数据进Elasticsearch的实例
- Selenium遇到的问题8 python利用xlwt模块操作xls数据显示IO错误(Python中正反斜杠的用法)
- 利用Python调用ECMWF欧洲中心API批量下载数据
- 一个python批量给mongodb添加数据例子
- Python3回顾数据类型,迭代器
- 使用python,批量导入数据到elasticsearch中
- 批量更新数据引起 DataGrid 的绘制错误及解决方法
- 使用python中的urlretrieve下批量下载数据
- mysql-python中文数据错误
- 利用 python 对文件夹下图片数据进行批量改名
- MySQL 数据批量恢复时 [Err] 2006 - MySQL server has gone away 错误的解决