scrapy保存为csv文件 再将csv导入excel方法,及导入excel时出错:"自文本导入 包含的数据无法放置在一个工作表中"的坑
2018-07-11 18:20
751 查看
今天从拉勾网爬取职位信息准备作数据分析,因为想用Excel做数据可视化,遂决定将爬取信息保存为csv文件,再导入excel中。
scrapy 自带的 exporters 类下的方法 CsvItemExporter 可以用来保存Item数据为csv文件。
scrapy.exporters.
CsvItemExporter使用方法参看官方文档: Item Exporters
完了之后新建Excel文档,数据——>获取外部数据下的 自文本——>选上csv文件——>三步设置
如果爬取的信息里有'context'文本,第二步文本识别符选上'',会将''里的内容当作整体不分割。
正常情况下来导入excel文件就成功了。
而我喜闻乐见的出现了下面的错误: 此文本文件包含的数据无法放置在一个工作表中
我总共不到1500行信息啊,只导入了一个表头。
发生这种情况原因是:爬取保存的csv文件中含有大量的无用换行符(具体原因我也不知道,如你知道,请不吝赐教)
而这种换行符在我用txt、editplus查看时均看不出来,最后用sublime打开时才看出:
可以看到同一个文本上面存在大量空行,而下面文本则正常,复制下面部分文档做导入测试正常可说明这点。
最后利用ctrl+H 替换掉多余换行符,再导入到Excel中,一切正常。
一个坑让我装了三个版本的office,耗了我两个多小时,希望对你有所帮助,over!
阅读更多相关文章推荐
- 此文本文件包含的数据无法放置在一个工作表中 gb2312
- 此文本文件包含的数据无法放置在一个工作表中 gb2312
- 此文本文件包含的数据无法放在一个工作表中
- 基于yaf框架和uploadify插件,做的一个导入excel文件,查看并保存数据的功能
- Excel导入数据到Sql server 中出错:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”
- Excel导入数据到Sql server 中出错:“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”
- C#导出数据到CSV和EXCEL文件时数字文本被转义的解决方法
- C#导出数据到CSV和EXCEL文件时数字文本被转义的解决方法
- 基于yaf框架和uploadify插件,做的一个导入excel文件,查看并保存数据的功能
- asp.net 解决使用OLEDB导入excel数据时同时包含文本和数字的列无法正常读取情况
- SQL Server 2005 中导入Excel文件出错的解决方法
- 用C#编程从数据库中读取图片数据导进Excel文件的方法(如何从数据库中读取保存的文件,直接打开,中间不保存到本地)
- Excel 导入 Sql Server出错——“文本被截断,或者一个或多个字符在目标代码页中没有匹配项”错误的解决
- SQL : 一个存储过程,用于向指定的MS SQL Table中导入CSV 格式的文件数据
- 把Excel文件数据导入数据库,支持多工作表
- 将大量有规律txt文本数据转换成xml格式,在导入excel,生成excel文件,在导入spass中,对数据进行分析
- 导出数据到CSV和EXCEL文件,过长的数值被转义的解决方法
- office2007 打开Excel 提示 工作表中的公式包含一个或多个无效引用的解决方法
- 将Control List中的数据导入类Excel的表格中,(使用了.csv文件)
- MyEclipse中js文件包含中文时保存出错的解决方法