如何从word开始处理html文件?以及windows上安装python lxml beautifulsoup
2016-02-01 14:05
781 查看
我的处理路径:
word->html(用ueditor.baidu.com)
html->beautifulsoup
美丽的汤是用来做html解析用的,使用了lxml(这个处理中文会好些)。
在windows下处理吧,不要linux倒来倒去的(中文文档表示受不了)
肿么办?
pip安装参考下面,
lxml安装使用
https://pypi.python.org/pypi/lxml/3.5.0#downloads
的安装包完成,但是注意,这个只支持到python3.2
问题处理:
lxml安装需要,主要需要预先安装vs2010,否则会叫
error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).
装了vs2010发现不行,使用
easy_install lxml
按道理都应该成功,结果这两个都报告失败。
失败原因是找不到依赖(libxml2?FIXME)
参考:
1 http://www.tuicool.com/articles/eiM3Er3
介绍如何pip install ..
2 介绍如何使用easy_install
http://blog.csdn.net/zhaokuo719/article/details/8209496
word->html(用ueditor.baidu.com)
html->beautifulsoup
美丽的汤是用来做html解析用的,使用了lxml(这个处理中文会好些)。
在windows下处理吧,不要linux倒来倒去的(中文文档表示受不了)
肿么办?
pip安装参考下面,
lxml安装使用
https://pypi.python.org/pypi/lxml/3.5.0#downloads
的安装包完成,但是注意,这个只支持到python3.2
问题处理:
lxml安装需要,主要需要预先安装vs2010,否则会叫
error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).
装了vs2010发现不行,使用
easy_install lxml
按道理都应该成功,结果这两个都报告失败。
失败原因是找不到依赖(libxml2?FIXME)
参考:
1 http://www.tuicool.com/articles/eiM3Er3
介绍如何pip install ..
2 介绍如何使用easy_install
http://blog.csdn.net/zhaokuo719/article/details/8209496
相关文章推荐
- [Python] 工作日查询脚本
- nao机器人国际比赛程序 python编写
- Python与二维码
- Python与二维码
- Python 练手程序合集(三)
- Python一些技巧
- Python Flask框架
- 2015年10个Pythoner必须了解的Python库
- python:open文件操作
- Python第一讲从安装到入门
- python 模块(module)基础讲解
- Json概述以及python对json的相关操作
- 工作思考+ python 筛选删了你的朋友代码
- python中的实例方法、静态方法、类方法、类变量和实例变量浅析
- python sys模块
- How to uninstall Python 2.7 (installed by yourself) on a Mac OS
- Python面试题总结
- python 命令行参数
- python selenium--常用函数3
- python selenium--常用函数1