解决Red Hat / CentOS 下nokogiri抓取网页只返回注释的问题
2013-04-12 14:26
423 查看
原因是系统默认安装的libxml 2.6.26已经过时了,需要安装新的版本
$ sudo yum remove -y libxml2-devel libxslt-devel
从ftp://xmlsoft.org/libxml2/下载最新的libxml2和libxslt
比如libxml2-2.9.0.tar.gz和libxslt-1.1.28.tar.gz
依次安装libxml2和libxslt
$ ./configure ; make ; sudo make install
重新安装nokogiri,就可以解决问题
$ sudo gem install nokogiri --with-xml2-lib=/usr/local/lib --with-xml2-include=/usr/local/include/libxml2 --with-xslt-lib=/usr/local/lib --with-xslt-include=/usr/local/include
参考
http://nokogiri.org/tutorials/installing_nokogiri.html
https://github.com/sparklemotion/nokogiri/issues/122
$ sudo yum remove -y libxml2-devel libxslt-devel
从ftp://xmlsoft.org/libxml2/下载最新的libxml2和libxslt
比如libxml2-2.9.0.tar.gz和libxslt-1.1.28.tar.gz
依次安装libxml2和libxslt
$ ./configure ; make ; sudo make install
重新安装nokogiri,就可以解决问题
$ sudo gem install nokogiri --with-xml2-lib=/usr/local/lib --with-xml2-include=/usr/local/include/libxml2 --with-xslt-lib=/usr/local/lib --with-xslt-include=/usr/local/include
参考
http://nokogiri.org/tutorials/installing_nokogiri.html
https://github.com/sparklemotion/nokogiri/issues/122
相关文章推荐
- 解决在火狐中注释内容被显示在网页上的问题
- Android使用WebView嵌入网页,网页内点击跳转到另一个网页后,返回问题解决
- PHP中使用file_get_contents抓取网页中文乱码问题解决方法
- Java、C#双语版HttpHelper类(解决网页抓取乱码问题)
- Posts Tagged ‘This system is not registered to Red Hat Subscription Management. You can use subscription-manager to register问题的解决办法
- java抓取网页保存的乱码问题解决
- Python+Requests安装及抓取网页源码中文乱码问题的解决
- Java抓取网页乱码问题解决
- 安装Red Hat Linux 9.0,所遇错误问题的解决方法
- 学习小红帽(Red Hat Enterprise Linux 5) 解决了一些问题后感悟
- 解决网页重定向带来的无法返回的问题
- Java、C#双语版HttpHelper类(解决网页抓取乱码问题)
- 解决Webbrowser定时抓取网页数据时,内存累积不释放的问题
- 安装Red Hat Linux 9.0,所遇错误问题的解决方法
- 抓取网页中的内容、如何解决乱码问题、如何解决登录问题以及对所采集的数据进行处理显示的过程
- Red Hat Enterprise Linux 5 (RHEL5)中物理网卡被peth0占用无法联网的问题解决方法
- 解决PHP中file_get_contents抓取网页中文乱码问题
- 解决苹果手机里面的网页返回不刷新页面的问题
- 关于webview加载网页,返回后总是刷新页面问题解决
- python 解决抓取网页中的中文显示乱码问题