您的位置:首页 > 运维架构 > Linux

解决Red Hat / CentOS 下nokogiri抓取网页只返回注释的问题

2013-04-12 14:26 423 查看
原因是系统默认安装的libxml 2.6.26已经过时了,需要安装新的版本

$ sudo yum remove -y libxml2-devel libxslt-devel

从ftp://xmlsoft.org/libxml2/下载最新的libxml2和libxslt

比如libxml2-2.9.0.tar.gz和libxslt-1.1.28.tar.gz

依次安装libxml2和libxslt

$ ./configure ; make ; sudo make install

重新安装nokogiri,就可以解决问题

$ sudo gem install nokogiri --with-xml2-lib=/usr/local/lib --with-xml2-include=/usr/local/include/libxml2 --with-xslt-lib=/usr/local/lib --with-xslt-include=/usr/local/include

参考

http://nokogiri.org/tutorials/installing_nokogiri.html

https://github.com/sparklemotion/nokogiri/issues/122
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: