爬虫怎么去除抓取数据中的'\xa0\xa0\xa0\xa'
2018-03-26 12:18
239 查看
字符串去空格问题
起因:爬58同城网时,抓取一组数据时,出现'1室1厅1卫 \xa0\xa0\xa0\xa038㎡'
尝试用.stripped_strings#不能去掉
尝试用strip()#不能去掉
尝试用replace()#不能去掉
....
解决方法:
>>> s ='1室1厅1卫 \xa0\xa0\xa0\xa038㎡'
>>> "".join(s.split())
'1室1厅1卫38㎡'
>>>
起因:爬58同城网时,抓取一组数据时,出现'1室1厅1卫 \xa0\xa0\xa0\xa038㎡'
尝试用.stripped_strings#不能去掉
尝试用strip()#不能去掉
尝试用replace()#不能去掉
....
解决方法:
>>> s ='1室1厅1卫 \xa0\xa0\xa0\xa038㎡'
>>> "".join(s.split())
'1室1厅1卫38㎡'
>>>
相关文章推荐
- 爬虫实战--抓取糗事百科前10页数据
- [置顶] 【R语言爬虫】R语言提交get请求抓取城城理财数据
- 新浪微博数据挖掘食谱之十五: 爬虫篇 (抓取用户的朋友)
- Jsoup实现网络爬虫抓取数据
- java爬虫抓取数据,存储为excel文件
- python爬虫---post抓取查询数据简单说明
- C#抓取网页数据、分析并且去除HTML标签
- 爬虫 抓取数据后 显示到前台页面,jsoup包,ajax,设置一个返回ResponseResult结果集
- 【php网页爬虫】php抓取网页数据
- python淘宝爬虫基于requests抓取淘宝商品数据
- Node.js爬虫数据抓取乱码问题总结
- nodejs爬虫抓取数据乱码问题总结
- Python爬虫抓取动态数据
- Scrapy爬虫入门系列3 将抓取到的数据存入数据库与验证数据有效性
- 简单的PHP爬虫抓取百度贴吧用户数据
- Python爬虫框架Scrapy实战之抓取户外数据
- Python爬虫(7):多进程抓取拉钩网十万数据
- C# 爬虫,抓取网页数据
- Node.js学习之网络爬虫(使用cheerio抓取网页数据)
- [Python爬虫] 之十八:Selenium +phantomjs 利用 pyquery抓取电视之家网数据