赶集网租房房价爬取和Python本地服务器部署
2017-11-04 20:21
821 查看
最近写了一个赶集网租房房价数据爬取的爬虫,调用高德API实现房屋地理位置显示,房屋与工作地之间的便捷出行路线查询。在百度网盘链接: https://pan.baidu.com/s/1qYDjUGW 密码: c8q7
(2)在浏览器中打开index-cq.html,网址改为:http://localhost:8000/index-cq.html。index-cq.html为在网上找到的调用高德API的文件,主要是利用高德地图的地理编码,返回房屋地址对应的地理坐标,并以图标的形式显示在地图中。选择工作地,加载租房信息文件price600.csv。如果文件加载不成功,需要修改浏览器快捷方式的属性,在目标’….exe’后面添加” –allow-file-access-from-files”, 注意–allow前面有个空格。
(3)点击蓝色标记,可以查看房屋信息原始网址,最短路径查询
1.赶集网租房房价爬虫
赶集网上的租房信息主要爬取房源标题、地址、价格、网页地址。每一条租房信息都存储在class为“f-list-item ershoufang-list”的div中,具有相同的格式和标签。所以租房房价爬虫先从网页中提取所有的租房信息条数,再逐条读取详细的租房信息。# 获取所有租房信息列表 house_list = html.select(".f-list > .f-list-item > .f-list-item-wrap")
# 逐条租房信息爬取 house_title = house.select(".title > a")[0].string.encode("utf8") # 房源标题 house_addr = house.select(".address > .area > a")[-1].string.encode("utf8") # 房源地址 house_price = house.select(".info > .price > .num")[0].string.encode("utf8") # 价格 house_url = urljoin(ADDR, house.select(".title > a")[0]["href"]) # 房源网页地址
2.Python在本地部署小型服务器
(1) 在命令栏中切换文件目录,cd至index-cq.html所在文件夹,在命令栏开启SimpleHTTPServerpython –m SimpleHTTPServer 8000
(2)在浏览器中打开index-cq.html,网址改为:http://localhost:8000/index-cq.html。index-cq.html为在网上找到的调用高德API的文件,主要是利用高德地图的地理编码,返回房屋地址对应的地理坐标,并以图标的形式显示在地图中。选择工作地,加载租房信息文件price600.csv。如果文件加载不成功,需要修改浏览器快捷方式的属性,在目标’….exe’后面添加” –allow-file-access-from-files”, 注意–allow前面有个空格。
(3)点击蓝色标记,可以查看房屋信息原始网址,最短路径查询
相关文章推荐
- 我的第一个python web开发框架(7)——本地部署前端访问服务器
- 我的第一个python web开发框架本地部署前端访问服务器
- Rap部署本地服务器
- [CentOS Python系列] 五.阿里云部署web环境及通过IP地址访问服务器网页
- Windows上Python3.6环境django部署到Apache服务器
- python监听本地目录,并将目录下的文件同步到远端服务器
- python服务器环境搭建(1)——本地服务器准备
- 部署失败:本地 SharePoint 服务器不可用解决
- DB2 PC服务器本地磁盘集群部署模式简介
- .NET MVC4 本地正常 部署 服务器错误
- Python爬虫--爬取赶集网的租房信息
- NETGEAR WNDR3800 刷机支持ipv6 部署本地git服务器
- python-django 阿里云ECS服务器部署uwsgi+nginx过程解说
- 本地项目部署到服务器并且访问的地址设置成指定的域名访问端口是80
- django项目部署-python服务器搭建
- Cookie问题,本地服务器无问题,部署到SAE后未能获取cookie信息
- ngrok的使用和在(window)本地部署微信服务器
- 百度编辑器本地上传图片可以正常显示,部署到服务器上就显示不出来只显示图片的名字
- python3 - 通过python开启本地服务器,并访问
- Maven发布本地jar包及部署到远程服务器