您的位置:首页 > 编程语言 > PHP开发

使用matplotlib.pyplot + xlrd + pandas使租房价格面积数据关系可视化

2017-04-09 17:00 211 查看
最近本想接触pandas,然而我发现自己在数据可视化方面能力的欠缺的,所以我要恶补这方面的知识才能继续学习更深入的数据分析知识。

而matplotlib是个强大的工具,大家可以参考http://matplotlib.org 这个网站学习,又或者是这个https://www.pythonprogramming.net里面是一个有才华的pyhton程序员提供了非常多免费的学习视频,而且涉及面非常广泛,值得大家一看。

import requests
import matplotlib.pyplot as plt
import xlrd
import pandas
res = requests.get(r'https://rent.591.com.tw/home/search/rsList?is_new_list=1&type=1&kind=0&searchtype=1®ion=1')
df = pandas.DataFrame(res.json()['data']['data'])
df.to_excel('house.xlsx')
myBook = xlrd.open_workbook('house.xlsx')
myShreet = myBook.sheet_by_index(0)
area = myShreet.col(12)
area.pop(0)
price = myShreet.col(65)
price.pop(0)
x = [int(i.value) for i in area]
y = []
for i in price:
i=i.value
i = float(''.join(i.split(',')))
print(i)
y.append(i)
plt.xlabel('Area')
plt.ylabel('Price')
plt.title('The relationgship bretween area and price\n Data from https://rent.591.com.tw') plt.scatter(x, y)
plt.show()迫不及待地想要展示一下成果:
图片一


图片二



第一张图是可视化的结果,第二张图是收集的网址数据然后利用pandas这个方便的工具整理成excel文件。

可以发挥的空间有很多,比如样本不够多(我只下载了一页),还有怎么呈现数据,怎么吸引人都是我值得思考的。

继续学习。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: