四种方法下载网络文本数据到本地内存
2016-01-12 01:31
316 查看
import urllib.request import requests from io import StringIO import numpy as np import pandas as pd ''' 下载网络文件,并导入CSV文件作为numpy的矩阵 ''' # 网络数据文件地址 url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data" # 方法一 # ======================================================== # 下载文件 #r = urllib.request.urlopen(url) # 导入CSV文件作为numpy的矩阵 #dataset = np.loadtxt(r, delimiter=",") # 方法二 # ======================================================== # 下载文件 #r = requests.get(url) # 导入CSV文件作为numpy的矩阵 #dataset = np.loadtxt(StringIO(r.text), delimiter=",") # 此处用到 StringIO !!!!!! # 方法三 # ======================================================== #用genfromtxt直接下载网络文件,并将CSV文件导作numpy矩阵。爽!!!!!!!! #dataset = np.genfromtxt(url, delimiter=",") # 方法四 # ======================================================== # 用pandas.read_csv直接下载网络文件,并将CSV文件导作pandas.DataFrame。 # dataset = pd.read_csv('http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv', index_col=0) dataset = pd.read_csv(url) # ======================================================== # separate the data from the target attributes X = dataset[:,0:7] y = dataset[:,8] print(X) #print(y)
相关文章推荐
- 使用ImageLoader第三方框架,加载网络图片
- IOS网络Socke(客户端,服务器端)t的简单介绍
- 2MSL TCP三次握手连接与四次握手关闭过程
- 网络基础
- 从http开始说Volley缓存
- 陕西高校试点在线授课 学生可跨校选修学分
- 优化网站的方法1-减少HTTP 请求
- 什么是网络分销?
- tcpdump
- HTTPS研究(1)—https协议入门
- 网络舆情分析师
- slf4j的个人学习--转载自http://www.cnblogs.com/xing901022/p/4149524.html
- HttpClient4.3 关于https 中SSL证书请求问题
- python网络编程(定时器)
- Neural Networks and Deep Learning学习笔记ch3 - 改进神经网络的学习方法
- 网络子系统的调优
- [Python]网络爬虫(六):一个简单的百度贴吧的小爬虫
- TCP/IP子系统的调优
- 关于HTTP1.1的长连接
- 关于vPC的link故障以及最佳实践