您的位置:首页 > 编程语言 > Python开发

Python下pandas随机获取DataFrame中的数据

2018-07-05 17:53 239 查看

当DataFrame中有n行m列数据,而我需要随机从中选取一部分时,可以使用DataFrame中的sample方法,进行随机选取

DataFrame.sample(n=None, frac=None, replace=False,  weights=None, random_state=None, axis=None)

n:表示你要随机抽取几行数据,比如你要抽取10行,n=10。不能与frac同时使用

frac:浮点型,可选。表示抽取数据的百分比,当不确定n的具体值的时候使用。不能与n同时使用

replace:布尔值,可选。原来的DataFrame是否被抽取的数据替换,默认为False.如果n取值大于原DataFrame的长度,                         replace为True,可返回结果。否则会因dataFrame长度不够而报错。

weights:权重,字符串或者数组格式,可选。通过设置不同的权重可以增加相应数据被选中的概率。

random_state:随机种子数

axis: 整数型或字符串,可选。可以是表示轴向的数据(0,1)或名称。当抽取数据的时候是从行中抽取数据,还是从列中抽取数          据。0表示纵向坐标轴,1表示横向坐标轴。





阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: