9 个鲜为人知的 Python 数据科学库 | Linux 中国
2018-12-09 12:35
1161 查看
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/F8qG7f9YD02Pe/article/details/84948823
除了 pandas、scikit-learn 和 matplotlib,还要学习一些用 Python 进行数据科学的新技巧。-- Parul Pandey
有用的原文链接请访问文末的“原文链接”获得可点击的文内链接、全尺寸原图和相关文章。致谢编译自 |
https://opensource.com/article/18/11/python-libraries-data-science
作者 | Parul Pandey
译者 | heguangzhi 🌟🌟共计翻译:8.0 篇 贡献时间:89 天
有用的原文链接请访问文末的“原文链接”获得可点击的文内链接、全尺寸原图和相关文章。致谢编译自 |
https://opensource.com/article/18/11/python-libraries-data-science
作者 | Parul Pandey
译者 | heguangzhi 🌟🌟共计翻译:8.0 篇 贡献时间:89 天
除了 pandas、scikit-learn 和 matplotlib,还要学习一些用 Python 进行数据科学的新技巧。
Python 是一种令人惊叹的语言。事实上,它是世界上增长最快的编程语言之一。它一次又一次地证明了它在各个行业的开发者和数据科学者中的作用。Python 及其库的整个生态系统使其成为全世界用户的恰当选择,无论是初学者还是高级用户。它成功和受欢迎的原因之一是它的一组强大的库,使它如此动态和快速。在本文中,我们将看到 Python 库中的一些数据科学工具,而不是那些常用的工具,如 pandas、scikit-learn 和 matplotlib。虽然像 pandas、scikit-learn 这样的库是机器学习中最常想到的,但是了解这个领域的其他 Python 库也是非常有帮助的。Wget提取数据,尤其是从网络中提取数据,是数据科学家的重要任务之一。Wget[1] 是一个免费的工具,用于从网络上非交互式下载文件。它支持 HTTP、HTTPS 和 FTP 协议,以及通过 HTTP 代理进行访问。因为它是非交互式的,所以即使用户没有登录,它也可以在后台工作。所以下次你想下载一个网站或者网页上的所有图片,wget 会提供帮助。安装:
- [p]
$ pip install wget
import wget
url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'
filename = wget.download(url)
100% [................................................] 3841532 / 3841532
filename
'razorback.mp3'
$ pip install pendulum
import pendulum
dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto')
dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver')
print(dt_vancouver.diff(dt_toronto).in_hours())
3
pip install -U imbalanced-learn
# or
conda install -c conda-forge imbalanced-learn
$ pip install flashtext
from flashtext import KeywordProcessor
keyword_processor = KeywordProcessor()
# keyword_processor.add_keyword(<unclean name>, <standardised name>)
keyword_processor.add_keyword('Big Apple', 'New York')
keyword_processor.add_keyword('Bay Area')
keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.')
keywords_found
['New York', 'Bay Area']
keyword_processor.add_keyword('New Delhi', 'NCR region')
new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.')
new_sentence
'I love New York and NCR region.'
$ pip install fuzzywuzzy
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
# 简单的匹配率
fuzz.ratio("this is a test", "this is a test!")
97
# 部分的匹配率
fuzz.partial_ratio("this is a test", "this is a test!")
100
pip install pyflux
Using pip
$ pip install ipyvolume
Conda/Anaconda
$ conda install -c conda-forge ipyvolume
pip install dash==0.29.0 # The core dash backend
pip install dash-html-components==0.13.2 # HTML components
pip install dash-core-components==0.36.0 # Supercharged components
pip install dash-table==3.1.3 # Interactive DataTable component (new!)
pip install gym
via: https://opensource.com/article/18/11/python-libraries-data-science作者:Parul Pandey[25] 选题:lujun9972 译者:heguangzhi 校对:wxy本文由 LCTT 原创编译,Linux中国 荣誉推出
相关文章推荐
- 9 个鲜为人知的 Python 数据科学库
- Python正在取代R,成为数据科学界新宠
- Python3获取股票行情数据(中国个股/中国指数/全球指数)
- 非常全面到位的介绍与源代码地址 :Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- Python正在取代R 成为数据科学界新宠
- Python进行数据科学工作的简单入门教程
- Python数据科学安装Numby,pandas,scipy,matpotlib等(IPython安装pandas)
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- python 科学计算学习一:numpy快速处理数据(1)
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- 使用python scrapy爬虫框架 爬取科学网自然科学基金数据
- 数据科学界华山论剑:R与Python巅峰对决
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器库
- 深入对比数据科学工具箱:Python和R 非结构化数据的结构化
- 数据科学的完整学习路径—Python版
- python 科学计算学习一:numpy快速处理数据(2)
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- 数据科学的完整学习路径—Python版
- python的数据科学资源