Python获取网页编码的两种方法——requests、chardet
2017-12-12 16:57
417 查看
运行环境:
Python3.6、
requests2.18.4
方法一:使用requests模块
In[2]: import requests In[3]: res = requests.get('http://baidu.com') In[4]: res Out[4]: <Response [200]> In[5]: res.encoding Out[5]: 'ISO-8859-1'
方法二:使用chardet模块
In[2]: import chardet In[3]: from urllib.request import urlopen In[4]: url = 'http://www.baidu.com' In[5]: html = urlopen(url).read() In[6]: print(chardet.detect(html)) {'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
相关文章推荐
- Python获取当前文件名分两种方法:__file__、sys.argv[0]
- Python 获取最长单词的两种方法
- python学习五:执行linux命令的两种方法、提高运行效率、进制转换、切片详解、ip和mac获取
- python3中获取文件当前绝对路径的两种方法
- python获取网页编码的方法
- 两种判断(抓取)网页编码的方法【python版】
- python 获取本机ip地址的两种实现方法
- 两种方法,获取磁盘剩余空间--PYTHON
- 两种判断(抓取)网页编码的方法【python版】
- python 2.7 用chardet解决爬虫获取网页编码的识别判断和转换问题
- 小结两种在Python中导入C语言扩展库的方法
- 获取python未知异常信息的方法
- android两种使用照相功能获取图片的方法
- js 获取元素下面所有li的两种方法
- Python获取当前时间的方法
- JS获取指定月份的天数两种实现方法
- 【用Python写爬虫】获取html的方法【一】:使用urllib
- 获取函数运行时间的两种方法
- 两种简单的java http请求获取页面源码的方法
- python获取外网ip地址的方法总结