【用Python写爬虫】获取html的方法【三】:使用cPAMIE
2008-06-10 09:51
1051 查看
# cPAMIE下载:http://sourceforge.net/project/showfiles.php?group_id=103662
# -*-coding: UTF-8 -*-
import cPAMIE
defgetURLContent_cPAMIE(url):
g_ie =cPAMIE.PAMIE()
g_ie.showDebugging = False
g_ie.frameName= None
g_ie.navigate(url)
content =g_ie.pageGetText()
g_ie.quit()
returncontent
url = 'http://blog.csdn.net'
content = getURLContent_cPAMIE(url)
print content
# -*-coding: UTF-8 -*-
import cPAMIE
defgetURLContent_cPAMIE(url):
g_ie =cPAMIE.PAMIE()
g_ie.showDebugging = False
g_ie.frameName= None
g_ie.navigate(url)
content =g_ie.pageGetText()
g_ie.quit()
returncontent
url = 'http://blog.csdn.net'
content = getURLContent_cPAMIE(url)
print content
相关文章推荐
- 【用Python写爬虫】获取html的方法【四】:使用urllib下载文件
- 【用Python写爬虫】获取html的方法【一】:使用urllib
- 【用Python写爬虫】获取html的方法【一】:使用urllib
- 【用Python写爬虫】获取html的方法【二】:使用pycurl
- [python爬虫]获取html中文乱码时的方法
- 【用Python写爬虫】获取html的方法【五】:利用Twisted框架之client.getPage
- 使用 Python 获取两个列表的交集、并集、差集的常用方法
- python爬虫:BeautifulSoup 使用select方法的使用
- python解析html开发库pyquery使用方法
- HTML中使用python屏蔽一些基本功能的方法
- Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
- linux平台使用Python制作BT种子并获取BT种子信息的方法
- python爬虫神器PyQuery的使用方法
- python 方法无法在线程中使用(附python获取网络流量)
- 使用python 获取进程pid号的方法
- 使用Python获取并处理IP的类型及格式方法
- Python爬虫包 BeautifulSoup 学习(十) 各种html解析器的比较及使用
- 【Python3.6爬虫学习记录】(六)urllib详细使用方法(header,代理,超时,认证,异常处理)
- Python获取网页指定内容(BeautifulSoup工具的使用方法)