您的位置:首页 > 编程语言 > Python开发

Python开发:正则表达式获得URL

2013-04-21 16:35 375 查看
用正则表达式获得a标签中的链接地址

import urllib2

from BeautifulSoup import BeautifulSoup

import re

fp = urllib2.urlopen('http://www.baidu.com')

soup = BeautifulSoup(fp)

p=re.compile(r'<a.*?href=["\'](.*?)["\']+')

for m in re.findall(p,str(soup)):

print m,'\n'
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: