python网络编程
2016-06-08 16:48
363 查看
刚才开始总会报找不到urlopen的错误 在网上看是因为在这个项目下游其他的.py代码影响了?? 然后就关了原来的项目重新建立了一个项目就好使了~~~我也不知道为啥~~
from urllib import urlopen
import re
webpage=urlopen('http://www.python.org') text=webpage.read() m=re.search(' <a href="([^"]+)" .*?>About</a>',text) print m.group()
这里有个问题~我输出的结果是:<a href="/about/" title="" class="">About</a> 但是在这个网页的源代码里并没有这句话啊~~~~只有一个与他相近的
呃呃呃。。。希望哪位好心人能告诉我下~~~~~~~呜呜呜~~~~~~~~~~ 言归正传 [b]通过url获取网页内容[/b]
import urllib2 response = urllib2.urlopen("http://www.baidu.com") print response.read()
构造Requset
import urllib2request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()
当url地址含有中文,或者参数有中文的时候,这个算是很正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至'/'做一下编码转换。
>>> from urllib import urlencode >>> data = { ... 'a': 'test', ... 'name': '魔兽' ... } >>> print urlencode(data) a=test&name=%C4%A7%CA%DE
相关文章推荐
- Linux实时网络监控工具:iftop
- 在qt中用tcp传输xml消息
- 网络爬虫通用策略
- http://cuiqingcai.com/993.html
- HTTP状态码大全
- Linux下smokeping网络监控环境部署记录
- TCP UDP Socket
- linux下生成https的crt和key证书
- 苹果审核ipv6-only网络
- 关于Http协议与TCP协议的一些简单理解
- 关于Http协议与TCP协议的一些简单理解
- NSURLSession POST请求HTTPBody组装时字符串中特殊字符的处理
- HTTP协议学习 – HTTP HTTP协议介绍 持续连接 HTTP消息
- c# 【MVC】WebApi通过HttpClient来调用Web Api接口
- OSI七层与TCP/IP五层网络架构详解
- OSI七层与TCP/IP五层网络架构详解
- tcpdump 抓包工具
- Tomcat生成https+ssl双向证书认证
- netstat –lnp查看监听端口(查看网络连接状况)
- android6.0SDK中删除HttpClient的相关类的解决方法