您的位置:首页 > 理论基础 > 计算机网络

HttpWebRequest GET方式提交Asp.net表单.doc COOKIE

2008-10-30 12:51 891 查看
本想做个提取某页一些数据的小程序.以前也看过些爬虫方面的知识.可这次这个网页的内容需要登录后才能提取.这下把我有点难住了.
问题:
1. 是否我在浏览器登录后在程序中访问就等于登录了呢?
于是经过测试, 失败告终!
猜想原因:可能COOKIE只与特定浏览器关联,由于我是在Console中通过代码访问页面,所以不能关联到浏览器的COOKIE

于是上网查了些关于HttpWebRequest提交表单的内容,经过很多次测试终于成功!(可能自己网络方面的基础不是太好,所以才这么费劲)

下面就介绍下http[/b]方面的一些知识吧.([/b]由自己测试整理)[/b]
一个人通过浏览器输入网址访问一个网站其实是向网站服务器发送了一个http请求.内容如下:
GET /my.html HTTP/1.1
Host: www.myweb.com
Accept: */*
User-Agent: Mozilla/4.0 (compatible; MSIE.6.0; Windows NT 5.1)
Pragma: no-cache
Cache-Control: no-cache
Connection: close[/b]
[空行]

此请求说明 通过GET方式请求服务器上的页面my.html,协议版本是1.1,黑体部分被成为http头部

当Web服务器接收到该请求时,服务器检查所请求的资源是否有效,且是否有相应的权限。如果没有问题,则服务器会传回类似如下的http响应信息:
HTTP/1.1 200 OK
Server: Microsoft-IIS/5.0
Date: Thursday, March 31, 2005 17:15:23 GMT
Content-Type: text/html
Content-Length: 88
[空行]
<html>
<head>
<title>my.html</title>
</head>
<body>
</body>
</html>



下面说下GET[/b]方式和POST[/b]方式的区别:[/b]
通过GET方式提交表单会把表单中的内容都附加到url后面,如下
get1.html?text1=dfgdf&text2=dfg&button=%CC%E1%BD%BB%B2%E9%D1%AF%C4%DA%C8%DD(button为提交按钮名)
其中不但包括各种input型元素的内容还包括提交按钮的值!

而POST方式是先发送一个http请求,而后再发送一个参数数据包(通过sniffer查看)
POST /form.html HTTP/1.1
Content-Type: application/x-www-form-urlencoded

Content-Length: 6

[空行]

text1=dfgdf&text2=dfg&button=%CC%E1%BD%BB%B2%E9%D1%AF%C4%DA%C8%DD

请注意是通过两次发送的!
而在asp.net页面中还要附加_VIEWSTATE和_EVENTVALIDATION,否则请求会失败.

总而言之[/b]:GET[/b]方式发送一个请求同时把参数传过去[/b].[/b]
POST[/b]方式是通过两次请求发送[/b],[/b]一次发送[/b]http[/b]请求[/b],[/b]一次发送参数[/b]([/b]注意发送数据时要转换为字节类型[/b])[/b]
[/b]
下面是代码[/b]:([/b]通过[/b]GET[/b]方式[/b],POST[/b]方式如述原理代码略[/b])[/b]
测试网站共有两个页[/b][/b]
1. [/b]Login.aspx [/b]登录后建立[/b]COOKIE[/b]
2. [/b]Default.aspx [/b]测试是否建立[/b]COOKIE[/b]
原理[/b]:[/b]通过程序模拟登录[/b],[/b]然后访问[/b]Default.aspx[/b]测试是否登录成功[/b]![/b]
注意点[/b]:[/b]
1. [/b]通过[/b]post[/b]发送的数据要转换为字节类型[/b][/b]
2. [/b]参数要转换为[/b]url[/b]编码[/b]([/b]只需转换自己添加的参数[/b],[/b]表单自己添加的参数不用转换[/b])[/b]
using System;[/b]
using System.Collections.Generic;[/b]
using System.Text;[/b]
using System.Net;[/b]
using System.IO;[/b]
[/b]
namespace GetTop10[/b]
{[/b]
class Program[/b]
{[/b]
static void Main(string[] args)[/b]
{[/b]
//[/b]关联[/b]COOKIE[/b]
CookieContainer cookieContainer = new CookieContainer();[/b]
[/b]
//[/b]先请求[/b] Login.aspx[/b]页并且提交[/b]POST[/b]数据[/b],[/b]模拟登录[/b][/b]
HttpWebRequest login = (HttpWebRequest)WebRequest.Create("http://localhost/Login.aspx");[/b]
[/b]
login.Method = "POST";[/b]
login.KeepAlive = false;[/b]
[/b]
//[/b]接收返回的页面[/b][/b]
HttpWebResponse responseLogin = login.GetResponse() as HttpWebResponse;[/b]
System.IO.Stream responseStream = responseLogin.GetResponseStream();[/b]
System.IO.StreamReader reader = new System.IO.StreamReader(responseStream, Encoding.UTF8);[/b]
string srcString = reader.ReadToEnd();[/b]
[/b]
// [/b]获取页面的[/b] VeiwState [/b]
string viewStateFlag = "id=/"__VIEWSTATE/" value=/"";[/b]
int i = srcString.IndexOf(viewStateFlag) + viewStateFlag.Length;[/b]
int j = srcString.IndexOf("/"", i);[/b]
string viewState = srcString.Substring(i, j - i);[/b]
[/b]
// [/b]获取页面的[/b] EventValidation [/b]
string eventValidationFlag = "id=/"__EVENTVALIDATION/" value=/"";[/b]
i = srcString.IndexOf(eventValidationFlag) + eventValidationFlag.Length;[/b]
j = srcString.IndexOf("/"", i);[/b]
string eventValidation = srcString.Substring(i, j - i);[/b]
[/b]
//[/b]转换为[/b]URL[/b]编码[/b][/b]
viewState = System.Uri.EscapeDataString(viewState);[/b]
eventValidation = System.Uri.EscapeDataString(eventValidation);[/b]
[/b]
string formatString =[/b]
"TextBox1={0}&TextBox2={1}&Button1={2}&__VIEWSTATE={3}&__EVENTVALIDATION={4}";[/b]
string postString =[/b]
string.Format(formatString, "song", "song", "[/b]登录[/b]", viewState, eventValidation);[/b]
[/b]
[/b]
[/b]
// [/b]发送的数据必须转换为字节类型[/b][/b]
byte[] postData = Encoding.ASCII.GetBytes(postString);[/b]
[/b]
// [/b]通过[/b]GET[/b]方式登录[/b][/b]
login = WebRequest.Create("http://127.0.0.1/Login.aspx?"+postString) as HttpWebRequest;[/b]
login.Method = "GET";[/b]
login.KeepAlive = false;[/b]
login.ContentType = "application/x-www-form-urlencoded";[/b]
login.CookieContainer = cookieContainer; //[/b]关联建立的[/b]COOKIE[/b]
[/b]
// [/b]接收返回的页面[/b][/b]
responseLogin = login.GetResponse() as HttpWebResponse;[/b]
responseStream = responseLogin.GetResponseStream();[/b]
reader = new System.IO.StreamReader(responseStream, Encoding.GetEncoding("utf-8"));[/b]
srcString = reader.ReadToEnd();[/b]
// [/b]访问[/b]Default.aspx[/b]页面测试是否登录成功[/b]![/b]
string URI = "http://127.0.0.1/Default.aspx";[/b]
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(URI);[/b]
req.Method = "GET";[/b]
req.KeepAlive = false;[/b]
req.CookieContainer = cookieContainer;[/b]
[/b]
// [/b]接收返回的页面[/b][/b]
HttpWebResponse res = req.GetResponse() as HttpWebResponse;[/b]
Stream rs = res.GetResponseStream();[/b]
reader = new System.IO.StreamReader(rs, Encoding.UTF8);[/b]
srcString = reader.ReadToEnd();[/b]
Console.WriteLine(cookieContainer.Count);[/b]
Console.WriteLine(srcString);[/b]
Console.ReadLine();[/b]
}[/b]
}[/b]
}[/b]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐