您的位置:首页 > 理论基础 > 计算机网络

读取网页内容学习-初步

2014-11-13 16:53 176 查看
对于像我这样习惯于照葫芦画瓢的人来说,独立自主开始一件新东西,实在是一件极其困难的事情,最近非常想从网页上爬些东西,像无头苍蝇一样折腾了好几天,收获甚微,今天先记录下使用httpclient的一顿折腾。

1. 从QQ空间中听说这是个好东西,于是在谷歌里面搜,搜到一些好心人的博客就贴到Eclipse里面,初步感觉了一下Java编程;这中间自然要下载一些包比如commons-codec-XXX.jar,commons-logging-XXX.jar,commons-httpclient-XXX.jar等。其中XXX代表版本号,本人折腾过许多个版本。

2. 然后这篇博客 http://you-java.iteye.com/blog/1457440, 不得不说哥们真是个好人,这个东西比较接近我的目标了。于是贴代码。但是问题来了,好多个提示,代码中多个类都不能识别。于是上QQ群问,一个热心的哥们给我远程协助,上来一看说版本号太低了,二话不说换完版本号,对着红叉叉点击几下,说好了 剩下让我自己整。我整不了啊 那些个标识符根本不晓得该import哪个类。哥们说我水平太低了
木有java基础 要我看看打好基础 再做爬虫。可是我是业余用 哪有那么多时间,我不需要太懂,弄个能用的就行啦。哥们说如果是业余的 可以花钱找人帮我下载数据。哎。找人整哪有自己方便 想何时用都能爬出来。哥们您先给俺希望 再把俺打入十八层地狱吗。

3.于是接下来一个晚上 加上一个上午都在整这个版本号,试了许多版本都无法搞定。查了许多博客都过于简单 就是get post应用之类的,好多都不写什么版本,甚至连import了什么类也不写,忙乎半天无果。然后查网页编程教学视频,前奏都太多,没法很快定位到想要的东西。苦恼中。

4.中午回宿舍睡了个觉,放松下来寻思了一下,认为在文件夹中搜所这些不能被认识到的 标志 或许有所突破。于是下载了httpclient4.4(最新版),.zip解压后竟然有这么多个包



把每个.jar文件都解压了一下,形成若干个文件夹,然后在文件夹中搜 那些 不能被识别的标志,果然发现许多根本不是在httpclient包下的,而是在httpcore包下面的.

因此把上述所有10个包全部载入了工程,按照这个办法把所有不能被识别的标志所在的类都找到了  然后import进入自定义类所在的文件。果然解决了大部分红叉叉问题。

 

另外解决问题:DefaultHttpClient is deprecated,http://www.yeetrack.com/?p=760

                      httpClient.getConnectionManager() is deprecated - what should be used instead?

http://stackoverflow.com/questions/22564956/httpclient-getconnectionmanager-is-deprecated-what-should-be-used-instead-if

 

另外还有Eclipse中导入外部库的办法,等等||

 

总结:做事情要找方法,不能蛮干

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  HttpClient eclipse java