java爬虫程序放到linux云服务器上执行
2017-06-03 11:41
162 查看
为了防止自己忘记,就写了下来。
首先建立了java项目文件后,将jsoup包复制到项目中,然后右键将其添加到项目中,
![](https://img-blog.csdn.net/20170603114646966?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
我们现在抓取今日头条的12377的电话号码,右键审查元素,发现举报电话使用的是class="tel",查看源码,发现tel对应的class只有一项,
![](https://img-blog.csdn.net/20170603114717264?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
这里只有一个Element,因此代码如下:
Document document = Jsoup.connect(url).get();
Element element = document.getElementsByClass("tel").first();
不能使用https,不然会异常。应使用网址:http://www.toutiao.com/
异常代码Caused by: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
javax.net.ssl.SSLHandshakeException: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
运行截图:
![](https://img-blog.csdn.net/20170603114753795?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
将改程序打包成可执行的jar文件,右键export
![](https://img-blog.csdn.net/20170603114826561?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20170603114815859?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20170603114836999?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
点击ok,这样可执行的jar包就导出来了。
使用winscp与服务器建立连接,并复制到jar到项目中
![](https://img-blog.csdn.net/20170603114927827?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20170603114951484?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
登陆腾讯云,输入账号密码后
执行java –jar Crawler.jar (最后这里默认的是在root的根目录下,如果放在root/java/Crawler.jar,则是java/Crawler.jar)
这里出现了中文乱码问题。再设置下就好
![](https://img-blog.csdn.net/20170603115053234?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20170603115109703?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGluZmVuZzE5OTM=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
参考:linux下执行jar,
Winscp的使用:
首先建立了java项目文件后,将jsoup包复制到项目中,然后右键将其添加到项目中,
我们现在抓取今日头条的12377的电话号码,右键审查元素,发现举报电话使用的是class="tel",查看源码,发现tel对应的class只有一项,
这里只有一个Element,因此代码如下:
Document document = Jsoup.connect(url).get();
Element element = document.getElementsByClass("tel").first();
不能使用https,不然会异常。应使用网址:http://www.toutiao.com/
异常代码Caused by: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
javax.net.ssl.SSLHandshakeException: java.security.cert.CertificateException: No subject alternative DNS name matching www.toutiao.com found.
运行截图:
将改程序打包成可执行的jar文件,右键export
点击ok,这样可执行的jar包就导出来了。
使用winscp与服务器建立连接,并复制到jar到项目中
登陆腾讯云,输入账号密码后
执行java –jar Crawler.jar (最后这里默认的是在root的根目录下,如果放在root/java/Crawler.jar,则是java/Crawler.jar)
这里出现了中文乱码问题。再设置下就好
参考:linux下执行jar,
Winscp的使用:
相关文章推荐
- linux下使用cron每天定时执行java程序
- Linux下cron定时执行Java程序
- linux下执行java程序的sh脚本分享
- Linux下执行Java服务程序
- 关于在linux下用java程序执行linux命令的权限问题
- 使用linux的cron进程定时执行java程序
- linux将程序放到后台执行
- linux定时执行java程序
- Andorid利用sserver/runtime实现java执行linux程序或脚本
- linux将程序放到后台执行
- 获取Linux执行命令后的PID--管理部署在服务器的Java程序
- Linux 下独立执行Java程序
- linux将程序放到后台执行
- linux下crontab定时执行java程序,java程序不执行的问题
- linux 使用 java 程序执行 shell命令
- Java程序放到Linux上出现的问题
- linux执行java程序
- Linux(Red Hat5)下使用crontab定时执行java程序
- Java程序执行Linux命令(JSP运行其他程序)
- java执行linux 程序