用java从网络上抓取HTML文件内容并写入本地文本中
2013-08-10 21:19
399 查看
原文地址:http://blog.csdn.net/java05/article/details/4001566
[java] view
plaincopy
package Tech;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URI;
import java.net.URISyntaxException;
import java.net.URL;
public class GetHtmlFile {
/**
* @param args
* @throws IOException
* @throws URISyntaxException
*/
public static void main(String[] args) throws IOException, URISyntaxException {
// TODO Auto-generated method stub
URL url= new URL("http://www.163.com");
InputStream is = url.openStream();
//OutputStream ois= url.openConnection().getOutputStream();
File file = new File(new URI("file:/c:/g3.txt"));
FileOutputStream fos = new FileOutputStream(file);
BufferedOutputStream bos = new BufferedOutputStream(fos);
int ch;
while((ch=is.read())!=-1)
{
bos.write(ch);
bos.flush();
//System.out.print((char)ch);
}
}
}
代码都是些基础代码,不过那个本地File的URI的创建搞了我很长时间,在网上也没搜到啥··
先后试过:
new URI("file://C://g.txt")
Exception:Illegal character in authority
new URI("file://C:/g.txt")
Exception:URI has an authority component
最后试出了结果
new URI("file:/c:/g3.txt")
最后从有关书籍上查得,正解应该是这样的.
URL url = new URL("file://" + realPath); //for Linux
URL url = new URL("file:///" + realPath); //for Windows
[java] view
plaincopy
package Tech;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URI;
import java.net.URISyntaxException;
import java.net.URL;
public class GetHtmlFile {
/**
* @param args
* @throws IOException
* @throws URISyntaxException
*/
public static void main(String[] args) throws IOException, URISyntaxException {
// TODO Auto-generated method stub
URL url= new URL("http://www.163.com");
InputStream is = url.openStream();
//OutputStream ois= url.openConnection().getOutputStream();
File file = new File(new URI("file:/c:/g3.txt"));
FileOutputStream fos = new FileOutputStream(file);
BufferedOutputStream bos = new BufferedOutputStream(fos);
int ch;
while((ch=is.read())!=-1)
{
bos.write(ch);
bos.flush();
//System.out.print((char)ch);
}
}
}
代码都是些基础代码,不过那个本地File的URI的创建搞了我很长时间,在网上也没搜到啥··
先后试过:
new URI("file://C://g.txt")
Exception:Illegal character in authority
new URI("file://C:/g.txt")
Exception:URI has an authority component
最后试出了结果
new URI("file:/c:/g3.txt")
最后从有关书籍上查得,正解应该是这样的.
URL url = new URL("file://" + realPath); //for Linux
URL url = new URL("file:///" + realPath); //for Windows
相关文章推荐
- 用java从网络上抓取HTML文件内容并写入本地文本中
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- Java操作读取写入文本TXT及XML文件内容
- Java文件写入文本内容方法
- Java 通过URL地址下载文本内容到本地文件中
- 通过java的io流将本地文件读取到控制台,并将文件内容再次写入另一个文件中
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- Java读取和写入文本文件内容
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- java 追加内容写入本地文件
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 .
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- Java生成一个exel文件并写入内容