您的位置:首页 > 编程语言 > C#

c#读取pdf文档

2013-06-27 14:43 169 查看
1.下载PDFBox-0.7.3

2.解压PDFBox,项目中添加存在解压后Bin目录下的dll文件:IKVM.GNU.Classpath.dll、IKVM.Runtime.dll、FontBox-0.1.0-dev.dll、PDFBox-0.7.3.dll

3.文件中引入2个命名空间:using org.pdfbox.pdmodel、using org.pdfbox.util

4.如下代码变可以读取pdf文档:

void ReadPdf(FileInfo pdffile)

{

PDDocument doc = PDDocument.load(pdffile.FullName);

PDFTextStripper pdfStripper = new PDFTextStripper();

string text = pdfStripper.getText(doc);

}

此时pdf文档的内容就被读取到字符串text中。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: