c#读取pdf文档
2013-06-27 14:43
169 查看
1.下载PDFBox-0.7.3
2.解压PDFBox,项目中添加存在解压后Bin目录下的dll文件:IKVM.GNU.Classpath.dll、IKVM.Runtime.dll、FontBox-0.1.0-dev.dll、PDFBox-0.7.3.dll
3.文件中引入2个命名空间:using org.pdfbox.pdmodel、using org.pdfbox.util
4.如下代码变可以读取pdf文档:
void ReadPdf(FileInfo pdffile)
{
PDDocument doc = PDDocument.load(pdffile.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
}
此时pdf文档的内容就被读取到字符串text中。
2.解压PDFBox,项目中添加存在解压后Bin目录下的dll文件:IKVM.GNU.Classpath.dll、IKVM.Runtime.dll、FontBox-0.1.0-dev.dll、PDFBox-0.7.3.dll
3.文件中引入2个命名空间:using org.pdfbox.pdmodel、using org.pdfbox.util
4.如下代码变可以读取pdf文档:
void ReadPdf(FileInfo pdffile)
{
PDDocument doc = PDDocument.load(pdffile.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
}
此时pdf文档的内容就被读取到字符串text中。
相关文章推荐
- C#读取PDF文档内容
- C#生成PDF文档,读取TXT文件内容
- C#生成PDF文档,读取TXT文件内容
- C#编程读取文档Doc、Docx及Pdf内容的方法
- C#操作PDF文档--PDFBox读取pdf文档,O2S.Components.PDFRender4NET生成缩略图
- C#生成PDF文档,读取TXT文件内容
- 用C#实现生成PDF文档
- c#.net(B/s)读取默认配置文档内容及连接数据库
- c# 读取并写入 txt文档 前三行
- VS+C#由创建的Excel生成PDF文档
- Asp.net或C#使用word模板生成替换后的Word和pdf文档-总结
- 用C#实现生成PDF文档
- C#读取doc,pdf,ppt文件
- (转)如何利用书签向word文档读取或写入数据[C#]
- 用C#实现生成PDF文档
- C#读取pdf文件
- C#实现office文档转换为PDF或xps的一些方法
- 用C#读取XML文档
- 用C#语言遍历读取和操纵XML文档
- Apache PDFbox开发指南之PDF文档读取