资 源 简 介
翻译 maninwest@Codeforge 作者: Dan Letecky @CodeProject使用PDFBox 和 IKVM.NET在 .NET 中解析PDF 文件(托管代码)如何解析 PDF文件在 .NET 中提取 PDF 文本有多个方式:· Microsoft IFilter接口和Adobe IFilter 实现.· iTextSharp· PDFBox1. 如何使用Adobe PDF IFilter解析 PDF 文件要使用 IFilter 接口解析 PDF 文件,需要以下条件:· Windows 2000 或以上版本· Adobe Acrobat 或 Reader 7.0.5以上版本 (或者单机版 Adobe PDF IFilter [adobe.com])· IFilter COM wrapper class [dotlucene.net]示例代码using IFilter;
// ...
public static string ExtractTextFromPdf(string path) {
return DefaultParser.Extract(path);
} 下载一个示例代码· Parsing PDF Files using IFilter [squarepdf.net]如果使用Adobe Acrobat Reader 自带的 PDF IFilter ,需要重命名进程为 "filtdump.e