如何使用特定的PDF IFilter

dth*_*her 6 pdf full-text-search ifilter

我正在尝试使用iFilter从PDF文件中提取文本.

随Adobe Reader一起分发的Adobe PDF iFilter非常糟糕,返回HRESULT E_FAIL了许多PDF文档的消息.

福昕PDF IFilter的精美作品几乎所有我一直在使用用于测试的PDF文件.

问题是,每次Adobe Updater运行时,它都会将糟糕的FoxIt IFilter替换为糟糕的Adobe IFilter.

我一直在使用LoadIFilter方法获取PDF文件的注册IFilter.有没有办法强制Win32 API加载FoxIt IFilter而不是Adobe IFilter?

注意:关于确定安装哪些IF过滤器的问题询问相关但不相同的问题.

Nig*_*rne 3

IFilter 似乎在 Windows 中注册为 COM 对象,因此您应该能够使用 COM 创建它的实例。

来自http://msdn.microsoft.com/en-us/library/ms692565:DLL的结构是它有一个IFilter和一个IClassFactory

您应该能够实例化 IClassFactory(给定 CLSID)

查看 http://msdn.microsoft.com/en-us/library/ms684007 http://msdn.microsoft.com/en-us/library/ms680760