我如何使用Lucene.Net索引PDF文件？

我正在寻找一些示例代码，演示如何使用Lucene.Net和C＃索引PDF文档。谷歌出现了几个，但没有一个，我觉得有帮助。

根据我的理解，Lucene仅限于创建索引并搜索该索引。由应用程序来处理打开文件并提取索引的内容。因此，如果您要搜索PDF文档，您将需要使用类似iTextSharp的内容来打开文件，请提取内容，然后将其传递给Lucene进行索引。在Dimecasts.net网站上有一些很好的使用Lucene的例子。

StringBuilder stringBuilder = new StringBuilder(); PdfReader pdfReader = new PdfReader(byte[] of the .pdf); for (int page = 1; page <= pdfReader.NumberOfPages; page++) { stringBuilder.Append(PdfTextExtractor.GetTextFromPage(pdfReader, page) + " "); }

（使用iTextSharp）

其余部分并未简洁明了。

我网站上的产品演示中有代码显示了如何使用lucene.net代码，但这里发布的时间有点长。

以下是与我的产品相关的代码： https ： //svn.arachnode.net/svn/arachnodenet/trunk/Plugins/CrawlActions/ManageLuceneDotNetIndexes.cs用户名/密码：公开

Interesting Posts

我们可以使用对象访问私有变量吗？

自定义’ExportFactory’

无法从’out T’转换为’out Component’

C＃读取文本框忽略字符

ALTER TABLE DROP COLUMN失败，因为一个或多个对象访问此列

AsyncLocal 在非异步/等待代码中的作用是什么？

WCF暂停通话

如何向SqlParameter Collection添加新参数？

从Windows服务访问环境变量

Windows 8.1中的MediaElement样式