Tag: 全文搜索

Lucene.NET共享主机

我正在尝试让Lucene.NET在共享托管环境中工作。 关于codeproject的Mascix概述了他如何在godaddy上工作。 我在isqsolutions上尝试这个。 他发布的两个示例在我的本地计算机上运行良好,并且在共享主机服务器上都抛出相同的错误: Compiler Error Message: CS0246: The type or namespace name ‘Lucene’ could not be found (are you missing a using directive or an assembly reference?) Line 1: Line 2: Line 3: Line 4: Line 5: 我尝试在web.config中添加对Lucene.NET assambly的直接引用,如下所示: 但这也引发了自己的错误。 我想我的问题是:我错过了一些简单的东西,还是服务器端设置导致这根本不起作用?

如何在特定选定项目内的TFS源代码管理中搜索特定文件?

码: string spName = “usp_Test_Procedure.sql”; var tfsPp = new TeamProjectPicker(TeamProjectPickerMode.SingleProject, false); tfsPp.ShowDialog(); _tfs = tfsPp.SelectedTeamProjectCollection; if (tfsPp.SelectedProjects.Any()) { _selectedTeamProject = tfsPp.SelectedProjects[0]; } string selectedProjectName = _selectedTeamProject.Name; var tfs = TfsTeamProjectCollectionFactory.GetTeamProjectCollection(_tfs.Uri); var vsStore = tfs.GetService(); var project = “project”; var branchVersion = “1.0.0”; var folders = vsStore.GetItems(“$/” + selectedProjectName + “/*”, RecursionType.Full); 如何在特定选定项目内的TFS源代码控件中 搜索特定文件 , 以及用户从c#UI […]

用于查找文本中所有关键字的高效算法

我有很多字符串包含许多不同拼写的文本。 我通过搜索关键字来标记这些字符串,如果找到关键字,我会使用该关键字的关联文本。 假设搜索字符串可以包含文本“schw。”,“schwa”。 和“施瓦茨”。 我有三个关键字都解析为文本“schwarz”。 现在我正在寻找一种有效的方法来查找所有关键字,而无需执行string.Contains(关键字)为每个关键字。 样本数据: H-Fuss ahorn 15 cm/SH48cm Metall-Fuss chrom 9 cm/SH42cm Metall-Kufe alufbg.12 cm/SH45c Metall-Kufe verchr.12 cm/SH45c Metall-Zylind.aluf.12cm/SH45cm Kufe alufarbig Metall-Zylinder hoch alufarbig Kunststoffgl.schw. – hoch Kunststoffgl.schw. – Standard Kunststoffgleiter – schwarz für Sitzhoehe 42 cm 示例关键字(键,值): h-fuss, Holz ahorn, Ahorn metall, Metall chrom, Chrom verchr, Chrom alum, Aluminium aluf, Aluminium […]

在文本文件中搜索字符串的更快方法

我需要使用C#在一组文本文件中搜索大约13个字符的字符串。 文本文件的数量正在变化,范围在100-1000之间。 文件大小可以在1KB到10MB之间。 我尝试了打开每个文件的天真方式,逐行读取并查看字符串是否存在(使用index.of),但这太慢了。 我也尝试使用Boyer-Moore算法,它确实改善了时间,持续5秒,但仍然感觉很慢。 关于如何加快搜索速度的想法?

在C#中为信息检索应用程序编写反向索引

我正在编写一个内部应用程序,其中包含几条文本信息以及有关这些文本的大量数据。 这些数据将按入口顺序保存在数据库(SQL Server,尽管可能会更改)中。 我希望能够搜索这些信息中最相关的信息,其中最相关的信息位于顶部。 我最初考虑使用SQL Server全文搜索,但它不像我希望的那样灵活,以满足我的其他需求,所以我似乎需要开发自己的解决方案。 根据我的理解,所需要的是倒排索引 ,然后根据所保存的附加信息的结果来恢复和修改所述倒排索引的内容(尽管现在这可以留待以后我想要的日期倒排索引从数据库表/字符串提供的索引主文本)。 我在使用Hashtable在Java中编写此代码时遇到了一个问题,其中密钥作为单词,值作为单词出现的列表但是老实说我仍然是C#的新手并且只是真正使用过处理信息时,如DataSet和DataTables。 如果请求,我会在我清除这台病毒笔记本电脑后立即上传Java代码。 如果从表或字符串列表中给出一组条目,那么如何在C#中创建一个反向索引,最好保存到DataSet / DataTable中? 编辑:我忘了提到我已经尝试过Lucene和Nutch,但是需要我自己的解决方案,因为修改Lucene以满足我的需求需要比编写倒置索引要长得多。 我将处理大量的元数据,这些元数据在基本的反向索引完成后也需要处理,所以我现在需要的是使用反向索引在一个区域上进行基本的全文搜索。 最后,制作倒排索引不是我每天都要做的事情,所以对它进行破解是很好的。

在文件中查找文本并检索行号

我试图(以编程方式)查找对特定字符串的引用,即大量VB6文件中的“LOCK_ID”。 为了帮助人们直接导航到参考,我还想检索匹配的行号。 即: 搜索所有VB6文件以供参考 如果找到引用,我想检索引用所在的行号。 如果没有打开目录中的每个文件并遍历文件并记住我正在检查搜索词的哪一行,是否有更快/更简单的方法来实现这一目标?

如何在Lucene.net中执行语音和近似搜索

当我阅读Lucene.net文档时,我找到的唯一分析器是标准分析器。 我想确保我可以对我的索引进行语音或近似搜索。 我应该在Lucene.net上使用一些额外的库吗?

你如何使用Linq到ADO.NETentity framework进行全文搜索(FTS)?

现在SQL Server 2008内置了全文搜索。我希望用它来支持我网站的搜索。 我也在考虑为我的ORM使用ADO.NETentity framework,但我想知道如何使用Linq到ADO.NETentity framework进行全文搜索(FTS)? 在ADO.NETentity framework中是否有任何支持,或者我是否坚持使用创建使用全文搜索谓词的函数的方法 ?

将全文搜索与SQL Server结合有多难?

我正在构建一个带有SQL后端的C#/ ASP.NET应用程序。 我正在截止日期并完成我的页面,在左侧字段中,我的一位设计师在我的一个页面上整合了全文搜索。 直到此时我的“搜索”都是filter,能够通过某些因子和列值缩小结果集。 因为我正处于截止日期(你知道每晚睡3个小时,我看起来像猫吃了什么东西并且扔了起来),我期待这个页面与其他人非常相似,我正在尝试决定是否发臭。 我之前从未在页面上进行过全文搜索….这是一座可以登山的山还是有一个简单的解决方案? 谢谢。

用于文本算法的.NET库?

你知道任何用于文本算法的.NET库吗? 特别是我对字符串匹配和全文搜索算法感兴趣 Bitap算法 Levenshtein距离 Damerau-Levenshtein距离 我知道我提到的那个代码非常简单,但有数百种文本算法,我不想自己编写代码。 如果没有已知的这样的.NET库,你可以提一下C,C ++库,编码包装器比零编码更容易。