Tag: 模糊搜索

模糊匹配字符串中的多个单词

我正在尝试使用Levenshtein Distance的帮助在OCR页面上找到模糊关键字(静态文本)。 为此,我想给出允许的一定百分比的错误(比如15%)。 string Keyword = “past due electric service”; 由于关键字长度为25个字符,我想允许4个错误(25 * .15向上舍入) 我需要能够将它与…进行比较 string Entire_OCR_Page = “previous bill amount payment received on 12/26/13 thank you! current electric service total balances unpaid 7 days after the total due date are subject to a late charge of 7.5% of the amount due or $2.00, whichever/5 greater. […]

在C#中超过100k +字符串的快速动态模糊搜索

假设它们是预先加载的股票代码,键入文本框。 我正在寻找可以复制的代码,而不是要安装的库。 这是受这个问题的启发: 是否有为C#编写的模糊搜索或字符串相似性函数库? Levenstein距离算法似乎运行良好,但计算需要时间。 当用户输入额外的字母时,是否需要重新运行查询这一事实是否有任何优化? 我有兴趣最多显示每个输入的前10个匹配项。

超模糊名称检查?

我正在研究一些内部CRM的东西。 该公司目前的前端允许大量重复。 我试图阻止最终用户投入同一个人,因为他们搜索的是“比尔约翰逊”,而不是“威廉约翰逊”。 因此,用户将提供有关其新客户的一些信息,我们将找到相似的名称(包括模糊名称),并将它们与我们数据库中已有的内容相匹配,并询问它们是否意味着那些东西……是这样的数据库还是技术存在吗?

在C#中匹配的模糊文本(句子/标题)

嘿,我正在使用Levenshteins算法来获取源和目标字符串之间的距离。 我也有从0到1返回值的方法: /// /// Gets the similarity between two strings. /// All relation scores are in the [0, 1] range, /// which means that if the score gets a maximum value (equal to 1) /// then the two string are absolutely similar /// /// The string1. /// The string2. /// public static float CalculateSimilarity(String s1, […]