具有代码优先模型的“可组合”全文搜索

更新 2013年9月18日

看起来没有一种简单的方法可以做到这一点。 我正在坚持一个涉及entity framework扩展的解决方案。

如果您想在entity framework中看到这些function,请在用户语音网站上投票,也许在此处和此处


关于SO有几个类似的问题,但我找不到一个新问题和类似的问题足以得到我正在寻找的答案。

如果这看起来像信息过载,请跳到In Summary

背景

我正在编写WebApi REST服务,以通过OData端点公开一些预先存在的数据。 我正在使用EntitySetContoller来为我做所有繁重的工作。 除了由基类路由和转换的标准OData参数之外 ,我还添加了一些自定义参数,以允许我的控制器使用特定function。

我的数据库服务器是MS SQL Server,在[SomeEntity]表的[BigText] NVarChar[4000]列上有一个全文索引。

我有一个限制, 我必须使用Code First模型。

 // Model POCO public class SomeEntity { public int Id { get; set; } public string BigText { get; set; } } // Simple Controller public class SomeEntityController : EntitySetController { private readonly SomeDbContext context = new SomeDbContext(); public override IQueryable Get() { var parameters = Request.GetQueryNameValuePairs() .ToDictionary(p => p.Key, p => p.Value); if (parameters.ContainsKey("BigTextContains") ( var searchTerms = parameters["BigTextContains"]; // return something special ... ) return this.context.SomeEntities; } // ... The rest is omitted for brevity. } 

问题

如何实现// return something special ...我的例子的一部分?

显然,niave

 return this.context.SomeEntities.Where(e => e.BigText.Contains(searchTerm)); 

是完全错误的,它组成了一个WHERE子句

 [BigText] LIKE '%' + @searchTerm + '%' 

这不使用全文搜索,因此不支持复杂的搜索术语,否则执行可怕。

这种方法,

 return this.context.SomeEntities.SqlQuery( "SELECT E.* FROM [dbo].[SomeEntity] E " + "JOIN CONTAINSTABLE([SomeEntity], [BigText], @searchTerm) FTS " + " ON FTS.[Key] = E.[Id]", new object[] { new SqlParameter("@searchTerm", searchTerm) }) .AsQueryable(); 

看起来很有前途,它实际上使用全文搜索,并且非常实用。 但是,您会注意到DbSqlQuery ,从SqlQuery函数返回的类型不实现IQueryable 。 在这里,它被强制转换为具有AsQueryable()扩展名的正确返回类型,但是这打破了“组合链”。 将在服务器上执行的唯一语句是上面代码中指定的语句。 在OData URL上指定的任何其他子句将在API托管Web服务器上提供服务,而不会受益于数据库引擎的索引和基于专用集的function。

综上所述

使用Entity Framework 5 Code First模型访问MS SQL Server的全文搜索CONTAINSTABLE函数并获取“可组合”结果的最便捷方法是什么?

我需要编写自己的IQueryProvider吗? 我可以用某种方式扩展EF吗?

我不想使用Lucene.Net,我不想使用数据库生成模型。 也许我可以添加额外的包或等待EF6,这会有帮助吗?

它并不完美,但您可以通过2次调用数据库来完成您的工作。 第一个调用将从CONTAINSTABLE中检索匹配键的列表,然后第二个调用将是您使用从第一个调用返回的ID的可组合查询。

 //Get the Keys from the FTS var ids = context.Database.SqlQuery( "Select [KEY] from CONTAINSTABLE([SomeEntity], [BigText], @searchTerm)", new object[] { new SqlParameter("@searchTerm", searchTerm) }); //Use the IDs as an initial filter on the query var composablequery = context.SomeEntities.Where(d => ids.Contains(d.Id)); //add on whatever other parameters were captured to the 'composablequery' variable composablequery = composablequery.Where(.....) 

我最近遇到了同样的问题: EF 5 Code First FTS Queriable

让我延长这个职位。

  • 你的第一个选择也是我的第一个选择 – 使用SqlQuery我还需要做更多的过滤,所以我不是总是编写完整的sql,而是使用了QueryBuilder,我做了一些更改并添加了更多function以满足我的需求(我可以将它上传到某处如果需要): QueryBuilder

  • 在我找到了我实现的另一个想法之后。 有人已经在这里提到过,那就是使用SqlQuery来返回Ids的HashSet,并且你可以在含有Contains的EF查询中使用它。 这是更好但不是最优的,因为你在内存中需要2个查询和Id列表。 例:

      public IQueryable FullTextSearchCompaniesByName(int limit, int offset, string input, Guid accountingBureauId, string orderByColumn) { FtsQueryBuilder ftsQueryBuilder = new FtsQueryBuilder(); ftsQueryBuilder.Input = FtsQueryBuilder.FormatQuery(input); ftsQueryBuilder.TableName = FtsQueryBuilder.GetTableName(); ftsQueryBuilder.OrderByTable = ftsQueryBuilder.TableName; ftsQueryBuilder.OrderByColumn = orderByColumn; ftsQueryBuilder.Columns.Add("CompanyId"); if (accountingBureauId != null && accountingBureauId != Guid.Empty) ftsQueryBuilder.AddConditionQuery(Condition.And, "" , @"dbo.""Company"".""AccountingBureauId""", Operator.Equals, accountingBureauId, "AccountingBureauId", ""); ftsQueryBuilder.AddConditionQuery(Condition.And, "", @"dbo.""Company"".""Deleted""", Operator.Equals, false, "Deleted", ""); var companiesQuery = ftsQueryBuilder.BuildAndExecuteFtsQuery(Context, limit, offset, "Name"); TotalCountQuery = ftsQueryBuilder.Total; HashSet companiesIdSet = new HashSet(companiesQuery); var q = Query().Where(a => companiesIdSet.Contains(a.CompanyId)); return q; } 
  • 然而,EF 6现在有一些叫做拦截器的东西可用于实现可查询的FTS,它非常简单和通用(最后一篇文章): FTS的EF 6拦截器 。 我测试了这个,它工作正常。

! 备注:即使版本为6,EF Code First也不支持自定义存储过程。 如果我理解的话,只有一些用于预定义的CUD操作: 代码优先插入/更新/删除存储过程映射 ,因此无法使用它。

结论:如果你可以使用EF 6去第三个选项,那就给你所需要的一切。 如果您使用的是EF 5或更低版本,则第二个选项优先于第一个但不是最佳选择。