问题 将用户输入的搜索查询转换为where子句,以便在SQL Server全文搜索中使用


将用户输入的搜索词转换为可用于where子句进行全文搜索以查询表并获取相关结果的查询的最佳方法是什么?例如,用户输入以下查询:

+"e-mail" +attachment -"word document" -"e-learning"

应该翻译成:

SELECT * FROM MyTable WHERE (CONTAINS(*, '"e-mail"')) AND (CONTAINS(*, '"attachment"')) AND (NOT CONTAINS(*, '"word document"')) AND (NOT CONTAINS(*, '"e-learning"'))

我正在使用 查询解析器类 此时,它使用正则表达式将用户输入的查询解析为标记,然后从标记构造where子句。

但是,鉴于这可能是许多使用全文搜索的系统的常见要求,我很好奇其他开发人员如何处理这个问题,以及是否有更好的做事方式。


7703
2018-02-03 04:40


起源



答案:


这可能不是您正在寻找的,但它可能会为您提供一些进一步的想法。

http://www.sqlservercentral.com/articles/Full-Text+Search+(2008)/64248/


5
2018-02-03 08:17



我试过了它并不是那么好。 - Ronnie Overby
注意:文章需要注册和订阅电子邮件简报(如果你能忍受这样的事情,那就没问题了) - Chris Simpson
这很好用。您可以在下面看到如何实现它。 - franzo


答案:


这可能不是您正在寻找的,但它可能会为您提供一些进一步的想法。

http://www.sqlservercentral.com/articles/Full-Text+Search+(2008)/64248/


5
2018-02-03 08:17



我试过了它并不是那么好。 - Ronnie Overby
注意:文章需要注册和订阅电子邮件简报(如果你能忍受这样的事情,那就没问题了) - Chris Simpson
这很好用。您可以在下面看到如何实现它。 - franzo


如何使用.Net / C#/ Entity Framework实现接受的答案...

  1. 使用nuget安装Irony。

  2. 从以下位置添加示例类: http://irony.codeplex.com/SourceControl/latest#Irony.Samples/FullTextSearchQueryConverter/SearchGrammar.cs

  3. 编写这样的代码将用户输入的字符串转换为查询。

    var grammar = new Irony.Samples.FullTextSearch.SearchGrammar();
    var parser = new Irony.Parsing.Parser(grammar);
    var parseTree = parser.Parse(userEnteredSearchString);
    string query = Irony.Samples.FullTextSearch.SearchGrammar.ConvertQuery(parseTree.Root);
    
  4. 也许写这样的存储过程:

    create procedure [dbo].[SearchLivingFish]
    
    @Query nvarchar(2000)
    
    as
    
    select *
    from Fish
    inner join containstable(Fish, *, @Query, 100) as ft
    on ft.[Key] = FishId
    where IsLiving = 1
    order by rank desc
    
  5. 运行查询。

    var fishes = db.SearchLivingFish(query);
    

7
2018-05-23 06:28





除了@franzo上面的回答,您可能还想更改SQL中的默认停用词行为。否则,包含单个数字(或其他停用词)的查询将不会返回任何结果。

禁用停用词,创建自己的停用词列表和/或设置要转换的干扰词,如中所述 SQL 2008:关闭全文搜索查询的停用词 

要查看(英文)sql停用词的系统列表,请运行:

select * from sys.fulltext_system_stopwords where language_id = 1033

1
2017-08-11 02:46





我意识到这与你原来的问题有点相反,但你是否考虑过远离SQL全文索引并使用像 Lucene的/ Solr的 代替?


0
2018-02-03 08:05



是的,我想在某个时候转移到Lucene,虽然我过去曾经触及它,虽然设置基础相对简单,让它做我现在做的同样的事情是一点点更多的工作,所以我把它搁置了。 - Mun


最简单的方法是使用动态SQL(我知道,在此处插入安全问题)并将短语分解为格式正确的字符串。

您可以使用函数将短语分解为可用于创建新字符串的表变量。


0
2018-02-03 08:20





GoldParser和Calitha的组合应该把你排除在外。

本文: http://www.15seconds.com/issue/070719.htm 还有一个googleToSql类,它会为你做一些翻译。


0
2017-10-30 15:38