亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

MySQL不用like+%實現(xiàn)模糊查詢

 更新時間:2023年01月05日 17:18:24   作者:吳名氏  
本文主要介紹了MySQL不用like+%實現(xiàn)模糊查詢,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

一、前言

我們都知道 InnoDB 在模糊查詢數(shù)據(jù)時使用 "%xx" 會導(dǎo)致索引失效,但有時需求就是如此,類似這樣的需求還有很多,例如,搜索引擎需要根基用戶數(shù)據(jù)的關(guān)鍵字進行全文查找,電子商務(wù)網(wǎng)站需要根據(jù)用戶的查詢條件,在可能需要在商品的詳細介紹中進行查找,這些都不是B+樹索引能很好完成的工作。

通過數(shù)值比較,范圍過濾等就可以完成絕大多數(shù)我們需要的查詢了。但是,如果希望通過關(guān)鍵字的匹配來進行查詢過濾,那么就需要基于相似度的查詢,而不是原來的精確數(shù)值比較,全文索引就是為這種場景設(shè)計的。

全文索引(Full-Text Search)是將存儲于數(shù)據(jù)庫中的整本書或整篇文章中的任意信息查找出來的技術(shù)。它可以根據(jù)需要獲得全文中有關(guān)章、節(jié)、段、句、詞等信息,也可以進行各種統(tǒng)計和分析。

在早期的 MySQL 中,InnoDB 并不支持全文檢索技術(shù),從 MySQL 5.6 開始,InnoDB 開始支持全文檢索。

二、倒排索引

全文檢索通常使用倒排索引(inverted index)來實現(xiàn),倒排索引同 B+Tree 一樣,也是一種索引結(jié)構(gòu)。它在輔助表中存儲了單詞與單詞自身在一個或多個文檔中所在位置之間的映射,這通常利用關(guān)聯(lián)數(shù)組實現(xiàn),擁有兩種表現(xiàn)形式:

inverted file index:{單詞,單詞所在文檔的id}

full inverted index:{單詞,(單詞所在文檔的id,再具體文檔中的位置)}

上圖為 inverted file index 關(guān)聯(lián)數(shù)組,可以看到其中單詞"code"存在于文檔1,4中,這樣存儲再進行全文查詢就簡單了,可以直接根據(jù) Documents 得到包含查詢關(guān)鍵字的文檔;而 full inverted index 存儲的是對,即(DocumentId,Position),因此其存儲的倒排索引如下圖,如關(guān)鍵字"code"存在于文檔1的第6個單詞和文檔4的第8個單詞。相比之下,full inverted index 占用了更多的空間,但是能更好的定位數(shù)據(jù),并擴充一些其他搜索特性。

三、全文檢索

3.1、創(chuàng)建全文索引

3.1.1、創(chuàng)建表時創(chuàng)建全文索引語法如下:

CREATE TABLE table_name ( id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, author VARCHAR(200), 
title VARCHAR(200), content TEXT(500), FULLTEXT full_index_name (col_name) ) ENGINE=InnoDB;
 

輸入查詢語句:

SELECT table_id, name, space from INFORMATION_SCHEMA.INNODB_TABLES
WHERE name LIKE 'test/%';

上述六個索引表構(gòu)成倒排索引,稱為輔助索引表。當傳入的文檔被標記化時,單個詞與位置信息和關(guān)聯(lián)的DOC_ID,根據(jù)單詞的第一個字符的字符集排序權(quán)重,在六個索引表中對單詞進行完全排序和分區(qū)。

3.1.2、在已創(chuàng)建的表上創(chuàng)建全文索引語法如下:

CREATE FULLTEXT INDEX full_index_name ON table_name(col_name);

3.2、使用全文索引

MySQL 數(shù)據(jù)庫支持全文檢索的查詢,全文索引只能在 InnoDB 或 MyISAM 的表上使用,并且只能用于創(chuàng)建 char,varchar,text 類型的列。

其語法如下:

MATCH(col1,col2,...) AGAINST(expr[search_modifier])
search_modifier:
{
    IN NATURAL LANGUAGE MODE
    | IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION
    | IN BOOLEAN MODE
    | WITH QUERY EXPANSION
}
 

全文搜索使用?`MATCH() AGAINST()`[1]語法進行,其中,MATCH() 采用逗號分隔的列表,命名要搜索的列。AGAINST()接收一個要搜索的字符串,以及一個要執(zhí)行的搜索類型的可選修飾符。全文檢索分為三種類型:自然語言搜索、布爾搜索、查詢擴展搜索,下面將對各種查詢模式進行介紹。

3.3、Natural Language

自然語言搜索將搜索字符串解釋為自然人類語言中的短語,MATCH()默認采用 Natural Language 模式,其表示查詢帶有指定關(guān)鍵字的文檔。

接下來結(jié)合demo來更好的理解Natural Language

SELECT
    count(*) AS count 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( 'MySQL' );

上述語句,查詢 title,body 列中包含 'MySQL' 關(guān)鍵字的行數(shù)量。上述語句還可以這樣寫:

SELECT
    count(IF(MATCH ( title, body ) 
    against ( 'MySQL' ), 1, NULL )) AS count 
FROM
    `fts_articles`;
 

上述兩種語句雖然得到的結(jié)果是一樣的,但從內(nèi)部運行來看,第二句SQL的執(zhí)行速度更快些,因為第一句SQL(基于where索引查詢的方式)還需要進行相關(guān)性的排序統(tǒng)計,而第二種方式是不需要的。

還可以通過SQL語句查詢相關(guān)性:

SELECT
    *,
    MATCH ( title, body ) against ( 'MySQL' ) AS Relevance 
FROM
    fts_articles;

相關(guān)性的計算依據(jù)以下四個條件:

  • word 是否在文檔中出現(xiàn)
  • word 在文檔中出現(xiàn)的次數(shù)
  • word 在索引列中的數(shù)量
  • 多少個文檔包含該 word

對于 InnoDB 存儲引擎的全文檢索,還需要考慮以下的因素:

  • 查詢的 word 在 stopword 列中,忽略該字符串的查詢
  • 查詢的 word 的字符長度是否在區(qū)間 [innodb_ft_min_token_size,innodb_ft_max_token_size] 內(nèi)

如果詞在 stopword 中,則不對該詞進行查詢,如對 'for' 這個詞進行查詢,結(jié)果如下所示:

SELECT
    *,
    MATCH ( title, body ) against ( 'for' ) AS Relevance 
FROM
    fts_articles;

 可以看到,'for'雖然在文檔 2,4中出現(xiàn),但由于其是 stopword ,故其相關(guān)性為0 參數(shù) innodb_ft_min_token_size 和 innodb_ft_max_token_size 控制 InnoDB 引擎查詢字符的長度,當長度小于 innodb_ft_min_token_size 或者長度大于 innodb_ft_max_token_size 時,會忽略該詞的搜索。在 InnoDB 引擎中,參數(shù) innodb_ft_min_token_size 的默認值是3,innodb_ft_max_token_size的默認值是84

3.4、Boolean

布爾搜索使用特殊查詢語言的規(guī)則來解釋搜索字符串,該字符串包含要搜索的詞,它還可以包含指定要求的運算符,例如匹配行中必須存在或不存在某個詞,或者它的權(quán)重應(yīng)高于或低于通常情況。例如,下面的語句要求查詢有字符串"Pease"但沒有"hot"的文檔,其中+和-分別表示單詞必須存在,或者一定不存在。

select * from fts_test where MATCH(content) AGAINST('+Pease -hot' IN BOOLEAN MODE);

Boolean 全文檢索支持的類型包括:

  • +:表示該 word 必須存在
  • -:表示該 word 必須不存在
  • (no operator)表示該 word 是可選的,但是如果出現(xiàn),其相關(guān)性會更高
  • @distance表示查詢的多個單詞之間的距離是否在 distance 之內(nèi),distance 的單位是字節(jié),這種全文檢索的查詢也稱為 Proximity Search,如 MATCH(context) AGAINST('"Pease hot"@30' IN BOOLEAN MODE)語句表示字符串 Pease 和 hot 之間的距離需在30字節(jié)內(nèi)
  • :表示出現(xiàn)該單詞時增加相關(guān)性

  • <:表示出現(xiàn)該單詞時降低相關(guān)性
  • ~:表示允許出現(xiàn)該單詞,但出現(xiàn)時相關(guān)性為負
    • :表示以該單詞開頭的單詞,如 lik*,表示可以是 liklike,likes
  • " :表示短語

下面是一些demo,看看 Boolean Mode 是如何使用的。

demo1:+ -

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( '+MySQL -YourSQL' IN BOOLEAN MODE );
 

上述語句,查詢的是包含 'MySQL' 但不包含 'YourSQL' 的信息

demo2:no operator

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( 'MySQL IBM' IN BOOLEAN MODE );
 

上述語句,查詢的 'MySQL IBM' 沒有 '+','-'的標識,代表 word 是可選的,如果出現(xiàn),其相關(guān)性會更高

demo3:@

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( '"DB2 IBM"@3' IN BOOLEAN MODE );
 

上述語句,代表 "DB2" ,"IBM"兩個詞之間的距離在3字節(jié)之內(nèi)

demo4:> <

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( '+MySQL +(>database <DBMS)' IN BOOLEAN MODE );
 

上述語句,查詢同時包含 'MySQL','database','DBMS' 的行信息,但不包含'DBMS'的行的相關(guān)性高于包含'DBMS'的行。

demo5: ~

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( 'MySQL ~database' IN BOOLEAN MODE );
 

上述語句,查詢包含 'MySQL' 的行,但如果該行同時包含 'database',則降低相關(guān)性。

demo6:*

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( 'My*' IN BOOLEAN MODE );
 

上述語句,查詢關(guān)鍵字中包含'My'的行信息。

demo7:"

SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH ( title, body ) AGAINST ( '"MySQL Security"' IN BOOLEAN MODE );
 

上述語句,查詢包含確切短語 'MySQL Security' 的行信息。

3.5、Query Expansion

查詢擴展搜索是對自然語言搜索的修改,這種查詢通常在查詢的關(guān)鍵詞太短,用戶需要 implied knowledge(隱含知識)時進行,例如,對于單詞 database 的查詢,用戶可能希望查詢的不僅僅是包含 database 的文檔,可能還指那些包含 MySQL、Oracle、RDBMS 的單詞,而這時可以使用 Query Expansion 模式來開啟全文檢索的 implied knowledge

通過在查詢語句中添加 WITH QUERY EXPANSION / IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION 可以開啟 blind query expansion(又稱為 automatic relevance feedback),該查詢分為兩個階段。

  • 第一階段:根據(jù)搜索的單詞進行全文索引查詢
  • 第二階段:根據(jù)第一階段產(chǎn)生的分詞再進行一次全文檢索的查詢

接著來看一個例子,看看 Query Expansion 是如何使用的。

-- 創(chuàng)建索引
create FULLTEXT INDEX title_body_index on fts_articles(title,body);
 
-- 使用 Natural Language 模式查詢
SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH(title,body) AGAINST('database');
 

使用 Query Expansion 前查詢結(jié)果如下:

-- 當使用 Query Expansion 模式查詢
SELECT
    * 
FROM
    `fts_articles` 
WHERE
    MATCH(title,body) AGAINST('database' WITH QUERY expansion);
 

使用 Query Expansion 后查詢結(jié)果如下:

由于 Query Expansion 的全文檢索可能帶來許多非相關(guān)性的查詢,因此在使用時,用戶可能需要非常謹慎。

四、刪除全文索引

4.1、直接刪除全文索引語法如下:

DROP INDEX full_idx_name ON db_name.table_name;

4.2、使用 alter table 刪除全文索引語法如下:

ALTER TABLE db_name.table_name DROP INDEX full_idx_name;

五、小結(jié)

本文從理論與實踐結(jié)合的角度對 fulltext index 做了介紹

到此這篇關(guān)于MySQL不用like+%實現(xiàn)模糊查詢的文章就介紹到這了,更多相關(guān)MySQL 模糊查詢內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • mysql數(shù)據(jù)庫的加密與解密方式

    mysql數(shù)據(jù)庫的加密與解密方式

    這篇文章主要介紹了mysql數(shù)據(jù)庫的加密與解密方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-01-01
  • mysql常見問題解決

    mysql常見問題解決

    網(wǎng)上看到了不錯的mysql下常見錯誤解決方法,特整理下,方便大家學(xué)習(xí)mysql
    2008-02-02
  • MySQL使用組合查詢的示例代碼

    MySQL使用組合查詢的示例代碼

    本文主要介紹了MySQL使用組合查詢的示例代碼,如何使用UNION操作符來組合SELECT語句,文中通過示例代碼介紹的非常詳細,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2024-03-03
  • 解析mysql與Oracle update的區(qū)別

    解析mysql與Oracle update的區(qū)別

    本篇文章是對mysql與Oracle update的區(qū)別進行了詳細的分析介紹,需要的朋友參考下
    2013-07-07
  • MySQL5.7 如何通過邏輯備份遷移到GreatSQL及注意事項

    MySQL5.7 如何通過邏輯備份遷移到GreatSQL及注意事項

    在將數(shù)據(jù)庫從MySQL 5.7遷移到GreatSQL8.0.32時,由于數(shù)據(jù)量較小且關(guān)注安全性,決定使用mysqldump執(zhí)行邏輯備份,并將數(shù)據(jù)導(dǎo)入GreatSQL,這篇文章主要介紹了MySQL5.7 通過邏輯備份遷移到GreatSQL注意事項,需要的朋友可以參考下
    2024-06-06
  • mysql索引必須了解的幾個重要問題

    mysql索引必須了解的幾個重要問題

    這篇文章主要介紹了mysql索引必須了解的幾個重要問題,分析了MySQL數(shù)據(jù)庫索引的相關(guān)概念與使用技巧,需要的朋友可以參考下
    2016-04-04
  • MySQL數(shù)據(jù)庫基礎(chǔ)入門之常用命令小結(jié)

    MySQL數(shù)據(jù)庫基礎(chǔ)入門之常用命令小結(jié)

    這篇文章主要介紹了MySQL數(shù)據(jù)庫基礎(chǔ)入門之常用命令,結(jié)合實例形式分析了MySQL數(shù)據(jù)庫管理、備份、日志常用操作命令與使用注意事項,需要的朋友可以參考下
    2020-05-05
  • Windows7中配置安裝MySQL 5.6解壓縮版

    Windows7中配置安裝MySQL 5.6解壓縮版

    這篇文章主要介紹了Windows7中配置安裝MySQL 5.6解壓縮版的方法以及安裝過程中遇到的問題及解決方法,這里推薦給有需要的小伙伴
    2014-12-12
  • 結(jié)合PHP腳本添加和查詢MySQL數(shù)據(jù)的基本教程

    結(jié)合PHP腳本添加和查詢MySQL數(shù)據(jù)的基本教程

    這篇文章主要介紹了結(jié)合PHP腳本添加和查詢MySQL數(shù)據(jù)的基本教程,即在PHP程序中使用基本的SELECT FROM和INSERT INTO語句,需要的朋友可以參考下
    2015-12-12
  • Windows安裝MySQL 5.7.18 解壓版的教程

    Windows安裝MySQL 5.7.18 解壓版的教程

    這篇文章主要為大家詳細介紹了Windows安裝MySQL 5.7.18 解壓版的詳細教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-07-07

最新評論