mysql全文索引详解_MySql全文索引详解

mysql全文索引详解_MySql全文索引详解##MySql全文索引详解InnoDB引擎对FULLTEXT索引的支持是MySQL5.6新引入的特性,之前只有MyISAM引擎支持FULLTEXT索引。所谓全文索引,是一种通过建立倒排索引,快速匹配文档的方式。对于FULLTEXT索引的内容可以使用MATCH(column)…AGAINST(val)语法进行查询。###MySQL支持三种模式的全文检索模式:自然语言模式(INNATURALLAN…

大家好,又见面了,我是你们的朋友全栈君。

##MySql全文索引详解

InnoDB引擎对FULLTEXT索引的支持是MySQL5.6新引入的特性,之前只有MyISAM引擎支持FULLTEXT索引。所谓全文索引,是一种通过建立倒排索引,快速匹配文档的方式。对于FULLTEXT索引的内容可以使用MATCH(column)…AGAINST(val)语法进行查询。

###MySQL支持三种模式的全文检索模式:

自然语言模式(IN NATURAL LANGUAGE MODE),即通过MATCH AGAINST 传递某个特定的字符串来进行检索。该模式是MySQL默认使用的。

布尔模式(IN BOOLEAN MODE),可以为检索的字符串增加操作符,例如“+”表示必须包含,“-”表示不包含,“*”表示通配符(这种情况, 即使传递的字符串较小或出现在停词中,也不会被过滤掉),其他还有很多特殊的布尔操作符, 具体可参考官方文档。

查询扩展模式 (WITH QUERY EXPANSION), 这种模式是自然语言模式下的一个变种,会执行两次检索,第一次使用给定的短语进行检索,第二次是结合第一次相关性比较高的行进行检索。

###注意点

目前MySQL支持在CHAR、VARCHAR、TEXT类型的列上定义全文索引。全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符,包含空格。

MySQL指定了最小字符长度,默认是4,必须要匹配大于4的才会有返回结果,可以用SHOW VARIABLES LIKE ‘ft_min_word_len’ 来查看指定的字符长度,也可以在mysql配置文件my.ini 更改最小字符长度,方法是在my.ini 增加一行 比如:ft_min_word_len = 2,改完后重启mysql即可

MySQL在集合查询中的对每个合适的词都会先计算它们的权重,一个出现在多个文档中的词将有较低的权重(可能甚至有一个零权重),因为在这个特定的集中,它有较低的语义值。否则,如果词是较少的,它将得到一个较高的权重,mysql默认的阀值是50%。如果不考虑权重,可以使用MySQL提供的布尔全文检索。

###创建全文索引:

ALTER TABLE table ADD FULLTEXT INDEX idxName(column1(len),column2(len)..)

CREATE FULLTEXT INDEX idxName ON table (column((len)))

###删除索引

ALTER TABLE table DROP INDEX idxName

DROP INDEX idxName ON table

###示例

SELECT title from tmp WHERE MATCH(title) AGAINST(‘今日头条’)

0818b9ca8b590ca3270a3433284dd417.png 2. 空(也就是默认情况),表示可选的,包含该词的顺序较高

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘今日头条 火箭赢了’)

0818b9ca8b590ca3270a3433284dd417.png 3. +用在词的前面,表示一定要包含该词,并且必须在开始位置 -不包含该词,不能单独使用

SELECT title from tmpWHERE MATCH(title) AGAINST(‘+今日头条 -NBA’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png 4. 匹配度高的排前面

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘+今日头条 NBA’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png PS:匹配度高的排前面 5. ~表示拥有该字会降低相关性,如果同时包含~后面的字符,排名就会靠后

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘今日头条 ~NBA’ IN BOOLEAN MODE)

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘”今日头条 UC头条”‘ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png 7. > :提高该字的相关性,查询的结果会排在比较靠前的位置。

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘+今日头条 >NBA’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png 8. < :降低相关性,查询的结果会排在比较靠后的位置

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘+今日头条

0818b9ca8b590ca3270a3433284dd417.png 9. <>两者结合使用

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘+今日头条 >NBA

0818b9ca8b590ca3270a3433284dd417.png 10. ()使用,可以通过括号来使用字条件。

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘+今日头条 +(>NBA

0818b9ca8b590ca3270a3433284dd417.png PS: 找到有今日头条&NBA&火箭赢了,今日头条&NBA或者今日头条&火箭赢了的数据,然后排序规则为:今日头条&NBA > 今日头条&NBA&火箭赢了 > 今日头条&火箭赢了。

* :通配符,前后都有通配符

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘*今日头条*’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png 12. 前面有通配符

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘*今日头条’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png 13. 后面有通配符

SELECT title from t_full_text WHERE MATCH(title) AGAINST(‘今日头条*’ IN BOOLEAN MODE)

0818b9ca8b590ca3270a3433284dd417.png

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/151894.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • MYSQL ERROR CODE 错误编号的意义

    mysql error code(备忘)转1005:创建表失败1006:创建数据库失败1007:数据库已存在,创建数据库失败1008:数据库不存在,删除数据库失败1009:不能删除数据库文件导致删除数据库失败1010:不能删除数据目录导致删除数据库失败1011:删除数据库文件失败1012:不能读取系统表中的记录1020:记录已

  • 服务器搭建个人网站(阿里云服务器)

    服务器搭建个人网站(阿里云服务器)服务器搭建个人网站一丶购买服务器这里我选的是阿里云服务器,进入阿里云官网https://www.aliyun.com阿里云提供了几种服务器,云服务器ESC、轻量应用服务器,ESC更好一点儿,我选了轻量级应用服务器。购买好了之后,在阿里云网站主页→控制台→轻量应用服务器。找到运行中的实例点进去就好了。服务器器就购买好了二、配置服务器环境首先你要知道怎么把你本机的文件放到你的

  • Java实现九九乘法表[通俗易懂]

    Java实现九九乘法表[通俗易懂]有时候我们在java编程的时候,想实现九九乘法表的效果,怎么实现呢,下面来分享一下方法输出九九乘法口诀表,如图所示。观察九九乘法口诀表,可以得出图表的规律:总共有9行,第几行就有几个表达式。同时要注意每行表达式的规律:第j行,表达式就从j1开始,一直到jj结束,共有j个表达式,这个效果可以通过一次循环实现。这样的话,正好可以通过双重循环来控制输出,外层循环控制行数,内层循环控制列。还有个地方…

  • C++二维vector初始化

    C++二维vector初始化初始化一个二维vector,行M,列N(行列数确定且含有初始值)://初始化一个二维的matrix,行M,列N,且值为0vector<vector<int>>matrix(M,vector<int>(N));//等价于下面的vector<vector<int>>matrix(M);for(inti=0;i<M;i++){matrix[i].resize(N);}//等价于下面的vector&l

  • AD域和LDAP协议

    AD域和LDAP协议AD域和LDAP协议1、LDAP1.1常见的目录服务软件X.500LDAPActriveDirectory,Microsoft公司NIS1.2LDAP特点LDAP是轻量目录访问协议(LightweightDirectoryAccessProtocol)的缩写。LDAP是一种开放Internet标准,LDAP协议是跨平台的Interent协议LDAP标准实际上是在X.500标准基础上产生的一个简化版本,它是基于X.500标准的,与X.500不同,LDAP支持TCP/IP

  • docker 离线安装_docker 离线安装

    docker 离线安装_docker 离线安装docker离线安装方法下载地址:https://download.docker.com/linux/static/stable/x86_64/参考文档:https://docs.docker.com/engine/install/binaries/机房设备无法访问互联网原因,需要进行离线安装K8S生态周报|Docker和containerd全版本漏洞公布,近期在Docker中发现了一个影响所有版本的安全漏洞CVE-2022-24769,该漏洞已经在Docker最新的版本v20

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号