使用MYSQL进行全文索引
1. 背景
需要对数据库中某张表里的若干字段进行全文索引。
2. 分析
可以采用三种方法:
1. mysql全文索引
2. lucene进行索引
3. 将mysql数据库转为mongodb
最后决定使用mysql全文索引,省得编码了。
3. 步骤
基本步骤如下:
1. 需要修改数据库引擎,从innodb转为myiam
2. 建立全文索引
3. 查询使用
3.1 修改数据库引擎
use jyonline;show tables;alter table paper ENGINE=MyISAM;alter table question ENGINE=MyISAM;
3.2 建立全文索引
对于英文的索引,MySQL很早就已经支持,然而对于中文的索引,MySQL早版本并不是支持的,因此在很早的版本中一般使用插件mysqlcft,在MySQL5.7版本开始支持中文索引。
编辑my.ini文件
首先从windows服务中寻找my.ini的位置,如下图所示。
然后打开编辑如下:
[mysqld]ngram_token_size=2
修改表,增加全文索引
show create table paper;alter table paper add fulltext index ft_index(name) WITH PARSER ngram;show create table question;alter table question add fulltext index ft_index(html) WITH PARSER ngram;
3.3 查询应用
select name from paper where match(name) against('高中')select html from question where match(html) against('集合');
4. 附录
4.1 查看和删除索引
# 查看并删除索引SHOW CREATE TABLE paper;------------------------------------CREATE TABLE `paper` ( `id` varchar(36) NOT NULL COMMENT 'guid', `html` longtext, `subject` varchar(5) DEFAULT NULL COMMENT '学科:\n1,语文\n2,数学\n3,外语\n4,物理\n5,化学\n6,历史\n7,地理\n8,政治\n9,生物', `grade` varchar(5) DEFAULT NULL COMMENT '包括初一,初二,初三,中考,高一,高二,高三,高考', `name` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`), UNIQUE KEY `id_UNIQUE` (`id`), FULLTEXT KEY `subject` (`subject`,`grade`,`name`)) ENGINE=MyISAM DEFAULT CHARSET=utf8-------------------------------------------alter table paper drop index subject;SHOW CREATE TABLE question;-------------------------------------------CREATE TABLE `question` ( `id` varchar(36) NOT NULL, `html` text, `answer` text, `paper_id` varchar(36) NOT NULL, `answer_url` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`), FULLTEXT KEY `html` (`html`)) ENGINE=MyISAM DEFAULT CHARSET=utf8--------------------------------------------alter table question drop index html;
4.2 全文索引的搜索方式
主要包括三种:自然语言全文搜索、布尔全文搜索和查询扩展全文搜索。