工作过程中会遇到比较多关于隐式转换的案例,隐式转换除了会导致慢查询,还会导致数据不准。本文通过几个生产中遇到的案例来。
基础知识
关于比较运算的原则,MySQL官方文档的描述: https://dev.mysql.com/doc/refman/5.6/en/type-conversion.html
如果 判断符号左右两边有一个为NULL,结果就是null,除非使用安全的等值判断 <=>
(none) 05:17:16 >select null = null; +-------------+ | null = null | +-------------+ | NULL | +-------------+ 1 row in set (0.00 sec) (none) 05:34:59 >select null <=> null; +---------------+ | null <=> null | +---------------+ | 1 | +---------------+ 1 row in set (0.00 sec) (none) 05:35:51 >select null != 1; +-----------+ | null != 1 | +-----------+ | NULL | +-----------+ 1 row in set (0.00 sec)
如何判断左右两边都是相同类型的,比如都是字符串,则以字符串进行对比。如果是数字,则以数字进行比较。
注意 对于比较常见的 字符串与数字类型的比较的情况,如果字符串字段是索引字段,那么MySQL 无法通过索引进行查找数据,比如以下例子:
(none) 05:39:42 >select 1='1'; +-------+ | 1='1' | +-------+ | 1 | +-------+ 1 row in set (0.00 sec) (none) 05:39:44 >select 1='1A'; +--------+ | 1='1A' | +--------+ | 1 | +--------+ 1 row in set, 1 warning (0.00 sec) (none) 05:39:47 >select 1='1 '; ##1后有空格 +--------+ | 1='1 ' | +--------+ | 1 | +--------+ 1 row in set (0.00 sec)
MySQL 认为数字1 与'1','1_','1A' 相等,故无法通过索引二分查找准确定位到具体的值。
Hexadecimal(十六进制)以二进制字符串的方式进行比较。
如何判断符号左边是 timestamp 或者datetime类型的,右边是常量,在比较之前,常量会被转换为时间类型。
隐式转换
字段类型不一样
In all other cases, the arguments are compared as floating-point (real) numbers.
除了以上的其他类型的比较,系统将字段和参数转换为浮点型进行比较。使用浮点数(或转换为浮点数的值)的比较是近似的,因为这样的数字是不精确的。看下面2个例子
>select '190325171202362933' = 190325171202362931; +-------------------------------------------+ | '190325171202362933' = 190325171202362931 | +-------------------------------------------+ | 1 | +-------------------------------------------+ 1 row in set (0.00 sec) >select '190325171202362936' = 190325171202362931; +-------------------------------------------+ | '190325171202362936' = 190325171202362931 | +-------------------------------------------+ | 1 | +-------------------------------------------+ 1 row in set (0.00 sec)
直观上不相等的值,做等值判断之后竟然返回为1。这样带来2个问题不能利用索引且结果数据不准
>select '190325171202362931'+0.0; +--------------------------+ | '190325171202362931'+0.0 | +--------------------------+ | 1.9032517120236294e17 | +--------------------------+ 1 row in set (0.00 sec) >select '190325171202362936'+0.0; +--------------------------+ | '190325171202362936'+0.0 | +--------------------------+ | 1.9032517120236294e17 | +--------------------------+ 1 row in set (0.00 sec)
将上面的值转换为浮点数,都是 1.9032517120236294e17,所以判断相等时为真,返回True。
in 参数包含多个类型
具体的案例参考之前的一篇文章MySQL优化案例一则 ,where 条件 in 集合里面的数据类型不一样,执行计划未利用到索引
淘宝MySQL月报(http://mysql.taobao.org/monthly/2017/12/06/ )里面有一篇正好和这个一样的案例,推荐给大家 简单说,就是在IN的入口有一个判断, 如果in中的字段类型不兼容, 则认为不可使用索引.
而这个arg_types_compatible 的赋值逻辑是:
if (type_cnt == 1) arg_types_compatible = TRUE;
也就是说,当IN列表中出现超过一个字段类型时, 就认为类型不兼容,从而不能利用索引。
字符集类型不一致
环境准备:
CREATE TABLE `t1` ( `id` int(11) NOT NULL AUTO_INCREMENT, `c1` varchar(20) DEFAULT NULL, `c2` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_c1` (`c1`), KEY `idx_c2` (`c2`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8; CREATE TABLE `t2` ( `id` int(11) NOT NULL AUTO_INCREMENT, `c1` varchar(20) DEFAULT NULL, `c2` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_c1` (`c1`), KEY `idx_c2` (`c2`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4; insert into t1(c1,c2) values('a','a'),('b','b'),('c','c'), ('d','d'),('e','e'); insert into t2(c1,c2) values('a','a'),('b','b'),('c','c'), ('d','d'),('e','e');
测试结果
小结
希望通过以上案例,基础知识介绍,开发同学能少走弯路,在开发编写sql的阶段一定要明确字段的类型,尤其是看起来像数字类型的id,xxxid,xxxno 这类字段,实际上可能是字符类型。
以上就是谈谈MySQL中的隐式转换的详细内容,更多关于MySQL 隐式转换的资料请关注其它相关文章!
更新日志
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]