本文的环境是Windows 10,MySQL版本是5.7.12-log
一、 基本使用
count的基本作用是有两个:
- 统计某个列的数据的数量;
- 统计结果集的行数;
用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况,比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。
示例表如下:
CREATE TABLE `NewTable` ( `id` int(11) NULL DEFAULT NULL , `name` varchar(30) NULL DEFAULT NULL , `country` varchar(50) NULL DEFAULT NULL , `province` varchar(30) NULL DEFAULT NULL , `city` varchar(30) NULL DEFAULT NULL )ENGINE=InnoDB
1.1 不计算NULL的值
如果有NULL值,在返回的结果中会被过滤掉
select count(country) from person;
返回结果如下:
如果满足条件的数据项不存在,则结构返回0,经常通过这种方式判断是否有满足条件的数据存在;返回的数据类型是bigint。
1.2 对count(*)的处理
count(*)的处理是有点不同的,它会返回所有数据的数量,但是不会过滤其中的NULL值,它也并不是相当于展开成所有的列,而是直接会忽略所有的列而直接统计所有的行数。语句如下:
select count(*) from person;
返回结果如下:
当想要返回所有的数据的数量的时候,但是又不想包括全部是NULL的列,使用count(*)是不可能做到的,但是在1.1中说到count作用于列的时候会过滤NULL,那么直接这么写是不是对?
select count(id, `name`, country, province, city) from person;
那就错了,count只能作用于单列,不能作用于多列 ,所以上面的写法是错误的。
另外针对count(*)语句,在MyISAM存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,比如InnoDB中,因为会涉及到多个事务;
1.3 对count(distinct …)的处理
count(distinct …)会返回彼此不同但是非NULL的数据的行数。这一点和只使用distinct是有区别的,因为distinct是不过滤NULL值的,详见MySQL中distinct的使用方法 。
- 如果没有符合条件的数据则返回0;
- 该语句可以作用于多列,是当各个列之间有一个不同,就认为整行数据不同,与distinct作用于多列时效果相同;
select count(DISTINCT country) from person;
返回结果如下:
但是对于count(*)和count(distinct )两者的结合,如下:
select count(DISTINCT *) from person;
该语句是错误的,无法执行,因此与select count(DISTINCT *) from person 还是有区别的。
二、 性能优化
通常情况下,count(*)操作需要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。
2.1 在数据库的层次上优化
2.1.1 针对count(*)
在MySQL内部已经针对count(*)进行了优化,使用explain查询如下:
EXPLAIN select count(*) from person;
从中可以看出该查询没有使用全表扫描也没有使用索引,甚至不需要查询数据表,在上面的示例数据库中得知,该库的存储引擎是InnoDB ,而且其中既没有主键也没有索引。
2.2 针对单个列进行count
查询如下:
EXPLAIN select count(country) from person where id > 2;
发现在没有主键和索引的情况下,对全表进行了扫描。在数据中避免大量扫描数据行,一个最直接的方法使用索引:
当对id设置为一般索引 :INDEX abc (id) USING BTREE 。
执行查询如下:
EXPLAIN select count(country) from person where id > 2;
结果如下:
此时发现并没有使用索引,仍然进行的是全表扫描,当执行如下时:
EXPLAIN select count(country) from person where id > 4;
结果如下:
这是使用了索引进行了范围查询,显然比上面的要好。
但是问题来了,为什么有时候使用索引,有时候不用索引?在上面的第一次查询中已经能够检测出可能的key但是并没有使用?如果有知道的大神给解读一下!
对id设置为主键,执行查询如下:
EXPLAIN select count(country) from person where id > 2;
结果如下:
2.2 在应用的层次上优化
在应用的层次上优化,可以考虑在系统架构中引入缓存子系统,比如在过去中常用的Memcached,或者现在非常流行的Redis, 但是这样会增加系统的复杂性。
mysql group by与聚合函数(sum,count等)实例
首先我们先来了解一下mysql聚合函数
mysql中一种特殊的函数:聚合函数,SUM, COUNT, MAX, MIN, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如:
SELECT SUM(score) FROM table
这个sql的意思是查询表table里面所有score列的总和。
接着我们通过一个实例来讲解group by语句中如何使用聚合函数。
book表如下:
id first_name last_name city 1 Jason Martin Toronto 2 Alison Mathews Vancouver 3 James Mathews Vancouver 4 Celia Rice Vancouver 5 David Larry New York
现在我们要对city进行分组查询,并获取每个分组有多少条数据,我们需要count聚合函数。
SELECT *,count(*) FROM book GROUP BY city
结果为:
id first_name last_name city count(*) 1 Jason Martin Toronto 1 2 Alison Mathews Vancouver 3 5 David Larry New York 1
先以city把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]