mysql distinct 使用实例(过滤多余的重复记录)

时间:2016-06-01
mysql distinct语句用于查询多条不重复记录值(去重、过滤多余的重复记录),本文章向码农介绍mysql distinct语句的使用方法和技巧,需要的朋友可以参考一下 mysql distinct的用法实例。

MySQL的DISTINCT的关键字的一些用法:

首先给出本文章需要使用到的表数据:

mysql> select * from Employee;
+------+-------------+
| id   | description |
+------+-------------+
|    1 | Programmer  |
|    2 | Tester      |
|    3 | Tester      |
|    4 | Manager     |
|    5 | Tester      |
|    6 | Tester      |
|    7 | Manager     |
|    8 | Tester      |
+------+-------------+

1. 在count 不重复的记录的时候能用到,比如

SELECT COUNT( DISTINCT description) FROM tablename;

结果为:3

就是计算talbebname表中description不同的记录有多少条。

2. 在需要返回记录不同的description的具体值的时候可以用,比如

SELECT DISTINCT description FROM tablename;
结果为:
+-------------+
| description |
+-------------+
| Programmer  |
| Tester      |
| Manager     |
+-------------+

返回talbebname表中不同的description的具体的值。

3. 上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义,比如

SELECT DISTINCT id, description FROM tablename;
结果:
+------+-------------+
| id   | description |
+------+-------------+
|    1 | Programmer  |
|    2 | Tester      |
|    3 | Tester      |
|    4 | Manager     |
|    5 | Tester      |
|    6 | Tester      |
|    7 | Manager     |
|    8 | Tester      |
+------+-------------+

实际上返回的是 id与description同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得id与description都相同的才被排除了,与我们期望的结果不一样。

4.这时候可以考虑使用group_concat函数来进行排除,不过这个mysql函数是在mysql4.1以上才支持的。

5.其实还有另外一种解决方式,就是使用,

SELECT id, description, COUNT( DISTINCT description ) as c
FROM tablename
GROUP BY description

结果:
+------+-------------+-------------+
| id   | description |      c      |
+------+-------------+-------------+
|    4 | Manager     |      1      |
|    1 | Programmer  |      1      |
|    2 | Tester      |      1      |
+------+-------------+-------------+

虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据),返回的结果是只有description不同的所有结果和上面的4类型可以互补使用,就是看你需要什么样的数据了。

DISTINCT的效率:

SELECT id, description, COUNT( DISTINCT description ) as c
FROM tablename
GROUP BY description

虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据),

SELECT id, description
FROM tablename
GROUP BY description

这样貌似也可以,用distinct的时候,如果它有索引,mysql会把它转成group by的方式执行。