您的位置:首页 > 数据库 > MySQL

MySQL必知必会:使用WHERE、正则表达式、通配符过滤数据

2020-08-30 10:45 1416 查看

在SELECT语句中,数据根据

WHERE
子句中指定的搜索条件进行过滤。

mysql> select prod_name,prod_price from products where prod_price = 2.50;   # 价格等于2.50的产品名、产品价格
+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| Carrots       | 2.50       |
| TNT (1 stick) | 2.50       |
+---------------+------------+
2 rows in set (0.04 sec)
  • 建议使用SQL语句进行过滤:数据在应用层过滤,SQL的SELECT语句为客户机应用检索出超过实际所需的数据,然后客户机代码对返回数据进行循环,以提取出需要的行。通常,这种实现并不令人满意。因此,对数据库进行了优化,以便快速有效地对数据进行过滤。让客户机应用(或开发语言)处理数据库的工作将会极大地影响应用的性能,并且使所创建的应用完全不具备可伸缩性。此外,如果在客户机上过滤数据,服务器不得不通过网络发送多余的数据,这将导致网络带宽的浪费。
  • 在同时使用ORDER BY和WHERE子句时,应该让ORDER BY位于WHERE之后。

一,WHERE子句操作符

  • = 等于
  • <> 不等于
  • != 不等于
  • < 小于
  • <= 小于等于
  • > 大于
  • >= 大于等于
  • BETWEEN 在指定的两个值之间

1,检查单个值:

mysql> select prod_name,prod_price from products where prod_name = "fuses";  # 默认不区分大小写
+-----------+------------+
| prod_name | prod_price |
+-----------+------------+
| Fuses     | 3.42       |
+-----------+------------+
1 row in set (0.03 sec)

mysql> select prod_name,prod_price from products where prod_price < 10; # 价格小于10的产品名、产品价格
+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| .5 ton anvil  | 5.99       |
| 1 ton anvil   | 9.99       |
| Carrots       | 2.50       |
| Fuses         | 3.42       |
| Oil can       | 8.99       |
| Sling         | 4.49       |
| TNT (1 stick) | 2.50       |
+---------------+------------+
7 rows in set (0.04 sec)

mysql> select prod_name,prod_price from products where prod_price <=10; # 价格小于等于10的产品名、产品价格
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| .5 ton anvil   | 5.99       |
| 1 ton anvil    | 9.99       |
| Bird seed      | 10.00      |
| Carrots        | 2.50       |
| Fuses          | 3.42       |
| Oil can        | 8.99       |
| Sling          | 4.49       |
| TNT (1 stick)  | 2.50       |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
9 rows in set (0.03 sec)

2,不匹配检查:

mysql> select vend_id,prod_name from products where vend_id <> 1003; # 检索不是由1003供应商制造的所有产品
+---------+--------------+
| vend_id | prod_name    |
+---------+--------------+
|    1001 | .5 ton anvil |
|    1001 | 1 ton anvil  |
|    1001 | 2 ton anvil  |
|    1002 | Fuses        |
|    1002 | Oil can      |
|    1005 | JetPack 1000 |
|    1005 | JetPack 2000 |
+---------+--------------+
7 rows in set (0.05 sec)

3,范围值检查:

mysql> select prod_name,prod_price from products where prod_price between 5 and 10; # 价格 大于等于5,小于等于10 的产品名、产品价格
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| .5 ton anvil   | 5.99       |
| 1 ton anvil    | 9.99       |
| Bird seed      | 10.00      |
| Oil can        | 8.99       |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
5 rows in set (0.03 sec)
  • BETWEEN AND
    匹配范围中所有的值,包括指定的开始值和结束值。

4,空值检查:

在一个列不包含值时,称其为包含空值NULL,使用

IS NULL
子句进行检查。

mysql> select prod_name from products where prod_price is null;  # 返回prod_price为空值null的prod_name,无对应数据
Empty set

mysql> select cust_id from customers where cust_email is null; # 检索cust_email为空值时的cust_id
+---------+
| cust_id |
+---------+
|   10002 |
|   10005 |
+---------+
2 rows in set (0.04 sec)
  • 在通过过滤选择出不具有特定值的行时,你可能希望返回具有NULL值的行。但是,不行。因为未知具有特殊的含义,数据库不知道它们是否匹配,所以在匹配过滤或不匹配过滤时不返回它们。因此,在过滤数据时,一定要验证返回数据中确实给出了被过滤列具有NULL的行。

二,组合WHERE子句

操作符(operator) 用来联结或改变WHERE子句中的子句的关键字。也称为逻辑操作符( logical operator) 。为了进行更强的过滤控制, MySQL允许给出多个WHERE子句。

1,AND操作符:

AND
指示DBMS只返回满足所有给定条件的行。

mysql> select vend_id,prod_price,prod_name from products
where vend_id = 1003 and prod_price <= 10; #检索由供应商1003制造且价格小于等于10美元的产品信息
+---------+------------+----------------+
| vend_id | prod_price | prod_name      |
+---------+------------+----------------+
|    1003 | 10.00      | Bird seed      |
|    1003 | 2.50       | Carrots        |
|    1003 | 4.49       | Sling          |
|    1003 | 2.50       | TNT (1 stick)  |
|    1003 | 10.00      | TNT (5 sticks) |
+---------+------------+----------------+
5 rows in set (0.13 sec)
  • 把两个过滤条件组合在一起。还可以添加多个过滤条件,每添加一条就要使用一个AND。

2,OR操作符:

OR
指示MySQL检索匹配任一条件的行。

mysql> select prod_name,prod_price from products
where vend_id = 1002 or vend_id = 1003; # 检索由任一个指定供应商制造的所有产品的产品信息
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Fuses          | 3.42       |
| Oil can        | 8.99       |
| Detonator      | 13.00      |
| Bird seed      | 10.00      |
| Carrots        | 2.50       |
| Safe           | 50.00      |
| Sling          | 4.49       |
| TNT (1 stick)  | 2.50       |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
9 rows in set (0.06 sec)

3,AND与OR的使用顺序的问题:

WHERE可包含任意数目的AND和OR操作符。允许两者结合以进行复杂和高级的过滤。
但是,组合AND和OR带来了一个有趣的问题:

mysql> # 优先计算and,查找vend_id为1003且价格>=10的产品,或者vend_id为1002的产品,不管价格如何
select prod_name,prod_price from products
where vend_id = 1002 or vend_id = 1003 and prod_price >= 10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Fuses          | 3.42       |
| Oil can        | 8.99       |
| Detonator      | 13.00      |
| Bird seed      | 10.00      |
| Safe           | 50.00      |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
6 rows in set (0.03 sec)
  • 返回的行未按预期的进行过滤。为什么会这样呢?由于AND在计算次序中优先级更高,操作符被错误地组合了。

此问题的解决方法是使用圆括号明确地分组相应的操作符:

mysql> # 使用圆括号明确运算顺序:查找vend_id为1002或1003,且价格>=10的产品
select prod_name,prod_price from products
where (vend_id = 1002 or vend_id = 1003) and prod_price >= 10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      | 13.00      |
| Bird seed      | 10.00      |
| Safe           | 50.00      |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
4 rows in set (0.03 sec)
  • 任何时候使用具有AND和OR操作符的WHERE子句,都应该使用圆括号明确地分组操作符。不要过分依赖默认计算次序,即使它确实是你想要的东西也是如此。使用圆括号没有什么坏处,它能消除歧义。

4,IN操作符:

圆括号在WHERE子句中还有另外一种用法。

IN
操作符用来指定条件范围,范围中的每个条件都可以进行匹配。

mysql> # IN操作符后跟由逗号分隔的合法值清单,整个清单必须括在圆括号
select prod_name,prod_price from products
where vend_id in (1002,1003) order by prod_name;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Bird seed      | 10.00      |
| Carrots        | 2.50       |
| Detonator      | 13.00      |
| Fuses          | 3.42       |
| Oil can        | 8.99       |
| Safe           | 50.00      |
| Sling          | 4.49       |
| TNT (1 stick)  | 2.50       |
| TNT (5 sticks) | 10.00      |
+----------------+------------+
9 rows in set (0.17 sec)
  • IN操作符完成与OR相同的功能,但是:
    在使用长的合法选项清单时, IN操作符的语法更清楚且更直观;
    在使用IN时,计算的次序更容易管理(因为使用的操作符更少);
    IN操作符一般比OR操作符清单执行更快;
    IN的最大优点是可以包含其他SELECT语句,使得能够更动态地建立WHERE子句;

5,NOT操作符:

NOT
否定它之后所跟的任何条件。

mysql> # 列出1002和1003之外的供应商生产的产品
select prod_name,prod_price from products
where vend_id not in (1002,1003) order by prod_name;
+--------------+------------+
| prod_name    | prod_price |
+--------------+------------+
| .5 ton anvil | 5.99       |
| 1 ton anvil  | 9.99       |
| 2 ton anvil  | 14.99      |
| JetPack 1000 | 35.00      |
| JetPack 2000 | 55.00      |
+--------------+------------+
5 rows in set (0.09 sec)
  • 在与IN操作符联合使用时, NOT使找出与条件列表不匹配的行非常简单。
  • MySQL 支 持 使 用 NOT 对 IN 、 BETWEEN 和EXISTS子句取反,这与多数其他DBMS允许使用NOT对各种条件取反有很大的差别。

三,用通配符进行过滤

前面介绍的所有操作符都是针对已知值进行过滤的,共同点是过滤中使用的值都是已知的。但是,这种过滤方法并不是任何时候都好用。利用通配符就可创建比较特定数据的搜索模式。

1,要使用LIKE操作符:

为在搜索子句中使用通配符,必须使用

LIKE
操作符。 LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。

2,百分号( %)通配符:

%
表示任何字符出现任意次数。

mysql> # 找到所有以词jet起头的产品
select prod_id,prod_name from products where prod_name like "jet%";
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| JP1000  | JetPack 1000 |
| JP2000  | JetPack 2000 |
+---------+--------------+
2 rows in set (0.07 sec)
  • 根据MySQL的配置方式,搜索可以是区分大小写的。

通配符可在搜索模式中任意位置使用,并且可以使用多个通配符:

mysql> # 比如下方出现在头尾两处 ,匹配任意位置包含文本anvil的值
select prod_id,prod_name from products where prod_name like "%anvil%";
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| ANV01   | .5 ton anvil |
| ANV02   | 1 ton anvil  |
| ANV03   | 2 ton anvil  |
+---------+--------------+
3 rows in set (0.03 sec)

通配符也可以出现在搜索模式的中间,虽然这样做不太有用:

mysql> # 比如下方出现在搜索模式的中间,匹配所有以s开头e结尾的值
select prod_name from products where prod_name like "s%e";
+-----------+
| prod_name |
+-----------+
| Safe      |
+-----------+
1 row in set (0.03 sec)
  • 除了一个或多个字符外, %还能匹配0个字符。 %代表搜索模式中给定位置的0个、 1个或多个字符。
  • 尾空格可能会干扰通配符匹配,解决这个问题的一个简单的办法是在搜索模式最后附加一个%。一个更好的办法是使用函数去掉首尾空格。
  • 虽然似乎%通配符可以匹配任何东西,但有一个例外,即NULL。即使是WHERE prod_name LIKE '%'也不能匹配用值NULL作为产品名的行。

3,下划线(_)通配符:

下划线
只匹配单个字符。

mysql> # 下划线 _ 通配符 :匹配一个字符,不能多不能少
select prod_id,prod_name from products
where prod_name like "_ ton anvil";
+---------+-------------+
| prod_id | prod_name   |
+---------+-------------+
| ANV02   | 1 ton anvil |
| ANV03   | 2 ton anvil |
+---------+-------------+
2 rows in set (0.04 sec)

4,使用通配符的技巧:

通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一
些使用通配符要记住的技巧:

  • 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符。
  • 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
  • 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。

四,WHERE子句内使用正则表达式

对于基本的过滤(或者甚至是某些不那么基本的过滤),用匹配、比较和通配操作符寻找数据这样就足够了。但随着过滤条件的复杂性的增加, HERE子句本身的复杂性也有必要增加。
这也就是

正则表达式
变得有用的地方。正则表达式是用来匹配文本的特殊的串(字符集合)。

1,基本字符匹配:

mysql> select prod_name from products where prod_name regexp "1000";
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
+--------------+
1 row in set (0.15 sec)

mysql> select prod_name from products where prod_name regexp ".000";
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.07 sec)
  • REGEXP后所跟的东西作为正则表达式。
  • MySQL中的正则表达式匹配(自版本3.23.4后)不区分大小写。为区分大小写,可使用BINARY关键字,如WHERE prod_name REGEXPBINARY ‘JetPack .000’。

2,进行OR匹配:

使用 |

mysql> -- 正则表达式的OR操作符: |
select prod_name from products where prod_name regexp "1000|2000" order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.04 sec)
  • 可以给出两个以上的OR条件。例如,'1000 | 2000 | 3000’将匹配1000或2000或3000。

3,匹配几个字符之一:

使用[ ]

mysql> select prod_name from products where prod_name regexp '[123] Ton' order by prod_name;  # [123]匹配单一字符:1或2或3
+-------------+
| prod_name   |
+-------------+
| 1 ton anvil |
| 2 ton anvil |
+-------------+
2 rows in set (0.03 sec)

mysql> select prod_name from products where prod_name regexp '[1|2|3] Ton' order by prod_name;  # [1|2|3]同[123],匹配单一字符:1或2或3
+-------------+
| prod_name   |
+-------------+
| 1 ton anvil |
| 2 ton anvil |
+-------------+
2 rows in set (0.04 sec)

mysql> select prod_name from products where prod_name regexp '[^123]' order by prod_name;  # 取反
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| Bird seed      |
| Carrots        |
| Detonator      |
| Fuses          |
| JetPack 1000   |
| JetPack 2000   |
| Oil can        |
| Safe           |
| Sling          |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
14 rows in set (0.03 sec)

4,匹配范围:

集合可用来定义要匹配的一个或多个字符。

mysql> select prod_name from products where prod_name regexp '[1-5] Ton' order by prod_name;  # [1-5]匹配1,2,3,4,5
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+
3 rows in set (0.03 sec)

5,匹配特殊字符:
为了匹配特殊字符,必须用\为前导。 \-表示查找-, \.表示查找.。
\也用来引用元字符。为了匹配反斜杠( \)字符本身,需要使用\\。

mysql> select vend_name from vendors where vend_name regexp "\\." order by vend_name; # ‘\\.'匹配字符.
+--------------+
| vend_name    |
+--------------+
| Furball Inc. |
+--------------+
1 row in set (0.12 sec)

6,匹配字符类:

可以使用预定义的字符集,称为字符类( character class)。
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\t])
[:cntrl:] ASCII控制字符( ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])

mysql> select prod_name from products where prod_name regexp '[:digit:]' order by prod_name; #[:digit:]匹配任意数字
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| JetPack 1000   |
| JetPack 2000   |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
7 rows in set (0.03 sec)

7,匹配多个实例:
有时需要对匹配的数目进行更强的控制,用正则表达式重复元字符来完成。

  • 0个或多个匹配
  • 1个或多个匹配(等于{1,})
    ? 0个或1个匹配(等于{0,1})
    {n} 指定数目的匹配
    {n,} 不少于指定数目的匹配
    {n,m} 匹配数目的范围( m不超过255)
mysql> select prod_name from products where prod_name regexp '\\([0-9] sticks?\\)'
order by prod_name;  # 返回了'TNT (1 stick)'和'TNT (5 sticks)'
+----------------+
| prod_name      |
+----------------+
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
2 rows in set (0.04 sec)

mysql> select prod_name from products where prod_name regexp '[[:digit:]]{4}'
order by prod_name;  # [[:digit:]]{4}匹配连在一起的任意4位数字
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.03 sec)

7,定位符:

匹配特定位置的文本:
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾
例如,如果你想找出以一个数(包括以小数点开始的数)开始的所有产品,怎么办?简单搜索[0-9\.](或[[:digit:]\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符,如下所示:

mysql> select prod_name from products where prod_name regexp '^[0-9\\.]' order by prod_name; #找出以一个数(包括以小数点开始的数)开始的所有产品
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+
3 rows in set (0.03 sec)
  • ^匹配串的开始。因此,^[0-9\\.]只在.或任意数字为串中第一个字符时才匹配它们。
  • ^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。
  • 通过用^开始每个表达式,用$结束每个表达式。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐