MySQL必知必会:使用WHERE、正则表达式、通配符过滤数据
在SELECT语句中,数据根据
WHERE子句中指定的搜索条件进行过滤。
mysql> select prod_name,prod_price from products where prod_price = 2.50; # 价格等于2.50的产品名、产品价格 +---------------+------------+ | prod_name | prod_price | +---------------+------------+ | Carrots | 2.50 | | TNT (1 stick) | 2.50 | +---------------+------------+ 2 rows in set (0.04 sec)
- 建议使用SQL语句进行过滤:数据在应用层过滤,SQL的SELECT语句为客户机应用检索出超过实际所需的数据,然后客户机代码对返回数据进行循环,以提取出需要的行。通常,这种实现并不令人满意。因此,对数据库进行了优化,以便快速有效地对数据进行过滤。让客户机应用(或开发语言)处理数据库的工作将会极大地影响应用的性能,并且使所创建的应用完全不具备可伸缩性。此外,如果在客户机上过滤数据,服务器不得不通过网络发送多余的数据,这将导致网络带宽的浪费。
- 在同时使用ORDER BY和WHERE子句时,应该让ORDER BY位于WHERE之后。
一,WHERE子句操作符
- = 等于
- <> 不等于
- != 不等于
- < 小于
- <= 小于等于
- > 大于
- >= 大于等于
- BETWEEN 在指定的两个值之间
1,检查单个值:
mysql> select prod_name,prod_price from products where prod_name = "fuses"; # 默认不区分大小写 +-----------+------------+ | prod_name | prod_price | +-----------+------------+ | Fuses | 3.42 | +-----------+------------+ 1 row in set (0.03 sec) mysql> select prod_name,prod_price from products where prod_price < 10; # 价格小于10的产品名、产品价格 +---------------+------------+ | prod_name | prod_price | +---------------+------------+ | .5 ton anvil | 5.99 | | 1 ton anvil | 9.99 | | Carrots | 2.50 | | Fuses | 3.42 | | Oil can | 8.99 | | Sling | 4.49 | | TNT (1 stick) | 2.50 | +---------------+------------+ 7 rows in set (0.04 sec) mysql> select prod_name,prod_price from products where prod_price <=10; # 价格小于等于10的产品名、产品价格 +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | .5 ton anvil | 5.99 | | 1 ton anvil | 9.99 | | Bird seed | 10.00 | | Carrots | 2.50 | | Fuses | 3.42 | | Oil can | 8.99 | | Sling | 4.49 | | TNT (1 stick) | 2.50 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 9 rows in set (0.03 sec)
2,不匹配检查:
mysql> select vend_id,prod_name from products where vend_id <> 1003; # 检索不是由1003供应商制造的所有产品 +---------+--------------+ | vend_id | prod_name | +---------+--------------+ | 1001 | .5 ton anvil | | 1001 | 1 ton anvil | | 1001 | 2 ton anvil | | 1002 | Fuses | | 1002 | Oil can | | 1005 | JetPack 1000 | | 1005 | JetPack 2000 | +---------+--------------+ 7 rows in set (0.05 sec)
3,范围值检查:
mysql> select prod_name,prod_price from products where prod_price between 5 and 10; # 价格 大于等于5,小于等于10 的产品名、产品价格 +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | .5 ton anvil | 5.99 | | 1 ton anvil | 9.99 | | Bird seed | 10.00 | | Oil can | 8.99 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 5 rows in set (0.03 sec)
BETWEEN AND
匹配范围中所有的值,包括指定的开始值和结束值。
4,空值检查:
在一个列不包含值时,称其为包含空值NULL,使用
IS NULL子句进行检查。
mysql> select prod_name from products where prod_price is null; # 返回prod_price为空值null的prod_name,无对应数据 Empty set mysql> select cust_id from customers where cust_email is null; # 检索cust_email为空值时的cust_id +---------+ | cust_id | +---------+ | 10002 | | 10005 | +---------+ 2 rows in set (0.04 sec)
- 在通过过滤选择出不具有特定值的行时,你可能希望返回具有NULL值的行。但是,不行。因为未知具有特殊的含义,数据库不知道它们是否匹配,所以在匹配过滤或不匹配过滤时不返回它们。因此,在过滤数据时,一定要验证返回数据中确实给出了被过滤列具有NULL的行。
二,组合WHERE子句
操作符(operator) 用来联结或改变WHERE子句中的子句的关键字。也称为逻辑操作符( logical operator) 。为了进行更强的过滤控制, MySQL允许给出多个WHERE子句。
1,AND操作符:
AND指示DBMS只返回满足所有给定条件的行。
mysql> select vend_id,prod_price,prod_name from products where vend_id = 1003 and prod_price <= 10; #检索由供应商1003制造且价格小于等于10美元的产品信息 +---------+------------+----------------+ | vend_id | prod_price | prod_name | +---------+------------+----------------+ | 1003 | 10.00 | Bird seed | | 1003 | 2.50 | Carrots | | 1003 | 4.49 | Sling | | 1003 | 2.50 | TNT (1 stick) | | 1003 | 10.00 | TNT (5 sticks) | +---------+------------+----------------+ 5 rows in set (0.13 sec)
- 把两个过滤条件组合在一起。还可以添加多个过滤条件,每添加一条就要使用一个AND。
2,OR操作符:
OR指示MySQL检索匹配任一条件的行。
mysql> select prod_name,prod_price from products where vend_id = 1002 or vend_id = 1003; # 检索由任一个指定供应商制造的所有产品的产品信息 +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | Fuses | 3.42 | | Oil can | 8.99 | | Detonator | 13.00 | | Bird seed | 10.00 | | Carrots | 2.50 | | Safe | 50.00 | | Sling | 4.49 | | TNT (1 stick) | 2.50 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 9 rows in set (0.06 sec)
3,AND与OR的使用顺序的问题:
WHERE可包含任意数目的AND和OR操作符。允许两者结合以进行复杂和高级的过滤。
但是,组合AND和OR带来了一个有趣的问题:
mysql> # 优先计算and,查找vend_id为1003且价格>=10的产品,或者vend_id为1002的产品,不管价格如何 select prod_name,prod_price from products where vend_id = 1002 or vend_id = 1003 and prod_price >= 10; +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | Fuses | 3.42 | | Oil can | 8.99 | | Detonator | 13.00 | | Bird seed | 10.00 | | Safe | 50.00 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 6 rows in set (0.03 sec)
- 返回的行未按预期的进行过滤。为什么会这样呢?由于AND在计算次序中优先级更高,操作符被错误地组合了。
此问题的解决方法是使用圆括号明确地分组相应的操作符:
mysql> # 使用圆括号明确运算顺序:查找vend_id为1002或1003,且价格>=10的产品 select prod_name,prod_price from products where (vend_id = 1002 or vend_id = 1003) and prod_price >= 10; +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | Detonator | 13.00 | | Bird seed | 10.00 | | Safe | 50.00 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 4 rows in set (0.03 sec)
- 任何时候使用具有AND和OR操作符的WHERE子句,都应该使用圆括号明确地分组操作符。不要过分依赖默认计算次序,即使它确实是你想要的东西也是如此。使用圆括号没有什么坏处,它能消除歧义。
4,IN操作符:
圆括号在WHERE子句中还有另外一种用法。
IN操作符用来指定条件范围,范围中的每个条件都可以进行匹配。
mysql> # IN操作符后跟由逗号分隔的合法值清单,整个清单必须括在圆括号 select prod_name,prod_price from products where vend_id in (1002,1003) order by prod_name; +----------------+------------+ | prod_name | prod_price | +----------------+------------+ | Bird seed | 10.00 | | Carrots | 2.50 | | Detonator | 13.00 | | Fuses | 3.42 | | Oil can | 8.99 | | Safe | 50.00 | | Sling | 4.49 | | TNT (1 stick) | 2.50 | | TNT (5 sticks) | 10.00 | +----------------+------------+ 9 rows in set (0.17 sec)
- IN操作符完成与OR相同的功能,但是:
在使用长的合法选项清单时, IN操作符的语法更清楚且更直观;
在使用IN时,计算的次序更容易管理(因为使用的操作符更少);
IN操作符一般比OR操作符清单执行更快;
IN的最大优点是可以包含其他SELECT语句,使得能够更动态地建立WHERE子句;
5,NOT操作符:
NOT否定它之后所跟的任何条件。
mysql> # 列出1002和1003之外的供应商生产的产品 select prod_name,prod_price from products where vend_id not in (1002,1003) order by prod_name; +--------------+------------+ | prod_name | prod_price | +--------------+------------+ | .5 ton anvil | 5.99 | | 1 ton anvil | 9.99 | | 2 ton anvil | 14.99 | | JetPack 1000 | 35.00 | | JetPack 2000 | 55.00 | +--------------+------------+ 5 rows in set (0.09 sec)
- 在与IN操作符联合使用时, NOT使找出与条件列表不匹配的行非常简单。
- MySQL 支 持 使 用 NOT 对 IN 、 BETWEEN 和EXISTS子句取反,这与多数其他DBMS允许使用NOT对各种条件取反有很大的差别。
三,用通配符进行过滤
前面介绍的所有操作符都是针对已知值进行过滤的,共同点是过滤中使用的值都是已知的。但是,这种过滤方法并不是任何时候都好用。利用通配符就可创建比较特定数据的搜索模式。
1,要使用LIKE操作符:
为在搜索子句中使用通配符,必须使用
LIKE操作符。 LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。
2,百分号( %)通配符:
%表示任何字符出现任意次数。
mysql> # 找到所有以词jet起头的产品 select prod_id,prod_name from products where prod_name like "jet%"; +---------+--------------+ | prod_id | prod_name | +---------+--------------+ | JP1000 | JetPack 1000 | | JP2000 | JetPack 2000 | +---------+--------------+ 2 rows in set (0.07 sec)
- 根据MySQL的配置方式,搜索可以是区分大小写的。
通配符可在搜索模式中任意位置使用,并且可以使用多个通配符:
mysql> # 比如下方出现在头尾两处 ,匹配任意位置包含文本anvil的值 select prod_id,prod_name from products where prod_name like "%anvil%"; +---------+--------------+ | prod_id | prod_name | +---------+--------------+ | ANV01 | .5 ton anvil | | ANV02 | 1 ton anvil | | ANV03 | 2 ton anvil | +---------+--------------+ 3 rows in set (0.03 sec)
通配符也可以出现在搜索模式的中间,虽然这样做不太有用:
mysql> # 比如下方出现在搜索模式的中间,匹配所有以s开头e结尾的值 select prod_name from products where prod_name like "s%e"; +-----------+ | prod_name | +-----------+ | Safe | +-----------+ 1 row in set (0.03 sec)
- 除了一个或多个字符外, %还能匹配0个字符。 %代表搜索模式中给定位置的0个、 1个或多个字符。
- 尾空格可能会干扰通配符匹配,解决这个问题的一个简单的办法是在搜索模式最后附加一个%。一个更好的办法是使用函数去掉首尾空格。
- 虽然似乎%通配符可以匹配任何东西,但有一个例外,即NULL。即使是WHERE prod_name LIKE '%'也不能匹配用值NULL作为产品名的行。
3,下划线(_)通配符:
下划线只匹配单个字符。
mysql> # 下划线 _ 通配符 :匹配一个字符,不能多不能少 select prod_id,prod_name from products where prod_name like "_ ton anvil"; +---------+-------------+ | prod_id | prod_name | +---------+-------------+ | ANV02 | 1 ton anvil | | ANV03 | 2 ton anvil | +---------+-------------+ 2 rows in set (0.04 sec)
4,使用通配符的技巧:
通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一
些使用通配符要记住的技巧:
- 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符。
- 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
- 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。
四,WHERE子句内使用正则表达式
对于基本的过滤(或者甚至是某些不那么基本的过滤),用匹配、比较和通配操作符寻找数据这样就足够了。但随着过滤条件的复杂性的增加, HERE子句本身的复杂性也有必要增加。
这也就是
正则表达式变得有用的地方。正则表达式是用来匹配文本的特殊的串(字符集合)。
1,基本字符匹配:
mysql> select prod_name from products where prod_name regexp "1000"; +--------------+ | prod_name | +--------------+ | JetPack 1000 | +--------------+ 1 row in set (0.15 sec) mysql> select prod_name from products where prod_name regexp ".000"; +--------------+ | prod_name | +--------------+ | JetPack 1000 | | JetPack 2000 | +--------------+ 2 rows in set (0.07 sec)
- REGEXP后所跟的东西作为正则表达式。
- MySQL中的正则表达式匹配(自版本3.23.4后)不区分大小写。为区分大小写,可使用BINARY关键字,如WHERE prod_name REGEXPBINARY ‘JetPack .000’。
2,进行OR匹配:
使用 |
mysql> -- 正则表达式的OR操作符: | select prod_name from products where prod_name regexp "1000|2000" order by prod_name; +--------------+ | prod_name | +--------------+ | JetPack 1000 | | JetPack 2000 | +--------------+ 2 rows in set (0.04 sec)
- 可以给出两个以上的OR条件。例如,'1000 | 2000 | 3000’将匹配1000或2000或3000。
3,匹配几个字符之一:
使用[ ]
mysql> select prod_name from products where prod_name regexp '[123] Ton' order by prod_name; # [123]匹配单一字符:1或2或3 +-------------+ | prod_name | +-------------+ | 1 ton anvil | | 2 ton anvil | +-------------+ 2 rows in set (0.03 sec) mysql> select prod_name from products where prod_name regexp '[1|2|3] Ton' order by prod_name; # [1|2|3]同[123],匹配单一字符:1或2或3 +-------------+ | prod_name | +-------------+ | 1 ton anvil | | 2 ton anvil | +-------------+ 2 rows in set (0.04 sec) mysql> select prod_name from products where prod_name regexp '[^123]' order by prod_name; # 取反 +----------------+ | prod_name | +----------------+ | .5 ton anvil | | 1 ton anvil | | 2 ton anvil | | Bird seed | | Carrots | | Detonator | | Fuses | | JetPack 1000 | | JetPack 2000 | | Oil can | | Safe | | Sling | | TNT (1 stick) | | TNT (5 sticks) | +----------------+ 14 rows in set (0.03 sec)
4,匹配范围:
集合可用来定义要匹配的一个或多个字符。
mysql> select prod_name from products where prod_name regexp '[1-5] Ton' order by prod_name; # [1-5]匹配1,2,3,4,5 +--------------+ | prod_name | +--------------+ | .5 ton anvil | | 1 ton anvil | | 2 ton anvil | +--------------+ 3 rows in set (0.03 sec)
5,匹配特殊字符:
为了匹配特殊字符,必须用\为前导。 \-表示查找-, \.表示查找.。
\也用来引用元字符。为了匹配反斜杠( \)字符本身,需要使用\\。
mysql> select vend_name from vendors where vend_name regexp "\\." order by vend_name; # ‘\\.'匹配字符. +--------------+ | vend_name | +--------------+ | Furball Inc. | +--------------+ 1 row in set (0.12 sec)
6,匹配字符类:
可以使用预定义的字符集,称为字符类( character class)。
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\t])
[:cntrl:] ASCII控制字符( ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])
mysql> select prod_name from products where prod_name regexp '[:digit:]' order by prod_name; #[:digit:]匹配任意数字 +----------------+ | prod_name | +----------------+ | .5 ton anvil | | 1 ton anvil | | 2 ton anvil | | JetPack 1000 | | JetPack 2000 | | TNT (1 stick) | | TNT (5 sticks) | +----------------+ 7 rows in set (0.03 sec)
7,匹配多个实例:
有时需要对匹配的数目进行更强的控制,用正则表达式重复元字符来完成。
- 0个或多个匹配
- 1个或多个匹配(等于{1,})
? 0个或1个匹配(等于{0,1})
{n} 指定数目的匹配
{n,} 不少于指定数目的匹配
{n,m} 匹配数目的范围( m不超过255)
mysql> select prod_name from products where prod_name regexp '\\([0-9] sticks?\\)' order by prod_name; # 返回了'TNT (1 stick)'和'TNT (5 sticks)' +----------------+ | prod_name | +----------------+ | TNT (1 stick) | | TNT (5 sticks) | +----------------+ 2 rows in set (0.04 sec) mysql> select prod_name from products where prod_name regexp '[[:digit:]]{4}' order by prod_name; # [[:digit:]]{4}匹配连在一起的任意4位数字 +--------------+ | prod_name | +--------------+ | JetPack 1000 | | JetPack 2000 | +--------------+ 2 rows in set (0.03 sec)
7,定位符:
匹配特定位置的文本:
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾
例如,如果你想找出以一个数(包括以小数点开始的数)开始的所有产品,怎么办?简单搜索[0-9\.](或[[:digit:]\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符,如下所示:
mysql> select prod_name from products where prod_name regexp '^[0-9\\.]' order by prod_name; #找出以一个数(包括以小数点开始的数)开始的所有产品 +--------------+ | prod_name | +--------------+ | .5 ton anvil | | 1 ton anvil | | 2 ton anvil | +--------------+ 3 rows in set (0.03 sec)
- ^匹配串的开始。因此,^[0-9\\.]只在.或任意数字为串中第一个字符时才匹配它们。
- ^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。
- 通过用^开始每个表达式,用$结束每个表达式。
- MySQL数据库——用通配符和正则表达式过滤数据(一)
- jquery下载地址:https://code.jquery.com/jquery/ 影响范围: 版本低于1.7的jQuery过滤用户输入数据所使用的正则表达式存在缺陷,可能导致LOCA
- MYSQL必知必会读书笔记 第九章 使用正则表达式过滤数据
- WHERE子句使用正则表达式进行搜索过滤
- MySQL数据库——用通配符和正则表达式过滤数据(二)
- 版本低于1.7的jQuery过滤用户输入数据所使用的正则表达式存在缺陷
- 在C#中使用正则表达式自动匹配并获取所需要的数据
- 使用java正则表达式过滤HTML ,获取<body>标签中的内容解决思路
- 如何使用JavaScript和正则表达式进行数据验证
- Visual Studio“查找和替换”窗口"快速替换"使用正则表达式和通配符.快速智能高效替换.可用的通配符和表达式
- 在LogCat中使用正则表达式过滤系统输出的多余信息
- awk 系列:如何使用 awk 和正则表达式过滤文本或文件中的字符串
- 使用正则表达式进行xml数据验证
- 使用flex 做关键词、正则表达式过滤
- 正则表达式过滤文本,replace的使用
- 如何使用JavaScript和正则表达式进行数据验证
- 使用正则表达式,从网站上获取指定数据
- 【MySQL】 SELECT语句 检索 排序 过滤 通配符搜索 正则表达式搜索
- MySQL必知必会笔记(二)SELECT语句 检索 排序 过滤 通配符搜索 正则表达式搜索
- Code Fragment-使用正则表达式表示过滤