当前位置:首页 » 编程语言 » 正则表达式匹配sql

正则表达式匹配sql

发布时间: 2024-06-18 01:21:06

数据库笔记-sql过滤(LIKE&正则表达式)

查询语句:

结果:

查询语句:

结果:

查询语句:

结果:

查询语句:

正则表达式 [32]1,[32]定义一组字符,它的意思是匹配 3 或匹配 2,也就是“31”或者 “21”都算是匹配的。

结果:

查询语句:

结果:

如果要匹配特殊字符的,需要加上前导“”,“-”表示查找“-”,“.”表示查找“.”
这种就是 “转义(escaping)” ,在正则表达式里,本身有意义的字符,比如“.”是匹配任意字符的意思。那如果要匹配它,需要转义。
注意:在 MySQL 里,是比其他的正则表达式多一个“”的,就是“”。

趣味提问:

如何匹配“”?
答案:“\”

\([0-9] sticks?\) 匹配的是(NUM stick)或者(NUM sticks)。s后的 ? 使得s可选。

重复元字符

* 是 0 个或多个匹配
? 是 1 个或多个匹配
{n} 是指定n个匹配
{n,} 是 不少于 n 个匹配
{n,m} 是 指定匹配的范围,m不超过 255

查询语句:

^值的是字符串的开始,$是字符串的结尾。

这就是 REGEXP 与 LIKE 类似,但是它独特的好处:可以通过“定位符”只匹配“子字符串”。

结果:

⑵ sql 实现正则表达式

没有正则表达式LIKE

确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配。然而,可使用字符串的任意片段匹配通配符。与使用 = 和 != 字符串比较运算符相比,使用通配符可使 LIKE 运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft® SQL Server™ 会将其转换成字符串数据类型(如果可能)。

语法
match_expression [ NOT ] LIKE pattern [ ESCAPE escape_character ]

参数
match_expression 任何字符串数据类型的有效 SQL Server 表达式。
patternmatch_expression 中的搜索模式,可以包含下列有效 SQL Server 通配符

1 % 包含零个或更多字符的任意字符串
示例:WHERE title LIKE '%computer% ' 将查找处于书名任意位置的包含单词 computer 的所有书名。

2 _(下划线) 任何单个字符
示例:WHERE au_fname LIKE '_ean ' 将查找以 ean 结尾的所有 4 个字母的名字(Dean、Sean 等)。

3 [] 指定范围中的任何单个字符
示例:WHERE au_lname LIKE '[C-P]arsen ' 将查找以arsen 结尾且以介于 C 与 P 之间的任何单个字符开始的 作者姓氏,例如,Carsen、Larsen、Karsen 等

4 [^] 不属于指定范围中的任何单个字符,与 [] 相反
示例:WHERE au_lname LIKE 'de[^l]% ' 将查找以 de 开始且其后的字母不为 l 的所有作者的姓氏。

一 使用 like 的模式匹配:
在搜索Datetime类型时,建议使用like .
LIKE 支持 ASCII 模式匹配和 Unicode 模式匹配。当所有参数,包括 match_expression、pattern 和 escape_character(如果有)都是 ASCII 字符数据类型时,将执行 ASCII 模式匹配。如果其中任何参数属于 Unicode 数据类型,则所有参数将被转换为 Unicode 并执行 Unicode 模式匹配。当对 Unicode 数据(nchar 或 nvarchar 数据类型)使用 LIKE 时,尾随空格是有意义的。但是对于非 Unicode 数据,尾随空格没有意义。Unicode LIKE 与 SQL-92 标准兼容。ASCII LIKE 与 SQL Server 的早期版本兼容

二 使用 % 通配符

例如,此查询将显示数据库中所有的系统表,因为它们都以字母 sys 开始:
SELECT TABLE_NAME
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME LIKE 'sys% '
若要查阅非系统表的所有对象,请使用 NOT LIKE 'sys% '。如果共有 32 个对象且 LIKE 找到 13 个与模式匹配的名称,则 NOT LIKE 将找到 19 个与 LIKE 模式不匹配的对象

三 使用escape字句的模式匹配

可搜索包含一个或多个特殊通配符的字符串。例如,customers 数据库中的 discounts 表可能存储含百分号 (%) 的折扣值。若要搜索作为字符而不是通配符的百分号,必须提供 ESCAPE 关键字和转义符。例如,一个样本数据库包含名为 comment 的列,该列含文本 30%。若要搜索在 comment 列中的任何位置包含字符串 30% 的任何行,请指定由 WHERE comment LIKE '%30!%% ' ESCAPE '! ' 组成的 WHERE 子句。如果不指定 ESCAPE 和转义符,SQL Server 将返回所有含字符串 30 的行。

下例使用 ESCAPE 子句和转义符查找 mytbl2 表的 c1 列中的精确字符串 10-15%

USE pubs
GO
IF EXISTS(SELECT TABLE_NAME FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME = 'mytbl2 ')
DROP TABLE mytbl2
GO
USE pubs
GO
CREATE TABLE mytbl2
(
c1 sysname
)
GO
INSERT mytbl2 VALUES ( 'Discount is 10-15% off ')
INSERT mytbl2 VALUES ( 'Discount is .10-.15 off ')
GO
SELECT c1
FROM mytbl2
WHERE c1 LIKE '%10-15!% off% ' ESCAPE '! '
GO

四 使用 [] 通配符

下例查找姓为 Carson、Carsen、Karson 或 Karsen 的作者所在的行。
USE pubs
SELECT au_lname, au_fname, phone
FROM authors
WHERE au_lname LIKE '[CK]ars[eo]n '
ORDER BY au_lname ASC, au_fname ASC

⑶ 在ms sql中如何使用正则表达式,请给出简单示例,注释越详细越好!感激不尽

MSSQL不支持正则表达式,可以用CLR实现。

1、新建一个MSSQL的数据库项目,配置到你的数据库中

2、在数据库项目中新建一个函数库,编写如下代码:

///<summary>

///验证是否符合正则表达式

///</summary>

[SqlFunction]

(stringinput,stringregex)

{

returnnewSqlBoolean(Regex.IsMatch(input,regex,RegexOptions.IgnoreCase));

}

然后在数据库项目上点击“右键”,选择“部署”

PS:此功能需要MSSQL2005或者以上版本支持

如果你使用的是.NET3.5版本的话,需要在数据库服务器上安装.netframework3.5

目前SQLSERVERCLR不支持.NET4.0,所以如果你使用VS2010开发的话需要把项目版本修改成为.NET2.0/3.5

使用方法:

SELECT*FROM[table]WHEREdbo.RegexIsMatch([ID],'^d+$')=1

⑷ 正则表达式 判断检测sql语句

publicstaticRegexrxColumns=newRegex(@"A(withs+(?:(?!as).)+s+as)?s*SELECTs+((?:((?>((?<depth>)|)(?<-depth>)|.?)*(?(depth)(?!)))|.)*?)(?<!,s+)FROM",RegexOptions.IgnoreCase|RegexOptions.Multiline|RegexOptions.Singleline|RegexOptions.Compiled);

⑸ SQL Server 2008 R2如何使用正则表达式搜索

正则表达式是简明而灵活的表示法,用于查找和替换各种模式的文本。在 SQL Server Management Studio 的“查找和替换”对话框中的“查找内容”字段中,可以使用一组特定的正则表达式。

使用正则表达式进行查找
1、若要在“快速查找”、“在文件中查找”、“快速替换”或 “在文件中替换” 操作过程中,在“查找内容”字段启用正则表达式,请在“查找选项”下选中“使用”,再选择“正则表达式”。
2、“查找内容”字段旁边的“引用列表”三角形按钮将变为可用状态。单击此按钮可显示一组最常用的正则表达式。如果选择了表达式生成器中的某个项,则可将该项插入“查找内容”字符串。

注意:

“查找内容”字符串中使用的正则表达式与 Microsoft .NET Framework 编程中的有效正则表达式相比,语法上存在差异。例如,在“查找和替换”对话框中,大括号 {} 用于表示带标记的表达式。所以,表达式“zo{1}”将匹配所有“zo”后带标记 1 的匹配项,如“Alonzo1”和“Gonzo1”。但在 .NET Framework 中,{} 符号用于表示量词。因此,表达式“zo{1}”将匹配所有“z”后跟一个“o”的匹配项,如匹配“zone”,但不匹配“zoo”。

下表对“引用列表”中提供的正则表达式进行了说明。

表达式

语法

说明

任何单个字符: . 匹配除换行符外的所有单一字符。
零个或更多:* 匹配零或更多前导表达式的匹配项,执行所有可能的匹配。
一个或更多:+ 匹配至少一个前导表达式的匹配项。
行首:^ 仅匹配行首位置的字符串。
行尾:$ 仅匹配行尾位置的字符串。
字首:< 仅匹配文本中以此开头的字。
字尾:> 仅匹配文本中以此结尾的字。
分行符:\n 匹配与平台无关的换行符。在替换表达式中,插入一个换行符。
在集合中的任何一个字符:[] 匹配 [] 中的任何一个字符。若要指定字符范围,请列出起始字符和结束字符,并用短划线 (-) 分隔,如 [a-z]。

不在集合中的任何一个字符:[^...] 匹配不在 ^ 之后的字符集中的任何一个字符。

或:| 匹配“或”符号 (|) 两旁的任一表达式。常用于组中。例如,(sponge|mud) bath 可以匹配“sponge bath”和“mud bath”。

Escape:\ 将反斜杠 (\) 后的字符作为文字匹配。此表达式允许您搜索正则表达式标记中使用的符号,如 { 和 ^。例如, \^ 可用于查找字符 ^。

标记表达式:{} 匹配用括起来的表达式内的文本。

C/C++ 标识符: :i 匹配表达式 ([a-zA-Z_$][a-zA-Z0-9_$]*)。

用引号括起来的字符串: :q 匹配表达式 (("[^"]*")|('[^']*'))。

空格或制表符: :b 匹配空格或制表符。

整数: :z 匹配表达式 ([0-9]+)。

“引用列表”中只列出了部分可在“查找和替换”操作中使用的正则表达式。还可以将下列任一正则表达式插入“查找内容”字符串:

表达式 语法 说明

最少 - 零个或更多:@ 匹配零个或更多前导表达式的匹配项,匹配尽可能少的字符。

最少 - 一个或更多: # 匹配一个或更多前导表达式的匹配项,匹配尽可能少的字符。

重复 n 次:^n 匹配前导表达式的 n 个匹配项。例如,[0-9]^4 匹配所有四位数序列。

分组:() 将子表达式分组

第 n 个标记文本:\n 在“查找或替换”表达式中,指示匹配第 n 个标记表达式的文本,其中 n 为 1 到 9 之间的数字。
在“替换”表达式中,\0 将插入完整的匹配文本。

右对齐字段:\(w,n) 在“替换”表达式中,在宽度至少为 w 个字符的字段中,右对齐第 n 个标记表达式。

左对齐字段:\(-w,n) 在“替换”表达式中,在宽度至少为 w 个字符的字段中,左对齐第 n 个标记表达式。

阻止匹配:~(X) 如果在表达式的此处出现 X,则阻止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,但不匹配“reality”中的“real”。

字母数字字符: :a 匹配表达式 ([a-zA-Z0-9])。

字母字符: :c 匹配表达式 ([a-zA-Z])。

十进制数字: :d 匹配表达式 ([0-9])。

十六进制数: :h 匹配表达式 ([0-9a-fA-F]+)。

有理数: :n 匹配表达式 (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+))。

字母字符串: :w 匹配表达式 ([a-zA-Z]+)。

Escape:\e Unicode U+001B。

响铃: \g Unicode U+0007。

Backspace: \h Unicode U+0008。

制表符: \t 匹配制表符,Unicode U+0009。

Unicode 字符:\x#### 或 \u#### 匹配由 Unicode 值确定的字符,其中 #### 为十六进制数字。可以使用 ISO 10646 码位或给出代理项对值的两个 Unicode 码位,指定基本多语言面(即代理项)以外的字符。

下表列出了按标准 Unicode 字符属性匹配时的语法。双字母缩写和 Unicode 字符属性数据库中列出的缩写相同。可以将这些缩写指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何数字。

表达式 语法 说明

大写字母
:Lu
匹配任何单个大写字母。例如,:Luhe 匹配“The”,但不匹配“the”。

小写字母
:Ll
匹配任何单个小写字母。例如,:Llhe 匹配“the”,但不匹配“The”。

标题大写字母
:Lt
匹配一个大写字母后跟一个小写字母的字符,例如 Nj 和 Dz。

修饰字母
:Lm
匹配字母或标点符号(如逗号、交叉重音符和秒号),这些字母或标点符号是用于修饰前导字母的。

其他字母
:Lo
匹配其他字母,如歌特字母 ahsa。

十进制数字
:Nd
匹配十进制数字(如 0-9)及其全角对等数字。

字母数字
:Nl
匹配字母数字,如罗马数字和零的表意数字。

其他数字
:No
匹配其他数字,如旧斜体数字一。

左标点
:Ps
匹配左标点,如左小括号和左大括号。

右标点
:Pe
匹配右标点,如右小括号和右大括号。

左引号
:Pi
匹配左双引号。

右引号
:Pf
匹配单引号和右双引号。

划线号
:Pd
匹配划线号。

连接号
:Pc
匹配下划线符号。

其他标点
:Po
匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。

空格分隔符
:Zs
匹配空格。

行分隔符
:Zl
匹配 Unicode 字符 U+2028。

段落分隔符
:Zp
匹配 Unicode 字符 U+2029。

不占位标记
:Mn
匹配不占位标记。

合并标记
:Mc
匹配合并标记。

封闭标记
:Me
匹配封闭标记。

数学符号
:Sm
匹配 +、=、~、|、< 和 >。

货币符号
:Sc
匹配 $ 和其他货币符号。

修饰符号
:Sk
匹配修饰符号,如抑扬符、重音符和长音符。

其他符号
:So
匹配其他符号,如版权符号、段落标记和度数符号。

其他控制
:Cc
匹配行尾。

其他格式
:Cf
格式化控制字符,如双向控制字符。

代理项
:Cs
匹配代理项对的一半。

其他专门用途
:Co
匹配任何专用区域的字符。

其他未分配字符
:Cn
匹配未映射到 Unicode 字符的字符。

除了标准的 Unicode 字符属性以外,还可以将下列附加属性指定为字符集的一部分。

表达式

语法

说明:

字母
:Al
匹配任何单字符。例如,:Alhe 匹配“The”、“then” 和“reached”之类的字。

Numeric
:Nu
匹配任何数字。

标点
:Pu
匹配任意一个标点符号,如 ?、@、' 等等。

空格
:Wh
匹配任何类型的空格,包括印刷空格和表意空格。

双向
:Bi
匹配自右至左书写的字符,如阿拉伯语和希伯莱语字符。

朝鲜文字
:Ha
匹配朝鲜文字字母和组合字母。

平假名
:Hi
匹配平假名字符。

片假名
:Ka
匹配片假名字符。

象形/汉字/日文汉字
:Id
匹配象形字符,如汉字和日文汉字。

⑹ sql 正则表达式匹配

  • 当我们要进行一些简单的糊涂查询时用百分号(%),通配符(_)就可以了.其中%表达任意长度的字符串,_表示任意的某一个字符.

比如

select*fromempwhereenamelike's%'orenamelike's_';

但如果在一些复杂的查询中关用这两个符号sql语句就会非常复杂,而且也不一定能实现.从Oracle 10g开始引入了在其他程序语言中普通使用的正则表达式.

主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数.

  • 正则表达式中的元字符:

元字符 意思 例子

说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配)

匹配换行符
\ 匹配
匹配(匹配 )


^ 匹配字符串的开头位置 ^a匹配arwen.但不匹配barwen.

$ 匹配字符串的末尾位置 en$匹配arwen.但不匹配arwenb.

* 匹配前面的字符0次或多次 a*rwen可以匹配rwen或aaarwen.

+ 匹配前面的字符1次或多次 a+rwen可以匹配arwen或aarwen.但不能匹配rwen.

? 匹配前面的字符0次或1次 a?rwen可以匹配arwen或rwen.但不能匹配aarwen.

{n} 匹配前面的字符恰好是n次,其中n是整数 ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen.

{n,m} 匹配前面的字符至少是n次,最多是m次.如果写成{n,} 表示最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.


. 点号,匹配除null,换行以外的任意单个字符 arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn.

(pattern) 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于 的描述.

x|y 匹配“或” x|y可以匹配x或者y

[abc] 可以匹配abc中的任何单个字符 hello[abc]可以匹配helloa,hellob,helloc

[a-z] 可以匹配指定范围内的任何单个字符 hell[a-z]可以匹配hello或者hellz

[::] 指定一个字符类,可以匹配该类中的任何字符 [:alphanum:]可以匹配字符0-9、A-Z、a-z
[:alpha:]可以匹配字符A-Z、a-z
[:blank:]可以匹配空格或tab键
[:digit:]可以匹配数字0-9
[:graph:]可以匹配非空字符
[:lower:]可以匹配小写字母a-z
[:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符
[:punct:]可以匹配标点符号.,""等等
[:space:]可以匹配所有的空字符
[:upper:]可以匹配大写字母A-Z
[:xdigit:]可以匹配十六进制数字0-9、A-F、a-f

这是对前一次匹配命中的一个后引用,其中n是一个正整数 arw(en)1可以匹配arwenen.注意1前面必须是个加括号的子表达式.

  1. regexp_like:

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:
‘c’ 说明在进行匹配时区分大小写(缺省值);
'i' 说明在进行匹配时不区分大小写;
'n'(.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行.
'm' 字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置.

示例:select * from emp where regexp_like(ename,'^a[a-z]*n$');可以查找ename中以a开头以n结尾的行.例如ename为arwen或arwin或anden.但Arwen不能被匹配.因为默认是区分大小写.如果是select * from emp where regexp_like(ename,'^a[a-z]*n$','i')则可以查找ename为Arwen的行记录.

2. regexp_instr:

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关:
'start' 开始查找的位置;
'occurrence' 说明应该返回第几次出现pattern的位置;
'return_option' 说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后 的字符的位置;
'match_option' 修改默认的匹配设置.与regexp_like里面的相同.

示例:

DECLARE

V_RESULTINTEGER;

BEGIN

SELECT REGEXP_INSTR('hello world','o',1,1,0)INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为5.即字母o第一个次出现的位置

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数.比如1,3.则结果为6.表示第一次出现字母o的后面一个字符的位置.

如果regexp_instr('hello world','o',1,2,0)则结果为9.表示第二次出现字母o的位置.

3. regexp_replace:

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数

示例:

DECLARE

V_RESULT varchar2(90);

BEGIN

SELECT REGEXP_REPLACE('hello world','o','x',1,1)INTO V_RESULT

  1. FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为hellx world.

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.

如果 REGEXP_REPLACE('hello w


orld','o','x',1,2)则结果为hello wxrld.

4.regexp_substr:

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.

例如:

DECLARE

V_RESULT VARCHAR2(255);

BEGIN

SELECTREGEXP_SUBSTR('hello world','l{2}')INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为ll

查询到匹配的字符串才返回匹配的字符.没查到就返回空.

热点内容
ubuntu编译android源码 发布:2024-06-26 22:29:54 浏览:39
学生基本信息管理c语言 发布:2024-06-26 22:29:44 浏览:740
戏曲的脚本 发布:2024-06-26 22:16:29 浏览:20
邮件服务器ip查询 发布:2024-06-26 22:16:22 浏览:399
带计算器的文件夹 发布:2024-06-26 22:06:39 浏览:802
博易大师指标源码 发布:2024-06-26 21:37:57 浏览:540
phantomjspython爬虫 发布:2024-06-26 21:37:49 浏览:560
画出编译的工作过程图 发布:2024-06-26 21:27:29 浏览:963
云服务器ip有重复可能吗 发布:2024-06-26 21:21:25 浏览:266
java面试题2018及答案 发布:2024-06-26 21:12:57 浏览:762