在mysql数据库中字符串在数据库中占有很重要的地位,下面我来介绍mysql字符串比较函数的一些基础学习,有需要的朋友可参考一下。
1:字符串连接函数
代码如下 复制代码
concat(str1,str2,...)
返回结果为连接参数产生的字符串。如有任何一个参数为null ,则返回值为 null。或许有一个或多个参数。 如果所有参数均为非二进制字符串,则结果为非二进制字符串。 如果自变量中含有任一二进制字符串,则结果为一个二进制字符串。一个数字参数被转化为与之相等的二进制字符串格式;若要避免这种情况,可使用显式类型 cast, 例如: select concat(cast(int_col as char), char_col)
以下是代码片段:
代码如下 复制代码
mysql> select concat('my', 's', 'ql');
-> 'mysql'
mysql> select concat('my', null, 'ql');
-> null
mysql> select concat(14.3);
-> '14.3'
下面这个concat_ws是concat的变体:
concat_ws(separator,str1,str2,...)
concat_ws() 代表 concat with separator ,是concat()的特殊形式。 第一个参数是其它参数的分隔符。分隔符的位置放在要连接的两个字符串之间。分隔符可以是一个字符串,也可以是其它参数。如果分隔符为 null,则结果为 null。函数会忽略任何分隔符参数后的 null 值。
以下是代码片段:
代码如下 复制代码
mysql> select concat_ws(',','first name','second name','last name');
-> 'first name,second name,last name'
mysql> select concat_ws(',','first name',null,'last name');
-> 'first name,last name'
concat_ws()不会忽略任何空字符串。 (然而会忽略所有的 null)。
这个函数和php的explode和implode、list、extract相似了。有兴趣的可以看看php的手册。
2:字符串剪接函数
insert(str,pos,len,newstr)
这个函数,mysql中文手册翻译得太烂了,还是偶自己来吧:
这个函数返回一个字符串:
a:str字符串从位置pos(从1开始计算)开始(含第pos位),之后的pos位被字符串newstr取代;
b:如果pos大于str的长度,则从str后面开始衔接;
c:如果因len超出余后的长度,则位置pos之后(含第pos位)全被取代;
d:如果pos为负数,返回str;
e:如果len为负数,则情同len超出余后的长度,这和php的substr之类的函数不一样。
以下是代码片段:
代码如下 复制代码
mysql> select insert('quadratic', 3, 4, 'what');
-> 'quwhattic'
mysql> select insert('quadratic', -1, 4, 'what');
-> 'quadratic'
mysql> select insert('quadratic', 3, 100, 'what');
-> 'quwhat'
这个函数支持多字节字元。
3:进制转换函数
conv(n,from_base,to_base)
不同数基间转换数字。返回值为数字的n字符串表示,由from_base基转化为 to_base 基。如有任意一个参数为null,则返回值为 null。自变量 n 被理解为一个整数,但是可以被指定为一个整数或字符串。最小基数为 2 ,而最大基数则为 36。 if to_base 是一个负数,则 n 被看作一个带符号数。否则, n 被看作无符号数。 conv() 的运行精确度为 64比特。
以下是代码片段:
代码如下 复制代码
mysql> select conv('a',16,2);
-> '1010'
mysql> select conv('6e',18,8);
-> '172'
mysql> select conv(-17,10,-18);
-> '-h'
mysql> select conv(10+'10'+'10'+0xa,10,10);
-> '40'
请看php的:
base_convert — 在任意进制之间转换数字
说明:
string base_convert ( string $number , int $frombase , int $tobase )
返回一字符串,包含 number 以 tobase 进制的表示。number 本身的进制由 frombase 指定。frombase 和 tobase 都只能在 2 和 36 之间(包括 2 和 36)。高于十进制的数字用字母 a-z 表示,例如 a 表示 10,b 表示 11 以及 z 表示 35。
mysql的进制转换函数还有一个,是一个为16进制而定义的函数:
hex(n_or_s)
如果n_or_s 是一个数字,则返回一个 十六进制值 n 的字符串表示,在这里, n 是一个longlong (bigint)数。这相当于 conv(n,10,16)。
如果n_or_s 是一个字符串,则返回值为一个n_or_s的十六进制字符串表示, 其中每个n_or_s 里的每个字符被转化为两个十六进制数字。
以下是代码片段:
代码如下 复制代码
mysql> select hex(255);
-> 'ff'
mysql> select 0x616263;
-> 'abc'
mysql> select hex('abc');
-> 616263
4:字符查找定位函数
elt(n,str1,str2,str3,...)
若n = 1,则返回值为 str1 ,若n = 2,则返回值为 str2 ,以此类推。 若n 小于1或大于参数的数目,则返回值为 null 。 elt() 是 field()的补数。
以下是代码片段:
代码如下 复制代码
mysql> select elt(1, 'ej', 'heja', 'hej', 'foo');
-> 'ej'
mysql> select elt(4, 'ej', 'heja', 'hej', 'foo');
-> 'foo'
看见上面这个函数,还以为主要起逻辑判断用的,如:
以下是代码片段:
代码如下 复制代码
mysql> select elt(if(1, 2, 3), 'ej', 'heja', 'hej', 'foo');
+----------------------------------------------+
| elt(if(1, 2, 3), 'ej', 'heja', 'hej', 'foo') |
+----------------------------------------------+
| heja |
+----------------------------------------------+
1 row in set (0.00 sec)
但是一看下面的函数,才明白不仅仅如此:
field(str,str1,str2,str3,...)
返回值为str1, str2, str3,……列表中的str 指数。在找不到str 的情况下,返回值为 0 。
如果所有对于field() 的参数均为字符串,则所有参数均按照字符串进行比较。如果所有的参数均为数字,则按照数字进行比较。否则,参数按照双倍进行比较。
如果str 为null,则返回值为0 ,原因是null不能同任何值进行同等比较。field() 是elt()的补数。
以下是代码片段:
代码如下 复制代码
mysql> select field('ej', 'hej', 'ej', 'heja', 'hej', 'foo');
-> 2
mysql> select field('fo', 'hej', 'ej', 'heja', 'hej', 'foo');
-> 0
这个函数与php中的array_search和array_key_exists、in_array、isset还是有相似作用的。
再看一下下面这个,不禁拍案叫绝了,直接就是in子句了:
find_in_set(str,strlist)
假如字符串str 在由n 子链组成的字符串列表strlist 中, 则返回值的范围在 1 到 n 之间 。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串,而第二个是type set列,则 find_in_set() 函数被优化,使用比特计算。如果str不在strlist 或strlist 为空字符串,则返回值为 0 。如任意一个参数为null,则返回值为 null。 这个函数在第一个参数包含一个逗号(‘,’)时将无法正常运行。
以下是代码片段:
代码如下 复制代码
mysql> select find_in_set('b','a,b,c,d');
-> 2
5:数字格式化函数
format(x,d)
将数字x 的格式写为'#,###,###.##',以四舍五入的方式保留小数点后 d 位, 并将结果以字符串的形式返回。若 d 为 0, 则返回结果不带有小数点,或不含小数部分。
以下是代码片段:
代码如下 复制代码
mysql> select format(12332.123456, 4);
-> '12,332.1235'
mysql> select format(12332.1,4);
-> '12,332.1000'
mysql> select format(12332.2,0);
-> '12,332'
字符串比较中有以下四个规则:
1:mysql 会自动将数字转化为字符串,反之亦然。
2:若想要将数字明确地转化为字符串,可使用 cast()或 concat()函数。
3:若已经对一个字符串函数给定一个二进制字符串作为参数, 则所得到的结果字符串也是一个二进制字符串。
4:一般而言, 若字符串比较中任意一个表达式是区分大小写的,则执行比较时也区分大小写。
下面根据以上说的三类进行学习:
一:使用like子句
expr like pat [escape 'escape-char']
模式匹配,使用sql简单正规表达式比较。返回1 (true) 或 0 (false)。 若 expr 或 pat 中任何一个为 null,则结果为 null。
模式不需要为文字字符串。例如,可以被指定为一个字符串表达式或表列。
在模式中可以同like一起使用以下两种通配符:
字符
说明
%
匹配任何数目的字符,甚至包括零字符
_
只能匹配一种字符
以下是代码片段:
代码如下 复制代码
mysql> select 'david!' like 'david_';
-> 1
mysql> select 'david!' like '%d%v%';
-> 1
若要对通配符的文字实例进行检验, 可将转义字符放在该字符前面。如果没有指定 escape字符, 则假设为‘’。这个和一般的编程语言是一样的。
字符串
说明
%
匹配一个 ‘%’字符
_
匹配一个 ‘_’ 字符
以下是代码片段:
代码如下 复制代码
mysql> select 'david!' like 'david_';
-> 0
mysql> select 'david_' like 'david_';
-> 1
也可以指定一个不同的转义字符,需使用escape语句:
以下是代码片段:
代码如下 复制代码
mysql> select 'david_' like 'david|_' escape '|';
-> 1
以下两个语句举例说明了字符串比较不区分大小写,除非其中一个操作数为二进制字符串:
以下是代码片段:
代码如下 复制代码
mysql> select 'abc' like 'abc';
-> 1
mysql> select 'abc' like binary 'abc';
-> 0
在mysql中, like 允许出现在数字表达式中。 (这是标准sql like 的延伸)。
以下是代码片段:
代码如下 复制代码
mysql> select 10 like '1%';
-> 1
注释: 由于 mysql在字符串中使用 c转义语法(例如, 用‘n’代表一个换行字符),在like字符串中,必须将用到的‘’双写。例如, 若要查找 ‘n’, 必须将其写成 ‘\n’。而若要查找 ‘’, 则必须将其写成 it as ‘\\’;原因是反斜线符号会被语法分析程序剥离一次,在进行模式匹配时,又会被剥离一次,最后会剩下一个反斜线符号接受匹配。
二:使用正则表达式的like子句
expr regexp pat expr rlike pat
执行字符串表达式 expr 和模式pat 的模式匹配。该模式可以被延伸为正则表达式。正则表达式的语法在附录g:mysql正则表达式中有详细讨论。若expr 匹配 pat,则返回 1; 否则返回0。若 expr 或 pat 任意一个为 null, 则结果为 null。 rlike 是regexp的同义词, 作用是为msql 提供兼容性。
模式不需要为文字字符串。例如,可以被指定为一个字符串表达式或表列。
注释:由于在字符串中, mysql使用 c 转义语法 (例如, 用‘n’来代表换行字符 ),在regexp字符串中必须将用到的‘’ 双写。
regexp 不区分大小写, 除非将其同二进制字符串同时使用。
以下是代码片段:
代码如下 复制代码
mysql> select 'monty!' regexp 'm%y%%';
-> 0
mysql> select 'monty!' regexp '.*';
-> 1
mysql> select 'new*n*line' regexp 'new\*.\*line';
-> 1
mysql> select 'a' regexp 'a', 'a' regexp binary 'a';
-> 1 0
mysql> select 'a' regexp '^[a-d]';
-> 1
在确定字符类型时,regexp 和 rlike 使用当前字符集 (默认为cp1252 latin1 )。 警告:这些操作符不支持多字节字元。
三:使用函数:strcmp
strcmp(expr1,expr2)
若所有的字符串均相同,则返回0;若根据当前分类次序,第一个参数小于第二个,则返回 -1,其它情况返回 1 。
以下是代码片段:
代码如下 复制代码
mysql> select strcmp('text', 'text2');
-> -1
mysql> select strcmp('text2', 'text');
-> 1
mysql> select strcmp('text', 'text');
-> 0
在执行比较时,strcmp() 使用当前字符集。这使得默认的比较区分大小写,当操作数中的一个或两个都是二进制字符串时除外。
说明:对于前两个都有其反操作。见下
代码如下 复制代码
expr not like pat [escape 'escape-char']
这相当于 not (expr like pat [escape 'escape-char'])。
expr not regexp pat expr not rlike pat
这相当于not (expr regexp pat)。