在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码,正则匹配中文汉字根据页面编码不同而略有区别:gbk/gb2312编码:[x80-xff>]+ 或 [xa1-xff]+ 而utf-8编码:[x{4e00}-x{9fa5}]+/u 。
例
代码如下 复制代码
echo (mb_eregi([x80-xff].,中d文) ? 有 : 无) .汉字;
echo (mb_eregi(^([x80-xff].)+$,中文) ? 全是汉字 : ); 看一判断全中文字符串函数
以下以php为例进行匹配:
代码如下 复制代码
输出:
array
(
[0] => array
(
[0] => 学习
[1] => 是一件快乐的事。
)
)
正则汉字
代码如下 复制代码
$str = 请问php中的eregi如何匹配汉字;
if (preg_match(/^[.chr(0x80).-.chr(0xff).]+$/,$str)) {
echo 这是一个纯中文字符串;
} else{
echo 这不是一个纯中文字串;
}
preg_match_all($pat,……)与preg_replace($pat,……)……
preg_match_all(/(汉字)+/ism,我是汉字,看你把我怎么着!,$m_a);
了各个编码的高位与低位的开始与结束,那么自然就可以写出正则,而且直接是十六位的,有啥困难?呵呵。不过要注意,在php里面,表示十六位是用的x
我们还可以用该正则表达式来判断是否是gb2312的汉字
代码如下 复制代码
http://www.bkjia.com/phpjc/628906.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/628906.htmltecharticle在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码,正则匹配中文汉字根据页面编码不同而略有区别:gbk/gb2312编码:[x80-x...