Loading... # [一个简单而精彩的方法获取中文字符串长度](https://blog.p2hp.com/archives/467) 今晚在写框架的表单验证类时,需要判断某个字符串长度是否在指定区间内,很自然地,想到了PHP中的 **strlen** 函数。 ```php $str = 'Hello world!'; echo strlen($str); // 输出12 ``` 然而在PHP自带的函数中,strlen及 **mb_strlen** 都是通过计算字符串所占字节数来计算长度的,在不同的编码情况下,中文所占的字节数是不同的。在GBK/GB2312下,中文字符占2个字节,而在UTF-8下,中文字符占3个字节。 ```php $str = '你好,世界!'; echo strlen($str); // GBK或GB2312下输出12,UTF-8下输出18 ``` 而我们在判断字符串长度时往往需要判断的是字符的数量,而非字符串所占字节数,如在UTF-8下的这段PHP代码: ```php $name = '张耕畅'; $len = strlen($name); // 输出 FALSE,因为在UTF-8下三个中文占9个字节 if($len >= 3 && $len <= 8){ echo 'TRUE'; }else{ echo 'FALSE'; } ``` 那么有什么方便而实用的方法可以获得含中文字符串的长度呢?可以 **用正则计算出中文字符的个数,在GBK/GB2312编码下除以2,UTF-8编码下则除以3,最后再加上非中文字符串的长度** ,但这样未免太过麻烦,WordPress中有一段更漂亮的代码,借鉴如下: ```php $str = 'Hello,世界!'; preg_match_all('/./us', $str, $match); echo count($match[0]); // 输出9 ``` 思想是 **用正则表达式将字符串分割成单个字符,并直接用count计算出匹配到的字符数** ,便是我们想要的结果了。 最后修改:2023 年 08 月 07 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏