• 展开微博窗口
  • QQ:365182575
  • 微信:cighsen
  • 展开分类目录
Nearnet

中文汉字的正则字符编码范围

  双字节字符编码范围:

  1. GBK (GB2312/GB18030)

  \x00-\xff GBK双字节编码范围

  \x20-\x7f ASCII

  \xa1-\xff 中文gb2312

  \x80-\xff 中文 gbk

  2. UTF-8 (Unicode)

  \u4e00-\u9fa5 (中文)

  \x3130-\x318F (韩文)

  \xAC00-\xD7A3 (韩文)

  \u0800-\u4e00 (日文)

 

  判断字符串是否全是汉字,代码如下:

  1. <?php 
  2.     $str = '全部是汉字测试'; 
  3.     if (preg_match_all("/^([x81-xfe][x40-xfe])+$/", $str, $match)) { 
  4.         echo '全部是汉字';   
  5.     } else { 
  6.         echo '不全是汉字'; 
  7.     } 
  8. ?> 
码字很辛苦,转载请注明来自NAERENET《中文汉字的正则字符编码范围》