python按中文拆分中英文混合字符串的简单示例

前端之家收集整理的这篇文章主要介绍了python按中文拆分中英文混合字符串的简单示例前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!

出自群里的提问,试了几次就实现了,现在分享出来。


# @param python拆分中英文混合字符串 - 按中文拆分
# @author 编程之家 jb51.cc|jb51.cc 

#coding=utf-8
import re
s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码
p = re.compile(ur'[\u4e00-\u9fa5]') #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur
  
print p.split(s) #使用re库的split切割

# End www.jb51.cc

猜你在找的Python相关文章