正则提取编码解码问题

前端之家收集整理的这篇文章主要介绍了正则提取编码解码问题前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

p = re.compile(u'《(.*?)》') # 使用unicode编码

vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode

vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8,防止输出乱码。

注意:

pattern和string中,都需要使用unicode,否则编码不同,结果有误(如:《推拿》,《一切都好》等)。

猜你在找的正则表达式相关文章