频道导航

ubuntu下读取不同编码格式的文件读取中文

2020-05-16 Ubuntu 前端之家

前端之家收集整理的这篇文章主要介绍了ubuntu下读取不同编码格式的文件读取中文，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

# -*- coding: utf-8 -*-

#汉字编码 unicode 0x4e00 - 0x9fa5 两万多个

#GB2312，简体中文字符集6763个常用汉字和682个全角非汉字字符，根据使用频率分两级，一级

#汉字3755个，二级汉字3008个。

#GB18030-2005 是目前最新的内码字集

#GBK 是对GB2312的

#在Windows 环境下

#判断文件的编码格式

import chardet

import codecs

f = open('GB2312_set.txt','r')

data = f.read()

print chardet.detect(data)

#以相应的格式打开文件

with codecs.open("GB2312_set.txt",'r','UTF-16LE') as handle: #以UTF-16LE格式读取并转换为linux内部的unicode格式

for ln in handle:

print ln

上一篇：在Ubuntu Server上源码安装OpenERP 下一篇：Ubuntu——apache如何解决跨域资源

猜你在找的Ubuntu相关文章

学linux,从Ubuntu开始

1.安装过程出现0x00000000指令引用的0x00000000内存该内存不能为written 如果你安装的是in...

作者：前端之家时间：2020-12-29

ubuntu16.04获取root权限并用root用户登录

写在全面：如果根据以下教程涉及到只读文件需要更改文件权限才能需修改文件内容，参考我的...

作者：前端之家时间：2020-12-12

ubuntu18.04获取root权限并用root用户登录

写在前面：以下步骤中需要在终端输入命令，电脑端查看博客的朋友可以直接复制粘贴到终端，...

作者：前端之家时间：2020-12-12

ubuntu16.04和18.04更换国内源

ubuntu16.04和18.04更换国内源写在前面：安装好ubuntu双系统后，默认的软件更新源是国外的...

作者：前端之家时间：2020-12-12

ubuntu双系统启动时卡死解决办法

ubuntu双系统启动时卡死解决办法（在ubuntu16.04和18.04测试无误）问题描述：在安装完ub...

作者：前端之家时间：2020-12-12

Ubuntu安装ssh

作者：前端之家时间：2020-07-20

Ubuntu报“xxx is not in the sudoers file.This incident will be reported” 错误解决方法

作者：前端之家时间：2020-07-20

ubuntu-make | Ubuntu Linux一键安装开发环境

-- 作者谢恩铭转载请注明出处内容简介什么是ubuntu-make 安装最新版ubuntu-make 用ubu...

作者：前端之家时间：2020-07-20

Ubuntu 17.04（Zesty Zapus）正式发布，可以下载使用了

今天，2017 年 4 月 13 日，Canonical 官方发布了 Ubuntu 17.04（Zesty Zapus）的最终版。...

作者：前端之家时间：2020-07-20

Ubuntu 为钱而放弃 Unity ？ Linux 社区的反应

（点击上方公众号，可快速关注）编译：伯乐在线/黄小非如有好文章投稿，请点击 → 这里...

作者：前端之家时间：2020-07-20

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

ubuntu下读取 不同编码格式的文件 读取中文

猜你在找的Ubuntu相关文章

ubuntu下读取不同编码格式的文件读取中文