您现在的位置是:首页 > 教程 > Python编码和Unicode总结
推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

Python编码和Unicode总结

更新时间:2018-08-14 21:53:54 大小:89K 上传用户:杨义查看TA发布的资源 标签:python 下载积分:0分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

该文档为Python编码和Unicode总结讲解文档,

我确定有很多关于Unicode和Python的说明,但为了方便自己的理解使用,我还是打算再写

一些关于它们的东西。

字节流 vs Unicode对象

我们先来用Python定义一个字符串。当你使用string类型时,实际上会储存一个字节串。

在这个例子里,abc这个字符串是一个字节串。97.,98,,99是ASCII码。Python 2.x版本的

一个不足之处就是默认将所有的字符串当做ASCII来对待。不幸的是,ASCII在拉丁式字符集里是

最不常见的标准。

ASCII是用前127个数字来做字符映射。像windows-1252和UTF-8这样的字符映射有相同的

前127个字符。在你的字符串里每个字节的值低于127的时候是安全的混合字符串编码。然而作这

个假设是件很危险的事情,下面还将会提到。

当你的字符串里有字节的值大于126的时候就会出现问题了。我们来看一个用windows-1252

编码的字符串。Windows-1252里的字符映射是8位的字符映射,那么总共就会有256个字符。

前127个跟ASCII是一样的,接下来的127个是由windows-1252定义的其他字符。


部分文件列表

文件名 大小
Python编码和Unicode总结.pdf 89K

全部评论(0)

暂无评论