Python2与Python3关于字符串编码处理的差别总结

脚本专栏 2026/6/30 佚名

3 2 1

0x00 字符的编码

计算机毕竟是西方国家的发明，最开始并没有想到会普及到全世界，只用一个字节中的7位（ASCII）来表示字符对于现在庞大的文字数量来说显然不够，所以先后经历了好几套编码方案，不同国家和地区又有自己的方案，造成了现在诸多的历史遗留问题。

0x01 Python中的字符串

Python有两种不同的字符串，一种存储文本，一种存储字节。对于文本，Python内部采用Unicode存储，而字节字符串显示原始字节序列或者ASCII。

什么叫编码（encode）？

按照字面意思和以往经验，我要把这个文本或字符串用“UTF-8”编码，感觉上应该是对字节数据进行编码然后显示正确的文字。大多数人都是这么想的，可事实呢？

编码的意思是将Unicode字符按照编码规则（如UTF-8）编成字节序列：

有人此时会问，我用 print 语句打印出来怎么是乱码或者是中文，并不是字节序列。这是因为你调用 print 语句的时候，默认进行了隐式解码，为的是让人类看见友好的字符数据 ，也就是默认的进行了str()包装，想看见背后真正的十六进制数，你需要调用魔术方法 _repr_() 。

什么叫解码（decode）"text-align: center">

这里或许又会有疑问，编码解码都是十六进制，那中文字符咋显示的？
这又要结合你的环境了。看完我上面推荐的文章，你就会明白，Unicode只是一种标准，而具体的编码才是实现方式。有了正确的Unicode编码，仅仅代表你有了正确的英文文献，想翻译成中文，还得再转换一次。而这一次转换，是你的环境帮你完成。举个例子，你打开一个文档，发现是乱码，多半是文本编辑器的解码方式有问题，换个解码规则就好了。

0x02 Python2 和 Python3 之间的区别

Python3 一切都很美好

在Python3当中，文本字符串类型（使用Unicode数据存储）被命名为 str , 字节字符串类型被命名为 bytes 。一般情况下，实例化一个字符串会得到一个 str 对象：

所以现在很多人都说，Python3默认是Unicode，也就是这个意思。

如果你想得到bytes，那就在文本之前加上前缀 b , 或者 encode 一下。

所以，很显然，str 对象有一个encode方法，bytes 对象有一个decode方法。

Python2 相当的操蛋，甚至会误导你

在Python3中的 str 对象在Python2中叫做 unicode ，感觉很通俗对吧？但 bytes 对象在Python2中叫做 str ，对。。就是你平时用的 str ，默认的那个。。。

如果你想得到一个文本字符串，你需要在字符串之前加上前缀 u 或者 decode 一下。

搞笑的还不止这么点，Python2中的 str （字节）对象，竟然有一个 encode 方法！！！而且你别指望它有什么特殊用处，它就是用来报错的，永远都别使用它！！！

同样的，unicode （文本字符）对象也有一个用来报错的 decode 方法。

我们尝试一下：

不知道大家注意到错误信息没有，我们在进行解码，规则是GBK，但它说 无法用 ascii 进行编码 ，这是为什么？

这就是Python2自作聪明为了对一个unicode对象执行解码而进行的隐式编码 ，等于以下代码：

b.encode('ascii').decode('GBK')

这就是为什么很多人说，Python2的编码很操蛋。

0x03 小结

如果你在用2.X，请养成在字符串加上 u 前缀的习惯，统一编码UTF-8，如果windows控制台或者Pycharm控制台依旧出现乱码，那多半是控制台编码不同，改过来就好。

参考书籍《Python 高级编程》

总结

Python查询字符串编码,python3字符串编码,python2,字符串编码

标签：
Python查询字符串编码,python3字符串编码,python2,字符串编码

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

上一篇
 Python中实现一行拆多行和多行并一行的示例代码

下一篇
 Pytest单元测试框架如何实现参数化

白云城资源网 Copyright www.dyhadc.com

评论“Python2与Python3关于字符串编码处理的差别总结”

Python2与Python3关于字符串编码处理的差别总结

暂无“Python2与Python3关于字符串编码处理的差别总结”评论...

www.dyhadc.com 白云城资源网

129,905影音资源

244,626技术资源

111,817软件资源

578,645站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2026/6/30
56

可与Spreadsheets媲美的在线表格系统:EditG

2026/6/30
34

cygwin使用心得

2026/6/30
73

脚本的DVD开发

2026/6/30
28

局域网设置自动配置脚本文件的写法与用途

2026/6/30
15

一句话新闻
一口气升级7个大模型SaaS应用，百度智能云：突出一个“开箱即用” - 2026/6/30

这一波大模型产业落地浪潮里，不少企业其实处在 “干瞪眼“的状态。

一种情况是，很多大模型产品看得见却摸不着，在台上一个个遥遥领先——今天Sora技精四座，明天英伟达的机器人又赢得满堂彩，可是到了台下一问：啥时候能用上啊？答曰：遥遥无期。

另一种情况是，企业想用上大模型，却又难免瞻前顾后——既要考虑场景融合，又得兼顾安全性，还要考虑打通现有系统，再加上各种部署成本和繁琐的采购流程……最后只能拂袖：罢了，再等等吧。

Python2与Python3关于字符串编码处理的差别总结

Python查询字符串编码,python3字符串编码,python2,字符串编码

Python中实现一行拆多行和多行并一行的示例代码

Pytest单元测试框架如何实现参数化

评论“Python2与Python3关于字符串编码处理的差别总结”

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

更新日志

友情链接