python2 中 unicode 和 str 之间的转换及与python3 str 的区别
Python  /  管理员 发布于 7年前   224
在python2中字符串分为 unicode 和 str 类型
Str To Unicode 使用decode(), 解码 Unicode To Str 使用encode(), 编码
返回数据给前端时需要先将unicode转换为str类型, 事实上, python2 中的 str 就是一串字节(byte), 而网络通信时, 传输的就是字节. 如果前端需要接收json数据, 需要使用 json.dumps() 将数据转换为json格式进行返回, 当数据是嵌套类型的数据, 内层的数据可能无法直接转换为str类型的数据, 这时可以使用eval()函数进行转换, 再使用json.dumps()进行转换为json格式的数据, json 事实上就是一串字符串.
python2 默认情况下 字符串 的类型是 str 类型, 如果需要得到 unicode 类型的字符串, 需要使用下面的方式进行声明:
my_str = u"lowmanisbusy" # 在变量前面加上 u
在 python2 中如果没有重新指定字符编码, 定义中文的字符串时, 需要加上 "u", 指明该字符串为 unicode 类型, 指定使用unicode编码对其进行编码保存:
my_zh_str = u"渣男不但丑" # 在变量前面加上 u
unicode编码: unicode编码为世界上所有字符都分配了一个唯一编号, 为十六进制, 如中文简体汉字 “渣” 的 Unicode编号就是 6E23, 在 python2就是 "\u6e23", 但是unicode仅仅定义了每个字符的编号,并没有定义如何将这个编号进行存储的方式,所以后来出现了utf-8, gbk等编码格式, 它们都是 unicode 的一种实现方式, 仍然使用了unicode 中的唯一编号, 个人对其的简单理解就是在unicode编码的基础之上又定义了对字符的存储方式.
在python3中字符串分为 str 和 bytes 两种类型
Str To Bytes 使用 encode(), 编码 Bytes To Str 使用 decode(), 解码
这里需要说明的是, python3 中 bytes 类型的字符串, 就相当于 python2 中 str 类型的字符串, python3中没有unicode类型的字符串, 这里其实涉及到默认编码的问题, python3默认字符编码为:utf-8, python2默认字符编码为:ASCII, ASCII码 包含了128个字符, 其中包括所有的英文字符, 阿拉伯数字, 标点符号, 控制符号等, 却没有中文, 中文是象形文字, 需要使用到更多的字节进行组合来表示出每个汉字, 因此ASCII是无法满足对中文的表示的, 所以 python2中如果没有重新设置字符编码的话,代码中就不允许出现str类型的中文字符串(可以指定为unicode类型), 因为Cpython2解释器无法识别. 至于 ASCII, UNICODE, UTF-8 之间的关系与区别这里就不细说了, 可以自行去了解一下( utf-8编码 是 unicode编码 的一种实现方式, 个人理解可以认为是下面这样一种关系: utf-8 <---> unicode <--->byte, 最终,数据的传输仍然是以二进制的形式一个一个字节进行传输的)
默认情况下,python3中字符串的类型为 str, 在web框架中, 会自动将 str转换成 byte 向前端返回.
当需要将某种编码格式的bytes转换另外一种编码格式的bytes时需要先按原来的编码格式进行解码成str类型, 再使用新的编码格式转换为bytes类型
如: 若存在变量 my_bt, 其为编码格式 gbk 的 bytes, 需将其转换为utf-8的编码格式,需要进行如下的处理:
my_str = my_bt.decode("gbk") # 解码 my_bt = my_str.encode("utf-8") # 重新编码
因为 python3 中没有 unicode 类型的字符串, 所有在 python3 中使用下面这种方式定义字符串是没有意义的
my_str = u"渣男不但丑"
ps:下面看下Python2之unicode转字符串
str.encode('unicode-escape').decode('string_escape')
总结
以上所述是小编给大家介绍的python2 中 unicode 和 str 之间的转换及与python3 str 的区别,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号