编码的作用及常见的编码方式浅析
技术  /  管理员 发布于 1年前   467
编码的作用:
计算机只能处理数字,如果想让计算机处理人类语言,则需要将字符转换为数字,而计算机编码就是将字符转换为数字的过程;
编码还可以用于压缩数据,以便更有效地存储和传输数据;
常见的编码方式
ASCII 码
ASCII 码,可以表示 128 个字符,用一个字节的低 7 位表示,0~31 是控制字符,比如换行、回车、删除等;32~126 是打印字符,可以通过键盘输入并且能够显示出来。
ISO-8859-1
128 个字符显然是不够用的,于是 ISO 组织在 ASCII 码基础上又制定了一些列标准用来扩展 ASCII 编码,它们是 ISO-8859-1 ~ ISO-8859-15,其中 ISO-8859-1 涵盖了大多数西欧语言字符,所以应用的最广泛。ISO-8859-1 仍然是单字节编码,它总共能表示 256 个字符。
GB2312
全称是《信息交换用汉字编码字符集 基本集》,它是双字节编码,总的编码范围是 A1-F7,其中从 A1-A9 是符号区,总共包含 682 个符号,从 B0-F7 是汉字区,包含 6763 个汉字。
GBK
全称是《汉字内码扩展规范》,是国家技术监督局为 windows95 所制定的新的汉字内码规范,它的出现是为了扩展 GB2312,加入更多的汉字,它的编码范围是 8140~FEFE(去掉 XX7F)总共有 23940 个码位,它能表示 21003 个汉字。
兼容性
GBK 兼容 GB2312,也就是说用 GB2312 编码的汉字可以用 GBK 来解码,并且不会有乱码。
GB18030
全称是《信息交换用汉字编码字符集》,是我国的强制标准,它可能是单字节、双字节或者四字节编码。
虽然是国家标准,但是实际应用系统中使用的并不广泛。
兼容性
GB18030 兼容 GB2312。
UTF-16
说到 UTF 必须要提到 Unicode(Universal Code 统一码),ISO 试图想创建一个全新的超语言字典,世界上所有的语言都可以通过这本字典来相互翻译。Unicode 可以表达的字符非常多,需要用多个字节来存储。
UTF-16意味着用两个字节来表示 Unicode 字符,两个字节是 16 个 bit,所以叫 UTF-16。
ASCII
有很大一部分字符用一个字节就可以表示,UTF-16 统一采用两个字节表示一个字符,存储空间放大了一倍,造成浪费。
UTF-8 采用了一种变长技术,每个编码区域有不同的字码长度,不同类型的字符可以是由 1~6 个字节组成。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号