您现在的位置是:首页 > 数码 > 

gb1800 mysql

2025-07-26 21:38:05
gb1800 mysql GB1800 是中国的标准,国标(GB),就是如何表示一个字符。Unicode只给出了一个字符的编号,并没有规定如何表示(或者说保存),UTF-8规定了如何表示。所以说,GB1800 和 unicodeutf-8是不同的字符表示方式,一个是中国制定的标准,一

gb1800 mysql

GB1800 是中国的标准,国标(GB),就是如何表示一个字符。Unicode只给出了一个字符的编号,并没有规定如何表示(或者说保存),UTF-8规定了如何表示。所以说,GB1800 和 unicodeutf-8是不同的字符表示方式,一个是中国制定的标准,一个是国际上的组织制定的标准。

计算机被发明的时候,人们认为不会像现在这么流行,所以包括控制字符在内人们只定义了包括控制字符在内的128种符号,这就是 ASCII。

后来计算机流行到非英语国家,那么他们有自己的语言需要计算机显示。由于ASCII符号只有128个,而计算机一个字节有8位,所以还有128个冗余,于是他们用剩余的128个冗余表示他们自己国家的文字。不同的国家把这128个(其实是95个)定义成不同的字符,分别叫做ISO8859-1(Latin-1),ISO8859-2(Latin-2).....ISO8859-16(Latin-10)。额,中间有一部分不叫 Latin(好坑人呀)

但是在东亚,就说中国吧,128个显然表示不了所有的汉字。所以就只能用两个字节表示一个汉字。于是规定,原始的 ASCII 还是用一个字节表示,使用连续两个字节(这两个字节值都大于128)表示一个汉字。一共可以表示128×128=1684个汉字(实际没有那么多),叫做 GB212。后来人们发现自己太傻,其实第一个字节大于128的话,我们用连续两个字节表示一个汉字也不会出现歧义,所以规定,如果当前字节小于128那么就是标准的 ASCII,如果当前字节大于128就用当前字节和后面那个字节表示一个汉字,所以可以表示(128×256=2768)个汉字,然后补充了一部分汉字,叫做 GBK。在此基础上又增加了一部分汉字,这个版本叫做 GB1800。(东亚标准里还有BIG5和CJK的故事)。

不同的国家有不同的标准,所以当大家交流的时候就不方便了。所以出现了两个组织(忘记具体叫什么了),开始着手统一全部的字符集(后来其中一个组织觉得另一个组织做就好了,主动退出了),叫做 Unicode。

但是 Unicode 只规定了一个字符的编号,并没有规定具体怎么表示。比如 A 编号65,具体表示的时候可以用一个字节 0x41 表示,可以用两个字节表示 0x00 0x41,或者用四个字节表示 0x00 0x00 0x00 0x41,而且多个字节表示的话还有谁在前的问题。所以在 unicode 表示上出现了不同的标准。UTF-8 就是一种表示的标准(终于说到UTF-8了),不过具体怎么表示就有点儿复杂了,是一种变长编码,有些字符用一个字节(兼容ASCII,这就是为什么UTF-8比较流行)有些用两个有些三个。。。随便百度了一个表示方式,就是把一个如何把一个数字转成几个字节表示。

扩展:还有两种标准 UTF-16,UTF-2,UTF-16统一个用两个字节或是四个字节表示一个字符(java,javascript里就是这种编码,这其中还有USC定长编码的故事),UTF-2统一用4个字节,所以都不兼容ASCII。既然是多字节,就涉及字节顺序的问题。。。。

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/shuma/845613.html

相关标签:无
上传时间: 2024-02-05 12:08:06
留言与评论(共有 18 条评论)
本站网友 孕妇晚期食谱
21分钟前 发表
不同的国家有不同的标准,所以当大家交流的时候就不方便了
本站网友 瑞兰玻尿酸注射除皱
10分钟前 发表
UTF-16统一个用两个字节或是四个字节表示一个字符(java
本站网友 s系双胞胎
19分钟前 发表
所以在 unicode 表示上出现了不同的标准
本站网友 adc什么意思
14分钟前 发表
所以就只能用两个字节表示一个汉字
本站网友 荆芥的作用与功效
29分钟前 发表
gb1800 mysql GB1800 是中国的标准,国标(GB),就是如何表示一个字符
本站网友 超导磁浮列车
12分钟前 发表
不同的国家有不同的标准,所以当大家交流的时候就不方便了
本站网友 青青世界酒店
15分钟前 发表
所以就只能用两个字节表示一个汉字
本站网友 小榄二手房出售
18分钟前 发表
所以在 unicode 表示上出现了不同的标准
本站网友 性器官图
28分钟前 发表
扩展:还有两种标准 UTF-16,UTF-2
本站网友 上海通用汽车金融
6分钟前 发表
在此基础上又增加了一部分汉字,这个版本叫做 GB1800
本站网友 绿豆薏仁汤
24分钟前 发表
所以说,GB1800 和 unicodeutf-8是不同的字符表示方式,一个是中国制定的标准,一个是国际上的组织制定的标准
本站网友 外国媒体
6分钟前 发表
ISO8859-2(Latin-2).....ISO8859-16(Latin-10)
本站网友 一日十次
29分钟前 发表
额,中间有一部分不叫 Latin(好坑人呀)但是在东亚,就说中国吧,128个显然表示不了所有的汉字
本站网友 囤积居奇
24分钟前 发表
UTF-8 就是一种表示的标准(终于说到UTF-8了),不过具体怎么表示就有点儿复杂了,是一种变长编码,有些字符用一个字节(兼容ASCII,这就是为什么UTF-8比较流行)有些用两个有些三个
本站网友 日处口读什么的
29分钟前 发表
本站网友 防伪商标
22分钟前 发表
既然是多字节,就涉及字节顺序的问题
本站网友 netman
18分钟前 发表
不同的国家有不同的标准,所以当大家交流的时候就不方便了