gb1800 mysql
gb1800 mysql
GB1800 是中国的标准,国标(GB),就是如何表示一个字符。Unicode只给出了一个字符的编号,并没有规定如何表示(或者说保存),UTF-8规定了如何表示。所以说,GB1800 和 unicodeutf-8是不同的字符表示方式,一个是中国制定的标准,一个是国际上的组织制定的标准。
计算机被发明的时候,人们认为不会像现在这么流行,所以包括控制字符在内人们只定义了包括控制字符在内的128种符号,这就是 ASCII。
后来计算机流行到非英语国家,那么他们有自己的语言需要计算机显示。由于ASCII符号只有128个,而计算机一个字节有8位,所以还有128个冗余,于是他们用剩余的128个冗余表示他们自己国家的文字。不同的国家把这128个(其实是95个)定义成不同的字符,分别叫做ISO8859-1(Latin-1),ISO8859-2(Latin-2).....ISO8859-16(Latin-10)。额,中间有一部分不叫 Latin(好坑人呀)
但是在东亚,就说中国吧,128个显然表示不了所有的汉字。所以就只能用两个字节表示一个汉字。于是规定,原始的 ASCII 还是用一个字节表示,使用连续两个字节(这两个字节值都大于128)表示一个汉字。一共可以表示128×128=1684个汉字(实际没有那么多),叫做 GB212。后来人们发现自己太傻,其实第一个字节大于128的话,我们用连续两个字节表示一个汉字也不会出现歧义,所以规定,如果当前字节小于128那么就是标准的 ASCII,如果当前字节大于128就用当前字节和后面那个字节表示一个汉字,所以可以表示(128×256=2768)个汉字,然后补充了一部分汉字,叫做 GBK。在此基础上又增加了一部分汉字,这个版本叫做 GB1800。(东亚标准里还有BIG5和CJK的故事)。
不同的国家有不同的标准,所以当大家交流的时候就不方便了。所以出现了两个组织(忘记具体叫什么了),开始着手统一全部的字符集(后来其中一个组织觉得另一个组织做就好了,主动退出了),叫做 Unicode。
但是 Unicode 只规定了一个字符的编号,并没有规定具体怎么表示。比如 A 编号65,具体表示的时候可以用一个字节 0x41 表示,可以用两个字节表示 0x00 0x41,或者用四个字节表示 0x00 0x00 0x00 0x41,而且多个字节表示的话还有谁在前的问题。所以在 unicode 表示上出现了不同的标准。UTF-8 就是一种表示的标准(终于说到UTF-8了),不过具体怎么表示就有点儿复杂了,是一种变长编码,有些字符用一个字节(兼容ASCII,这就是为什么UTF-8比较流行)有些用两个有些三个。。。随便百度了一个表示方式,就是把一个如何把一个数字转成几个字节表示。
扩展:还有两种标准 UTF-16,UTF-2,UTF-16统一个用两个字节或是四个字节表示一个字符(java,javascript里就是这种编码,这其中还有USC定长编码的故事),UTF-2统一用4个字节,所以都不兼容ASCII。既然是多字节,就涉及字节顺序的问题。。。。
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
推荐阅读
留言与评论(共有 18 条评论) |
本站网友 孕妇晚期食谱 | 21分钟前 发表 |
不同的国家有不同的标准,所以当大家交流的时候就不方便了 | |
本站网友 瑞兰玻尿酸注射除皱 | 10分钟前 发表 |
UTF-16统一个用两个字节或是四个字节表示一个字符(java | |
本站网友 s系双胞胎 | 19分钟前 发表 |
所以在 unicode 表示上出现了不同的标准 | |
本站网友 adc什么意思 | 14分钟前 发表 |
所以就只能用两个字节表示一个汉字 | |
本站网友 荆芥的作用与功效 | 29分钟前 发表 |
gb1800 mysql GB1800 是中国的标准,国标(GB),就是如何表示一个字符 | |
本站网友 超导磁浮列车 | 12分钟前 发表 |
不同的国家有不同的标准,所以当大家交流的时候就不方便了 | |
本站网友 青青世界酒店 | 15分钟前 发表 |
所以就只能用两个字节表示一个汉字 | |
本站网友 小榄二手房出售 | 18分钟前 发表 |
所以在 unicode 表示上出现了不同的标准 | |
本站网友 性器官图 | 28分钟前 发表 |
扩展:还有两种标准 UTF-16,UTF-2 | |
本站网友 上海通用汽车金融 | 6分钟前 发表 |
在此基础上又增加了一部分汉字,这个版本叫做 GB1800 | |
本站网友 绿豆薏仁汤 | 24分钟前 发表 |
所以说,GB1800 和 unicodeutf-8是不同的字符表示方式,一个是中国制定的标准,一个是国际上的组织制定的标准 | |
本站网友 外国媒体 | 6分钟前 发表 |
ISO8859-2(Latin-2).....ISO8859-16(Latin-10) | |
本站网友 一日十次 | 29分钟前 发表 |
额,中间有一部分不叫 Latin(好坑人呀)但是在东亚,就说中国吧,128个显然表示不了所有的汉字 | |
本站网友 囤积居奇 | 24分钟前 发表 |
UTF-8 就是一种表示的标准(终于说到UTF-8了),不过具体怎么表示就有点儿复杂了,是一种变长编码,有些字符用一个字节(兼容ASCII,这就是为什么UTF-8比较流行)有些用两个有些三个 | |
本站网友 日处口读什么的 | 29分钟前 发表 |
本站网友 防伪商标 | 22分钟前 发表 |
既然是多字节,就涉及字节顺序的问题 | |
本站网友 netman | 18分钟前 发表 |
不同的国家有不同的标准,所以当大家交流的时候就不方便了 |