相信大家应该都知道计算机中是不能直接存储汉字,而存储的是编码。
那么在不同的环境需求下,就会有不同的字符编码。
gb2312和utf-8就都是一种字符编码。在之前的文章【gbk和gb2312的区别有哪些?】中,已经为大家总结了gbk与gb2312的区别,并且也具体介绍了什么是字符编码?需要的朋友可以前去参考了解。
GB2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字符组成。gb2312 是国标,是中国的字库,里面仅涵盖了汉字和一些常用外文,比如日文片假名,和常见的符号。
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。
UTF-8里面存储一个汉字3个字节。而gb2312中存储一个汉字2个字节。
gb2312和utf-8的主要区别:
关于字库规模: UTF-8 > gb2312(utf8字全而gb2312只有汉字)
关于保存大小: UTF-8> gb2312 (utf8更臃肿、加载更慢,gb2312更小巧,加载更快)
关于适用范围:gb2312主要在中国大陆地区使用,是一个本地化的字符集,UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。
那么如何选择在项目开发时的编码?
这就需要大家根据自身的需求结合不同编码的优势来进行选择。
比如,网站内容数据很多,并且只针对国内用户,推荐使用gb2312编码。
如果网站英文内容较多或者内容少的企业站,推荐使用utf-8编码。
这个主要是根据gb2312和utf8编码的数据库存储空间不同来选择的。
本篇文章就是关于gb2312和utf-8的区别介绍,希望对需要的朋友有所帮助!
以上就是gb2312和utf-8的区别有哪些?如何选择?(总结)的详细内容,更多请关注php中文网其它相关文章!
……