GBK,UTF8是什么?

GBK蕴含全副中文字符;

UTF-8则蕴含全世界一切国度需求用到的字符。

GBK是在国度规范GB2312根底上扩容后兼容GB2312的规范(如同还不是国度规范)

UTF-8编码的文字能够在各国各种支持UTF8字符集的阅读器上显示。

比方,假如是UTF8编码,则在本国人的英文IE上也能显示中文,而无需他们下载IE的中文言语支持包。 所以,关于英文比拟多的论坛 ,应用GBK则每个字符占用2个字节,而应用UTF-8英文却只占一个字节。

UTF8是国内编码,它的通用性比拟好,本国人也能够阅读论坛

GBK是国度编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大

UTF-8:Unicode TransformationFormat-8bit,容许含BOM,但通常不含BOM。是用以处理国内上字符的一种多字节编码,它对英文应用8位(即一个字节),中文应用24为(三个字节)来编码。UTF-8蕴含全世界一切国度需求用到的字符,是国内编码,通用性强。UTF-8编码的文字能够在各国支持UTF8字符集的阅读器上显示。如,假如是UTF8编码,则在本国人的英文IE上也能显示中文,他们无需下载IE的中文言语支持包。

GBK是国度规范GB2312根底上扩容后兼容GB2312的规范。GBK的文字编码是用双字节来示意的,即不管中、英文字符均应用双字节来示意,为了区分中文,将其最高位都设定成1。GBK蕴含全副中文字符,是国度编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8之间都必需经过Unicode编码能力互相转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

关于一个网站、论坛来说,假如英文字符较多,则倡议应用UTF-8节省空间。不过如今很多论坛的插件普通只支持GBK。

个编码的区别具体解释

简略来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的体现方式.而后面那三种编码是一兼容的,同一个汉字,那三个码值是齐全不一样的.如"汉"的uncode值与gbk就是不一样的,假定uncode为a040,gbk为b030,而uft-8码,就是把那个值体现的方式.utf-8码齐全只针对uncode来组织的,假如GBK要转UTF-8必需先转uncode码,再转utf-8就OK了.