GBK编码是一种 汉字内码扩展规范,其全称为《汉字内码扩展规范》(Chinese Internal Code Specification),简称为GBK。GBK编码标准兼容GB2312,并扩展了其汉字和图形符号的编码范围。GBK编码采用双字节表示,其总体编码范围为8140-FEFE,首字节在81-FE之间,尾字节在40-FE之间,剔除xx7F一条线。总计有23940个码位,共收录了21886个汉字和图形符号,其中汉字(包括部首和构件)有21003个,图形符号有883个。
GBK编码与GB2312编码的主要区别在于,GBK对GB2312未能涵盖的汉字和一些特殊字符进行了补充,从而扩展了其编码能力。例如,GBK编码收录了GB2312中的全部汉字(6763个),并额外收录了其他汉字、部首、符号等,使得其能够表示的字符集更加广泛。此外,GBK编码还支持ISO 10646.1国际标准,为后续的字符编码标准(如GB18030)奠定了基础。
在实际应用中,GBK编码被广泛应用于各种中文处理软件,如Microsoft Windows 95/98操作系统、Internet Explorer浏览器等,也常见于各种中文输入法和字库中。尽管如此,随着Unicode标准的普及,GBK逐渐被GB18030和UTF-8等更先进的编码标准所取代,但在一些特定领域和旧系统中仍具有重要地位。