excel汉字内码函数(汉字内码格式)

1. 汉字内码格式

汉字出现乱码有好几种情况，大致可分成四类：网页、文本、文档和文件乱码。第一类是由于港台的繁体中文大五码（BIG5）与大陆简体中文（GB2312）不通用造成的；第二类是Win9X/Win2K系统（菜单、桌面、提示框）显示乱码，这是Win9X/Win2K注册表中有关字体的部分设置不当引起的；第三类是各种应用程序（包括游戏）本来显示中文的地方出现乱码，形成原因比较复杂，有第二类的乱码原因，也可能是软件用到的中文动态链接库被英文动态链接库覆盖造成的；最后一类是邮件乱码。

由于楼主你没有说清楚具体是什么，所以只好写长一些了，呵呵，希望楼主有耐心看完：

（一）、网页、文本和文档文件乱码的消除

网页乱码是浏览器（如IE等）对HTML网页解释时形成的。如果在网页的代码中有形如：〈HTML〉〈HEAD〉〈META CONTENT=“text/html；charset=ISO-8859-1”〉〈/HEAD〉……〈/HTML〉的语句，浏览器在显示此页时，就会出现乱码。因为浏览器会将此页语种辨认为“欧洲语系”。解决的办法是将语种“ISO-8859-1”改为GB2312，如果是繁体网页则改为BIG5。

另一种解决办法是不修改网页代码，事先为浏览器安装多语言支持包（例如在安装IE时要安装多语言支持包），这样在浏览网页出现乱码时，就可以在浏览器中选择菜单栏下的“查看”/“编码”/“自动选择”/简体中文（GB2312），如为繁体中文则选择“查看”/“编码”/“自动选择”/繁体中文（BIG5），其它语言依此类推选择相应的语系，这样可消除网页乱码现象。

还有一种解决办法是利用多内码显示平台来转换内码。常用多内码显示平台有：“南极星”、“四通利方”、“MagicWin 98等等。

网页无乱码保存的方法是：用浏览器打开网页时，在“查看”/“编码”中选择“自动选择”，存盘时保存类型选“web页”，编码选择“UNICOD”，这样保存过的网页再次打开时，在浏览器菜单“查看”、“编码”中不管选择简体中文（GB2312）、简体中文（HZ）还是UNICODE（UTF-8）或繁体中文（BIG5），最终显示都不会出现乱码。

文本、文档文件乱码，一般是繁体中文显示在简体中文系统下或者相反情况造成的。只要把原本是繁体的内码转换为简体内码（或者相反），就可消除乱码。

Word能胜任这类工作，例如要把繁体中文转换为简体中文，方法是：选择要转换内码的文件，在弹出的对话框中，选择“其它编码”中的“繁体中文（BIG5）”一项，打开此文件时就不会出现乱码。无乱码保存方法：在保存时选择“文件”中的“另存为”，先存为“Word文档，存盘后打开再存为纯文本等其它格式；您也可以用Word的“中文简繁转换”工具实现无乱码保存，方法是在菜单栏中选择“工具/语言/中文简繁转换”，内码转换后再保存。

除此之外，消除这类乱码还可用内码转换工具，对BIG5（繁体中文）和GB2312（国标码、简体中文）进行相互转换来实现。常用的内码转换工具有：“飓风简繁通、“内码转换大师、“华语通、“两岸通汉字内码转换器等等

2. 汉字内码编码方式

根据应用目的的不同，汉字编码分为外码、交换码、机内码和字形码。

1.外码（输入码）

外码也叫输入码，是用来将汉字输入到计算机中的一组键盘符号。目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等，一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点，每个人可根据自己的需要进行选择。在后面的章节中，重点介绍智能全拼输入法和五笔字型输入法。

2.交换码(国标码)

计算机内部处理的信息，都是用二进制代码表示的，汉字也不例外。而二进制代码使用起来是不方便的，于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》，即国标码。

区位码是国标码的另一种表现形式，把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵，分为94个“区”，每区包含94个“位”，其中“区”的序号由01至94，“位”的序号也是从01至94。94个区中位置总数=94×94=8836个，其中7445个汉字和图形字符中的每一个占一个位置后，还剩下1391个空位，这1391个位置空下来保留备用。

3.机内码

根据国标码的规定，每一个汉字都有了确定的二进制代码，在微机内部汉字代码都用机内码，在磁盘上记录汉字代码也使用机内码。

4.汉字的字形码

字形码是汉字的输出码，输出汉字时都采用图形方式，无论汉字的笔画多少，每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。

3. 汉字字符内码

汉字的机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码，又称为汉字内码。

1、内码是指计算机汉字系统中使用的二进制字符编码，是沟通输入、输出与系统平台之间的交换码，通过内码可以达到通用和高效率传输文本的目的。比如MS Word中所存储和调用的就是内码而非图形文字。2、汉字内码：ANSI码是单一字节（8位二进制数）的编码集，最多只能表示256个字符，不能表示众多的汉字字符，各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集，以能够处理大数量的汉字字符。3、GB码：GB码是1980年国家公布的简体汉字编码方案，在大陆、新加坡得到广泛的使用，也称国标码。国标码对6763个汉字集进行了编码，涵盖了大多数正在使用的汉字。4、由于历史、地区原因，有时一种文字会出现多种编码方案，特别是汉字。由于不同于系统内码的字符不能在该系统中正常显示，必须要进行字符的内码转换，即将非系统内码的字符转换为系统可以识别的内码字符。

4. 汉字内码要求

首先将区位码转换成国际码，然后将国际码加上8080h，即得机内码。自己总结一下：

1.区位码（十进制）转换成区位码（十六进制）。这里要把前两个位换成十六进制，然后后两位换成十六进制。

例如，某汉字的区位码是5448，这样把54转换为16进制数36；再把位码48转换为16进制数为30，得到十六进制数3630。

2.国际码=区位码（十六进制）＋2020h 例如，3630h+2020h=5650h 得到国标码gb2312 3.汉字机内码=国际码＋8080h 机内码就是5650h+8080h=d6d0h

5. 汉字机内码正确格式

字节（Byte 发音：/‘bait/）：字节是通过网络传输信息（或在硬盘或内存中存储信息）的单位。　　在ASCII码中，一个英文字母（不分大小写）占一个字节的空间，一个中文汉字占两个字节的空间。　　符号：英文标点占一个字节，中文标点占两个字节。举例：英文句号“.”占1个字节的大小，中文句号“。”占2个字节的大小　　一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数，换算为十进制最小值：0 最大值：255 。如一个ASCII码就是一个字节。UNICODE　　字符串在内存中，如果“字符”是以在Unicode中的序号存在的，那么我们称这种字符串为Unicode字符串或者宽字节字符串。在Unicode中，每个字符都占两个字节。如，"中文123"（占10字节）。　　Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。

6. 汉字内码的正确形式

计算机中汉字的表示也是用二进制编码，同样是人为编码的。根据应用目的的不同，汉字编码分为外码、交换码、机内码和字形码。

1.外码（输入码）

外码也叫输入码，是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等，一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点，每个人可根据自己的需要进行选择。

2.交换码(国标码)

3.机内码

根据国标码的规定，每一个汉字都有了确定的二进制代码，在微机内部汉字代码都用机内码，在磁盘上记录汉字代码也使用机内码。

4.汉字的字形码

字形码是汉字的输出码，输出汉字时都采用图形方式，无论汉字的笔画多少，每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。

5.汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。它与汉字内码有着简单的对应关系，以简化内码到地址码的转换

顶一下

(0)

踩一下

(0)

相关评论

我要评论

excel汉字内码函数(汉字内码格式)

1. 汉字内码格式

2. 汉字内码编码方式

3. 汉字字符内码

4. 汉字内码要求

5. 汉字机内码正确格式

6. 汉字内码的正确形式

excel一直在访问打印机(为什么打开excel总是出现访问打印机)

软件导出excel失败的原因(excel导出失败怎么办)

行政excel字体规范(政府excel表格字体要求)

如何查看excel的打开记录(怎么查看excel打开记录)

excel行高不能超过409(excel解除限定行高409)

最小二乘法excel(最小二乘法计算器在线)

为什么苹果excel打不开(苹果系统excel无法打开)

excel怎么换下一页(表格怎么切换下一页)

mac能用几年(mac能用wallpaper engine吗)

excel文本溢出(excel公式的结果产生溢出)