解决jQuery GBK乱码问题的方法

一、解决jQuery GBK乱码问题的方法

什么是jQuery GBK乱码问题

jQuery是广泛使用的JavaScript库，用于开发Web应用程序。然而，当使用jQuery处理GBK编码的文本时，有时可能会遇到乱码问题。

为什么会出现jQuery GBK乱码问题

在GBK编码中，一个中文字符占用2个字节，而在JavaScript中，一个字符通常表示为1个字节。当使用jQuery处理GBK编码的文本时，由于编码长度不一致，可能导致字符显示错误，从而出现乱码问题。

如何解决jQuery GBK乱码问题

有两种常见的解决方法：

方法一：转换编码
可以使用JavaScript提供的encodeURIComponent函数将GBK编码的文本转换为URL编码格式，然后再使用decodeURIComponent函数将其解码。这样可以确保在JavaScript中正确处理GBK编码的文本。
```
// 示例代码
var gbkText = "中文内容";
var encodedText = encodeURIComponent(gbkText);
var decodedText = decodeURIComponent(encodedText);
console.log(decodedText); // 输出：中文内容
            
```

方法二：使用外部库

除了手动转换编码外，还可以使用一些专门处理编码的外部库，如iconv-lite、jschardet等。这些库提供了更多的编码转换选项，可以更方便地解决jQuery GBK乱码问题。

// 示例代码（使用iconv-lite库）
var iconv = require('iconv-lite');
var gbkBuffer = new Buffer("中文内容", 'binary');
var utf8Text = iconv.decode(gbkBuffer, 'gbk');
console.log(utf8Text); // 输出：中文内容

总结

jQuery GBK乱码问题是由于GBK编码与JavaScript编码不一致所导致的。为了正确处理GBK编码的文本，可以使用encodeURIComponent和decodeURIComponent函数进行手动编码转换，或者使用外部库来处理编码转换。通过以上方法，可以有效解决jQuery GBK乱码问题。

感谢您阅读本文，希望对解决jQuery GBK乱码问题有所帮助。

二、PhantomJS抓取gbk页面乱码，有什么方法解决？

决办法就是安装字体用phantomjs去截取中文页面的网站可能会出现乱码的情况,也就是截图中中文的位置全是方框。在centos中执行:yuminstallbitmap-fontsbitmap-fonts-cj

三、为什么改了gbk还是乱码？

我们知道在计算机内存中，存储的是二进制数据，在网络传输中，也是二进制数据，但最终呈现给用户的是字符串，二进制与字符串的转化就需要编码、解码的参与，如果世界上只有一种字符编码方式，就不会有乱码这一说了，但事实是，编码的方式太多了，utf-8、utf-32、utf-16、gbk、gb2312、iso-8859-1、big5、unicode等等。由于每个编码的规则不一样，一般都不能用一种进行编码，用另一种进行解码。如utf-8中，一个字母用一个字节表示，一个汉字用三个字节表示，特殊的汉字用四个字节表示，而gbk中，一个字母用一个字节表示，一个汉字用两个字节表示。

有一个说法，内存中存储的二进制是unicode码，如果内存中的数据需要存储或传输时，才会进行一次转化，将unicode码转化成其它的编码二进制（有待考证）。个人觉得这种方式很合理，毕竟unicode码中每个字符都有独一无二的二进制与之对应。

排查乱码问题，难度在于是在哪个环节出了问题，但乱码的本质都是一样的，读取二进制的编码和最初将字符串转化成二进制的编码方式不一致。

此处说明一个概念，编码指将字符串转化成二进制，解码指将二进制转化成字符串。

UTF-8编码，GBK解码

在这我们讨论一下，gbk和utf-8互转的乱码问题，直接上代码。

package com.anjz.test;

import java.io.UnsupportedEncodingException;

public class CodingTest {

public static void main(String[] args) throws UnsupportedEncodingException {

String str = "你好，世界";

System.out.println("字符串长度:"+str.length());

byte[] utfBytes = str.getBytes("utf-8");

System.out.println("utf-8需要"+utfBytes.length+"字节存储");

byte[] gbkBytes = str.getBytes("gbk");

System.out.println("gbk需要"+gbkBytes.length+"字节存储");

}

以上代码运行打印出一下内容:

字符串长度:5

utf-8需要15字节存储

gbk需要10字节存储

可以看出，utf-8存储一个汉字，需要3个字节，gbk存储一个汉字，需要2个字节。

现用单个字符测试。

package com.anjz.test;

import java.io.UnsupportedEncodingException;

public class CodingTest {

public static void main(String[] args) throws UnsupportedEncodingException {

String str = "你";

byte[] utfBytes = str.getBytes("utf-8");

for(byte utfByte:utfBytes){

//字节对应的十进制是负数，因java中的二进制使用补码表示的，此处使用0xff 还原成int表示的数据，再转化成16进制

System.out.print(Integer.toHexString((utfByte & 0xFF)) +",");

}

System.out.println();

String utf2gbkStr = new String(str.getBytes("utf-8"),"gbk");

System.out.println("utf-8转化成gbk:"+utf2gbkStr);

byte[] gbkBytes = utf2gbkStr.getBytes("gbk");

for(byte gbkByte:gbkBytes){

System.out.print(Integer.toHexString((gbkByte & 0xFF))+",");

}

System.out.println();

String gbk2utfStr = new String(utf2gbkStr.getBytes("gbk"),"utf-8");

System.out.println("gbk转化成utf-8:"+gbk2utfStr);

}

运行上面代码，得出的结果：

e4,bd,a0,

utf-8转化成gbk:浣�

e4,bd,3f,

gbk转化成utf-8:�?

用两个字符测试，将上述代码String str = “你”改成String str = “你好”。运行代码，得出的结果：

e4,bd,a0,e5,a5,bd,

utf-8转化成gbk:浣犲ソ

e4,bd,a0,e5,a5,bd,

gbk转化成utf-8:你好

上述实验中，utf-8转化成gbk出现乱码，这个很好理解，但是再还原回去，gbk转化成utf-8，单个中文字符依然是乱码，两个字符却能正常显示，这个到底是怎么回事呢？

经过一番研究，想把这个事说明白，还需要从它们的编码规则着手。

ISO-8859-1

单字节编码，向下兼容ASCII，其编码范围是0x00-0xFF，0x00-0x7F之间完全和ASCII一致，0x80-0x9F之间是控制字符，0xA0-0xFF之间是文字符号。

GBK

采用单双字节变长编码，英文使用单字节编码，完全兼容ASCII字符编码，中文部分采用双字节编码。双字节其编码范围从8140至FEFE（剔除xx7F）。

单字节：00000000 - 01111111

双字节：10000001 01000000 - 11111110 11111110 (剔除******** 01111111)

单字节、双字节的区分通过高字节高位区分，单字节高位为0，双字节的高字节高位为1。

UTF-8

可变长字符编码，是unicode码的具体实现，UTF-8用1到6个字节编码Unicode字符。

UTF-8编码规则：如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的字节数，其余各字节均以10开头。

1字节 0xxxxxxx

2字节 110xxxxx 10xxxxxx

3字节 1110xxxx 10xxxxxx 10xxxxxx

4字节 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

5字节 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

6字节 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

明白上述GBK和UTF-8的编码规则，我们再分析一下，单个中文字符是乱码，两个字符却能正常显示的问题。

“你”

UTF-8编码对应的二进制：11100100 10111101 10100000

将上述二进制通过GBK进行解码，根据GBK规则，第一个字节高位为1，使用双字节编码，

“11100100 10111101”解码成“浣”,“10100000”对于GBK来说是非法的，就解码成了一种特殊字符“�”。

看看能不能将“浣�”还原回“你”呢？

GBK编码对应的二进制：11100100 10111101 00111111

看到上述的二进制，根本不符合UTF-8编码规则，故用UTF-8进行解码，是解码成了一些特殊字符“�?”。

对于上述情况可以看出，一个二进制，如果不符合当前的编码规则，会被解码成特殊字符，但此特殊字符再进行编码，是回不到最初的二进制的。

用同样的方式，分析“你好”为什么最终可以正常显示。

UTF-8编码对应的二进制：11100100 10111101 10100000 11100101 10100101 10111101

将上述二进制通过GBK进行编码，根据GBK规则，使用双字节编码，“1100100 10111101”解码成“浣”，“10100000 11100101”解码成“犲”，“10100101 10111101”解码成“ソ”。

看看能不能将“浣犲ソ”还原成“你好”呢？

GBK 编码对应的二进制：11100100 10111101 10100000 11100101 10100101 10111101

可以看出二进制是可以被还原的，将此二进制通过UTF-8解码，肯定能变成“你好”。

可以看出，一个字符串，通过UTF-8进行编码，再通过GBK进行解码，再将得到的字符串进行GBK编码，最后将得到的二进制通过UTF-8解码，能否还原到最初的字符串，在于UTF-8编码后得到的二进制，是否符合GBK的编码规则，如果符合，最终就可以还原，如果不符合，就不可还原。

GBK编码，UTF-8解码

package com.anjz.test;

import java.io.UnsupportedEncodingException;

public class CodingTest {

public static void main(String[] args) throws UnsupportedEncodingException {

String str = "你好";

byte[] gbkBytes = str.getBytes("gbk");

for(byte gbkByte:gbkBytes){

//字节对应的十进制是负数，因java中的二进制使用补码表示的，此处使用0xff 还原成int表示的数据，再转化成16进制

System.out.print(Integer.toHexString((gbkByte & 0xFF)) +",");

}

System.out.println();

String gbk2utfStr = new String(str.getBytes("gbk"),"utf-8");

System.out.println("gbk转化成utf-8:"+gbk2utfStr);

byte[] utfBytes = gbk2utfStr.getBytes("utf-8");

for(byte utfByte:utfBytes){

System.out.print(Integer.toHexString((utfByte & 0xFF))+",");

}

System.out.println();

String utf2gbkStr = new String(gbk2utfStr.getBytes("utf-8"),"gbk");

System.out.println("utf-8转化成gbk:"+utf2gbkStr);

}

运行上述代码，结果为：

c4,e3,ba,c3,

gbk转化成utf-8:��

ef,bf,bd,ef,bf,bd,ef,bf,bd,

utf-8转化成gbk:锟斤拷锟�

上述结果应该都在意料之中，我们通过上述的方法分析一下。

“你好”GBK编码的二进制：11000100 11100011 10111010 11000011

GBK编码的二进制数据，完全匹配不了UTF-8的编码规则，最终UTF-8只能按如下方式匹配，查看第一个字节，开头“110”，理论上匹配两个字节，但看下一个字节，开头却不是“10”，最终“11000100”解码成“�”,看第二个字节开头是“1110”，理论匹配三个字节，看下个字节符合，以“10”开头，但下下个字节开头是“110”，不符合匹配，最终“11100011 10111010”解码成“�”，同理“11000011”也解码成“�”，这个符号都是为找不到对应规则随意匹配的一个特殊字符。

“��”UTF-8编码的二进制为：11101111 10111111 10111101 11101111 10111111 10111101 11101111 10111111 10111101

这个二进制和原先的二进制不相同，根本转化不到最初的字符串，按照GBK的编码规则，“11101111 10111111”编码成“锟”,“10111101 11101111” 编码成“斤”，“10111111 10111101”编码成“拷”，“11101111 10111111”编码成“锟”，“10111101”不符合GBK规则，编码成特殊字符“�”。

理论上说，用GBK编码，UTF-8解码的字符串是不能还原到最初的字符串的，因UTF-8编码规则的特殊性，GBK编出的二进制，是很难匹配上的。

总结

理论上说，系统出现乱码，将乱码还原到最初的样子，上述UTF-8编码，GBK解码，这个有时是可以还原的，有时是还原不了的，要看UTF-8编码的二进制是否都能符合GBK的编码规则，但GBK编码，UTF-8解码，这个基本是条不归路。

但实际中，有一种情况，是100%可以将乱码还原成最初的字符串。就是任意编码格式编码，ISO-8859-1解码，这个主要因为ISO-8859-1是单字节编码，而且匹配所有单字节情况，乱码字符串总是可以还原到最初的二

四、CentOS中文GBK编码乱码问题解决方法

在使用CentOS操作系统时，我们有时会遇到中文文字显示乱码的情况。特别是当我们使用GBK编码进行中文输入或显示时，乱码问题更为突出。

那么，为什么会出现这样的问题呢？在CentOS中，默认的字符编码是UTF-8，而GBK是另一种常用的中文字符编码标准。由于这两种编码标准不一致，当我们在CentOS中输入或显示GBK编码的中文字符时，就会出现乱码现象。

为了解决这个问题，我们可以采取以下几种方法：

1. 修改系统的默认字符编码

通过修改CentOS的配置文件，我们可以将系统的默认字符编码从UTF-8改为GBK，以兼容显示GBK编码的中文字符。

步骤如下：

打开终端并输入以下命令以编辑配置文件：sudo vi /etc/locale.conf
在打开的文件中添加以下内容：LANG="zh_CN.GBK"
保存文件并退出编辑器
重启系统使新的默认字符编码生效：sudo reboot

2. 修改终端的字符编码

如果你只想在终端中显示GBK编码的中文字符而不改变系统的默认字符编码，你可以尝试修改终端的字符编码。

步骤如下：

打开终端并右击窗口
选择“Profiles” > “Profile Preferences”
在“Encodings”选项卡中，选择“GBK”作为终端的字符编码
点击“关闭”保存设置

3. 转换文件的字符编码

当你遇到一个以GBK编码保存的文件，但在CentOS中显示乱码时，你可以尝试将文件的字符编码转换为UTF-8。

步骤如下：

使用文本编辑器（如vi或gedit）打开文件
在编辑器中选择“保存为”或“另存为”选项
将文件的字符编码从GBK转换为UTF-8
保存文件并关闭编辑器

通过以上方法之一，你应该能够解决在CentOS中使用GBK编码出现的乱码问题。如果你有其他相关问题，欢迎留言讨论。

感谢阅读本文，希望能帮助您解决CentOS中GBK乱码问题。

五、服务器安装gbk导向乱码

在构建一个多语言网站时，服务器的编码设置是非常重要的。特别是在服务器安装gbk导向乱码这一问题上，需要特别注意。GBK编码是一种最常用的中文字符编码方式，但在某些情况下，服务器可能会出现乱码的问题。

首先，我们需要确定服务器的默认编码设置。通过以下步骤可以检查服务器的默认编码设置：

登录服务器管理面板。
找到服务器设置或编码设置选项。
查看默认编码设置，确保它为GBK或UTF-8。

如果服务器的默认编码设置不是GBK，那么就需要进行调整。以下是一些调整服务器编码的方法：

方法一：修改服务器配置文件

对于大部分服务器，可以通过修改服务器配置文件来调整默认编码设置。

登录服务器。
找到服务器配置文件，通常是位于/etc目录下的配置文件，例如/etc/httpd/conf/httpd.conf。
打开配置文件并找到 AddDefaultCharset 指令。
将指令的值修改为GB2312、GBK或UTF-8，取决于你的需求。
保存配置文件并重启服务器。

通过这种方法，你可以轻松地修改服务器的默认编码设置，确保支持GBK编码的页面可以正确显示。

方法二：修改网站代码

如果你无法直接修改服务器配置文件，还可以尝试修改网站的代码来解决乱码问题。

首先，需要确保网站的文档声明使用了正确的编码。在文档声明中添加以下代码：

<meta http-equiv="Content-Type" content="text/html; charset=gbk">

这会告诉浏览器使用GBK编码来解析网页内容。

其次，需要检查网页中是否存在其他导致乱码的因素。例如，数据库中存储的数据是否使用了正确的编码，以及网页中使用的字体是否支持GBK编码。

如果你使用了网站框架或内容管理系统，可以查阅相关文档了解如何调整编码设置。

方法三：使用转码工具

如果以上方法都无法解决问题，还可以考虑使用转码工具来处理乱码问题。

转码工具可以将原来编码错误的网页以正确的编码重新保存，从而解决乱码问题。

有些转码工具可以批量处理多个网页，非常方便快捷。

不过需要注意的是，转码工具可能会破坏原有的网页布局或样式，因此在使用之前最好先备份网页文件。

总结来说，服务器安装gbk导向乱码是一个常见的问题，但通过适当的调整可以轻松解决。无论是修改服务器配置文件、调整网站代码还是使用转码工具，都能帮助我们正确显示支持GBK编码的网页内容。

希望以上方法能对解决服务器安装gbk导向乱码问题有所帮助！

六、如何解决代码GBK/UTF-8等字符，编码显示乱码？

在beyond compare中出现GBK/UTF-8等字符，编码显示乱码，可以按照以下步骤操作：

1.在beyond compare中打开文件夹比较会话界面，在“工具”菜单下选择“文件格式”；

2.在打开的文件格式对话框右侧选择第二个“转换”选项，在下面的编码处选择中文编码即可。

如果对以上步骤有任何疑问，可以访问

www.beyondcompare.cc

，有更详细的教程，而且除此之外还有很多免费的教程，希望可以帮到你。

七、乱码，很多显示都是乱码怎么解决？

1.点击开始按钮，然后点击控制面板：

2.进入控制面板点击“时钟、语言和区域”，再点击进入“区域和语言”：

3.点击管理选项，然后点击更改系统区域设置：

4.将当前系统区域设置设置成英语（英国），然后再点击确定按钮，最后再重启电脑：

5.重启电脑后，将当前系统区域设置设置成中文（简体，中国），然后再点击确定按钮，最后再重启电脑：

八、乱码视频中字幕乱码怎么解决？

步骤/方式1

字幕乱码是因为字幕文档的编码方式不对造成的，需要改变字幕文档格式。

步骤1

1、首先打开视频发现字幕乱码了。

步骤/方式2

2、打开已有字幕文件

步骤/方式3

3、双击用记事本打开

步骤/方式4

4、然后点击文件--选择另存为。

步骤/方式5

5、编码方式选择unicode--单击确定。

步骤/方式6

6、重新加载文件--成功。

九、gbk码？

GBK全名为汉字内码扩展规范，英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音（KuoZhan）中“扩”字的声母。GBK 亦采用双字节表示，总体编码范围为8140-FEFE，首字节在81-FE 之间，尾字节在40-FE 之间，剔除 xx7F一条线。总计23940 个码位，共收入21886个汉字和图形符号，其中汉字（包括部首和构件）21003 个，图形符号883 个。

十、小说乱码怎么解决？

建议您：打开TXT文档，点击左上角[文件]--选择[另存为] --在下方的编码位置选择[UTF-8]--点击[保存]。再次尝试发送。手里刚入手的Kindle也是一样，下载的txt偶尔会出现一段乱码，我用这样的办法解决了。如果还不行，可以在电脑上用格式转换器转换为Kindle比较支持的格式。

顶一下

(0)

踩一下

(0)

相关评论

我要评论

解决jQuery GBK乱码问题的方法

一、解决jQuery GBK乱码问题的方法

什么是jQuery GBK乱码问题

为什么会出现jQuery GBK乱码问题

如何解决jQuery GBK乱码问题

总结

二、PhantomJS抓取gbk页面乱码，有什么方法解决？

三、为什么改了gbk还是乱码？

四、CentOS中文GBK编码乱码问题解决方法

1. 修改系统的默认字符编码

2. 修改终端的字符编码

3. 转换文件的字符编码

五、服务器安装gbk导向乱码

方法一：修改服务器配置文件

方法二：修改网站代码

方法三：使用转码工具

六、如何解决代码GBK/UTF-8等字符，编码显示乱码？

七、乱码，很多显示都是乱码怎么解决？

八、乱码视频中字幕乱码怎么解决？

九、gbk码？

十、小说乱码怎么解决？

Excel为什么输入数字后会变成乱码？

word文档显示乱码怎么解决？

为什么复制WPS成乱码？

表白代码生成器app？

网页正常，查看源码显示中文全是乱码？

电脑导出的资料都是乱码怎么解决？

wordpress 安装乱码

word文档出现乱码

为什么导出EXCEL格式报表后是乱码？

网银支付页面怎么突然全像是乱码一样？