java字符串gb18030编码和utf8编码互转[通俗易懂]

java字符串gb18030编码和utf8编码互转[通俗易懂]java字符串gb18030编码和utf8编码互转

大家好,又见面了,我是你们的朋友全栈君。

在做接口联调的时候出现访问对方的时候需要把编码转成gb18030格式的,我这边默认是utf8,这个困扰了很长时间,在网上百度发现大部分字符串转编码都是使用string.getByte(“编码格式”)的方式字节转码,可事实上这样是行不通的。原因有点难说,这里我就说一下可行的方案。

@Test
	public void toObject() throws UnsupportedEncodingException{
		System.out.println("2".equals(null));
		String str = "ab丁亦凝";//编译环境默认是utf8格式
		byte[] bytes = str.getBytes(Charset.forName("GB18030"));//这一步就是转成gb18030格式的字节码
        for (byte b : bytes)  
        {  
            System.out.print(b + " ");  
        }  
        //字节码转成gb18030的字符串
        String str4 = new String(bytes, "GB18030");
        System.out.println(str4);
        System.out.println();  
         
        //再转回utf8
        byte[] bytes4 = str4.getBytes(Charset.forName("UTF-8"));  
        for (byte b : bytes4)  
        {  
            System.out.print(b + " ");  
        }  
        System.out.println();  
        String str44 = new String(bytes4, "UTF-8");  
        System.out.println("---"+str44);//abc你好  
	}

下面再介绍几种其他格式的,其实方式都一样:

@Test
	public void aaa(){
		
		  System.out.println("default charset : "+Charset.defaultCharset());  
	        String str = "abc你好";//string with UTF-8 charset  
	  
	        byte[] bytes = str.getBytes(Charset.forName("UTF-8"));//convert to byte array with UTF-8 encode  
	        for (byte b : bytes)  
	        {  
	            System.out.print(b + " ");  
	        }  
	        System.out.println();  
	        try  
	        {  
	            String str1 = new String(bytes, "UTF-8");//to UTF-8 string  
	            String str2 = new String(bytes, "ISO-8859-1");//to ISO-8859-1 string  
	            String str3 = new String(bytes, "GBK");//to GBK string  
	            String str4 = new String(bytes, "GB18030");
	            System.out.println(str1);//abc你好  
	            System.out.println(str2);//abc??????  
	            System.out.println(str3);//abc浣犲ソ  
	            System.out.println(str4);
	            System.out.println();  
	            byte[] bytes2 = str2.getBytes(Charset.forName("ISO-8859-1"));  
	            for (byte b : bytes2)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str22 = new String(bytes2, "UTF-8");  
	            System.out.println(str22);//abc你好  
	              
	            System.out.println();  
	            byte[] bytes3 = str3.getBytes(Charset.forName("GBK"));  
	            for (byte b : bytes3)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str33 = new String(bytes3, "UTF-8");  
	            
	            byte[] bytes4 = str4.getBytes(Charset.forName("GB18030"));  
	            for (byte b : bytes4)  
	            {  
	                System.out.print(b + " ");  
	            }  
	            System.out.println();  
	            String str44 = new String(bytes4, "UTF-8");  
	            System.out.println("---"+str44);//abc你好  
	        } catch (UnsupportedEncodingException e)  
	        {  
	            e.printStackTrace();  
	        }  
	}

最后在联调接口通讯中,注意两点:

1,在最终传输的字节数组中修改编码,

2,对方返回的信息,要先使用对方编码转成字符串,再转成自己需要的编码

在下面的例子中有讲解:

private String sendReq(Object req) throws Exception {
        String reqXml =  XStreamHandler.toXml(req);
        //加入报文头
        reqXml=HEADER+reqXml;
        //计算报文长度
		int len=reqXml.getBytes().length;
		String bodyStr = String.format("%04d", len);
		//加入报文长度
		reqXml=bodyStr+reqXml;
		//utf8转gb18030  下面两行就是多余的,因为不是最终修改编码的位置
		byte[] bytes = reqXml.getBytes(Charset.forName("GB18030"));
		reqXml = new String(bytes, "GB18030");
		logger.info("组装好的最终报文是:"+reqXml);
		YakMessage msg = new YakMessage();
		ByteBuffer buffer = ByteBuffer.allocate(reqXml.getBytes().length);
		buffer.put(reqXml.getBytes(Charset.forName("GB18030"))); //这里才是有用的,因为参数传递最终还是在io流中以字节格式传输的
		//设置YakMessage
		msg.setRawMessage(buffer.array());
		buffer.clear();
		//发送请求
		YakMessage response = FBHYShortTermSocketClient.write(msg);
		String respXml = new String(response.getRawMessage(),Charset.forName("GB18030"));//这里对面返回的文字编码是GB18030,
		//gb18030转utf8
		byte[] bytes2 = respXml.getBytes(Charset.forName("UTF-8"));  
	    respXml = new String(bytes2, "UTF-8");
		return respXml;
	}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/106078.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • rviz的简单使用[通俗易懂]

    rviz的简单使用[通俗易懂]原链接:http://community.bwbot.orgrviz是ros自带的一个图形化工具,可以方便的对ros的程序进行图形化操作。其使用也是比较简单。整体界面如下图所示界面主要分为左侧的显示设置区域,中间的大的显示区域和右侧的视角设置区域。最上面是和导航相关的几个工具。最下面是ros状态相关的一些数据的显示。下面以用rviz查看ORB_SLAM2的topic数据为例展示一下rvi

  • ⁉️socket实现Ping命令打造⚡BOSS来了⚡摸鱼神器⭐干货巨多❤️建议收藏❤️

    ⁉️socket实现Ping命令打造⚡BOSS来了⚡摸鱼神器⭐干货巨多❤️建议收藏❤️大家好,我是????前面我写了篇水文《获取当前局域网下所有连接设备的ip地址和mac地址》,但是没有想到的是居然上了热榜,也是我个人第一篇上热榜的文章,阅读量瞬间飙升????。然而我的硬核技术文却几乎没有人看到。既然又很多人对这个话题感兴趣,那么我们就继续对相关原理深挖,最好能自己实现,理解透彻。首先我们回顾一下前文,在前文中我介绍了windows下获取ip地址和arp映射表的命令,通过分析最新arp映射表知道当前网段下在线或下线的设备⭐。文章使用的技术是通过python调用系统ping命令,实现ar

  • phpstorm2021永久激活码【在线破解激活】

    phpstorm2021永久激活码【在线破解激活】,https://javaforall.cn/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

  • 爬虫–简单woff文件的处理

    爬虫–简单woff文件的处理woff文件Web开放字体格式(WebOpenFontFormat,简称WOFF)是一种网页所采用的字体格式标准。此字体格式发展于2009年,现在正由万维网联盟的Web字体工作小组标准化,以求成为推荐标准。此字体格式不但能够有效利用压缩来减少档案大小,并且不包含加密也不受DRM(数位著作权管理)限制。而且有时候再页面接受的时候其返回的是一个字符串:如下不过看其这个url,其实简单理解就是data:font/truetype;charset=utf-8;base64,+字符串有要尝试的可以

    2022年10月26日
  • ELK搭建的坑_elk技术栈

    ELK搭建的坑_elk技术栈ELK搭建的坑

    2022年10月20日
  • 2021好玩的微信小程序_如何制作微信小程序

    2021好玩的微信小程序_如何制作微信小程序一、前期准备工作1、注册微信小程序开发者账号在官网注册页选择小程序注册即可,账号分为个人版和企业版:个人版相对于企业版注册流程更为简单和宽松。企业版注册需要支付认证费用,一般为300元,个人版不需要,企业版经过微信官方认证,更具有信誉度。个人版更多只是一个展示的平台,企业版可以作为一个完整的平台,个人版不可以做商业性质的小程序,但是企业版可以,个人版不可以开通微信支付。附近的小程序不显示个人版,只能通过搜索,扫码方式找到。个人版不支持快速获取微信用户的手机号。2、下载微信开发者工具微信平

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号