java 字符 几个字节_java中字符串占几个字节「建议收藏」

java 字符 几个字节_java中字符串占几个字节「建议收藏」首先,char为Java的基本类型,基本类型所占的字节数是固定的,如int占4字节,double占8字节,这可以使得Java在不同的平台上所占类型固定,很好地保证了Java的可移植性。因此,Java中char类型固定占2个字节。(注:char类型也可以存储一个汉字)。其次,String采用一种更灵活的方式进行存储。在String中,一个英文字符占1个字节,而中文字符根据编码的不同所占字节数也不同。…

大家好,又见面了,我是你们的朋友全栈君。

dc1e68869f05e0d5f97e1254b34ca3b0.png

首先,char为Java的基本类型,基本类型所占的字节数是固定的,如int占4字节,double占8字节,这可以使得Java在不同的平台上所占类型固定,很好地保证了Java的可移植性。因此,Java中char类型固定占2个字节。(注:char类型也可以存储一个汉字)。

其次,String采用一种更灵活的方式进行存储。在String中,一个英文字符占1个字节,而中文字符根据编码的不同所占字节数也不同。在UTF-8编码下,一个中文字符占3个字节;而使用GBK编码时一个中文字符占2个字节。

测试代码如下:import java.io.UnsupportedEncodingException;

public class StrTest {

public static void main(String[] args) throws UnsupportedEncodingException {

String str1 = “hello”;

String str2 = “你好abc”;

System.out.println(“utf-8编码下’hello’所占的字节数:” + str1.getBytes(“utf-8”).length);

System.out.println(“gbk编码下’hello’所占的字节数:” + str1.getBytes(“gbk”).length);

System.out.println(“utf-8编码下’你好abc’所占的字节数:” + str2.getBytes(“utf-8”).length);

System.out.println(“gbk编码下你好’你好abc’所占的字节数:” + str2.getBytes(“gbk”).length);

}

}

输出结果:utf-8编码下’hello’所占的字节数: 5

gbk编码下’hello’所占的字节数: 5

utf-8编码下’你好abc’所占的字节数: 9

gbk编码下你好’你好abc’所占的字节数: 7

由此可见,对也String来说,一个英文字符固定占1个字节,而中文字符占2个(GBK编码)或3个(UTF-8编码)字节。也可使用此方法查看其它编码的情况,此处不再一一赘述。

最后,基于String的这种特性,可以判断一个字符串中是否包含中文,举例如下:public class StrTest {

public static void main(String[] args) throws UnsupportedEncodingException {

searchChineseCharacter(“Good morning”);

searchChineseCharacter(“hello 早上好”);

}

//找出一个字符串中的汉字

public static void searchChineseCharacter(String str){

//正则表达式,用于匹配中文字符

String regex = “[u4e00-u9fa5]”;

//如果str的长度和其所占字节数不等,说明包含中文

if (str.length() != str.getBytes().length){

Pattern pattern = Pattern.compile(regex);

Matcher matcher = pattern.matcher(str);

System.out.print(“‘” + str + “‘ 中的汉字为:”);

while (matcher.find()){

System.out.print(matcher.group());

}

}

else {

System.out.println(“‘” + str + “‘ 中无汉字”);

}

}

}

输出结果:‘Good morning’ 中无汉字

‘hello 早上好’ 中的汉字为:早上好

推荐教程:java入门教程

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/153142.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 异步fifo简介_异步fifo时序

    异步fifo简介_异步fifo时序一、概述在大规模ASIC或FPGA设计中,多时钟系统往往是不可避免的,这样就产生了不同时钟域数据传输的问题,其中一个比较好的解决方案就是使用异步FIFO来作不同时钟域数据传输的缓冲区,这样既可以使相异时钟域数据传输的时序要求变得宽松,也提高了它们之间的传输效率。此文内容就是阐述异步FIFO的设计。二、设计原理2.1结构框图如上图所示的同步模块synchronizetowr…

  • googlenet优点_googlenet提出的inception结构优势

    googlenet优点_googlenet提出的inception结构优势googlenet是2014年imagenet的冠军,同年还有VGG。因此在说googlenet之前,先回顾下VGG。之前介绍过fasterRCNN,fasterRCNN底层的模型官方支持了VGG和ZF,同样在K80下,ZF大概是8fps的速度,而VGG大概是3fps,这无疑就说明了VGG有些重。再给个直观的感受,通常我们VGG的fasterRCNN模型大概是400M左右,而goog…

  • DDL和DML的含义

    DDL表示DataDefinitionLanguage数据定义语言,主要包括CREATE,ALTER,DROP;隐性提交的,不能rollback。DML表示DataManipulationLanguage数据操作语言,主要的DML有SELECT,INSERT,UPDATE,DELETE;可以手动控制事务的开启、提交和回滚的。…

  • 大物电磁感应定律知识总结_电动势等于电压吗

    大物电磁感应定律知识总结_电动势等于电压吗动生电动势:磁场保持不变,导体回路或导体在磁场中运动产生的电动势感生电动势:导体回路不动,磁场发生变化产生的电动势一、在磁场中运动的导线内的感应电动势磁通量变化率为:根据法拉第电磁感应定律,在运动导线MN段上产生的动生电动势即为:因此,动生电动势在量值上等于在单位时间内导线所切割的磁感应线数动生电动势的电子理论解释当导线以速度v向右运动时,导线内每个自由电子获得向右的定向速度v,由于在磁场中,自由电子收到洛伦兹力电子在这个力的作用下,从导…

    2022年10月25日
  • 《异常检测——从经典算法到深度学习》6 基于重构概率的 VAE 异常检测

    《异常检测——从经典算法到深度学习》6 基于重构概率的 VAE 异常检测目录0概论1基于隔离森林的异常检测算法2基于LOF的异常检测算法3基于One-ClassSVM的异常检测算法4基于高斯概率密度异常检测算法5Opprentice——异常检测经典算法最终篇6基于VAE的异常检测算法6.基于VAE的异常检测算法论文名称:VariationalAutoencoderbasedAnomalyDetectionusingReconstructionProbability发表时间:2015.12立即下载论文总体

  • JAVA中调用CMD命令,并输出运行结果

    JAVA中调用CMD命令,并输出运行结果

    2021年11月16日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号