常用编码格式介绍_数据库编码格式

全栈程序员-用户IM • 2022年8月6日上午8:46 • 未分类

常用编码格式介绍_数据库编码格式编程过程中经常会遇到各类字符的编码方式，经常会混淆，在此总结下常用的编码方式以及其原理。Ascii：因为对于计算机来说只能识别0、1这两种字符（0表示低电平，1表示高电平），所有的数据都是通过二进

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

编程过程中经常会遇到各类字符的编码方式，经常会混淆，在此总结下常用的编码方式以及其原理。

Ascii：

　　因为对于计算机来说只能识别0、1这两种字符（0表示低电平，1表示高电平），所有的数据都是通过二进制来表示，对于其他的比如说3、4、s、z、#等字符用二进制表示就需要一个约定的规范，这就是ascii的由来。

　　Ascii码表是用1个字节来表示128种字符（一个字节8位，可以组成256种字符，首位默认为0，所以ASCII最多就128个字符，当首位为1的时候我们后面再讨论），其中0-31和127表示控制字符，他们是不可见字符。

　　32-126是可见字符，48-57表示0-9，65-90为26个大写英文字母，97-122是26个小写英文字母。

GBK:

　　现在英文和数字都有了，但是我们中国汉字怎么表示呢？此时GBK应运而生，上面我们得知ASCII首位为0，假如把它改成1，就表示中文。GBK由2个字节来表示，第一个字节的最高位是0则表示字母和数字，假如是1则表示中文。

Unicode：

　　Unicode则是收录了世界上所有的语言，但是在运用过程种会出现很多问题，比如一个3个字节的字符，如何区分他是1个unicode还是3个asicii，还有假如使用unicode，英文字母高位都会设置成0，这就造成了很大的浪费。因此UTF-8、UTF-16、UTF-32就出现来解决这些问题，主要讲当前互联网上常用的UTF-8

UTF-8：

　　UTF-8的规则很简单就两条：

　　1、对于单字节的字符，最高位为0，其实跟ascii表示一致

　　2、对于n个字节的字符，第一个字节的最高位为n个1，第n+1设为0，后面每个字节的前两位都为10，剩下的用字符对应的unicode来表示，如下图

　　Unicode符号范围 | UTF-8编码方式
　　(十六进制) | （二进制）
　　——————–+———————————————
　　0000 0000-0000 007F | 0xxxxxxx
　　0000 0080-0000 07FF | 110xxxxx 10xxxxxx
　　0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
　　0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

BCD：

　　BCD编码主要用于数字0-9的压缩，因为0-9二进制表示为0000 0000到0000 1001，它们的前4位都是0，把他们合并就生成一个新的字符。

比如2个字符’1’,’9’，他们对应的Ascii为0x31和0x39，因此表示形式则为2个字节0x31 0x39

假如用BCD格式来表示则将其数字对应的二进制前4位去掉，然后合并，即将00000001和00001001前4位去掉得到0001 1001，得到新的1个字节0x19,这样看起来就跟十进制一样，这就是BCD压缩码的原理。

Base64编码：

　　Base64编码的作用是将ascii里面的不可见字符变成可见字符来传输。Base64编码的最小使用单元是4个字节，每个字节使用6位，假如不足6的整数倍，则后面补0，剩下的字符补=，因为计算机存储字节是8位，所以计算字符值时在前面补2个0。

可能说的有些绕，看下一张图就了解了

（借用网上的一张图片 http://www.cnblogs.com/caoyc/p/5794720.html）

以A为例补位之后第一个字节为010000，前面补0得到00010000，对应10进制为16，对照字符表得到Q，第二个字节一样，也是Q，然后base64编码最小是4个字节，后面两个字节补=，最终得到QQ==

常用编码格式介绍_数据库编码格式

下面是一个Base64字符集，它包含大写字母、小写字母和数字，以及“+”和“/”符号。

常用编码格式介绍_数据库编码格式

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/166851.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

Ubuntu 18.04安装i686-elf交叉编译工具链的方法[通俗易懂]

Ubuntu 18.04安装i686-elf交叉编译工具链的方法[通俗易懂]一、准备系统：Ubuntu18.04LTS64位Ubuntureleasesgcc7.3.0、g++7.3.0：#切换到超级用户模式，可以Ctrl+D切回普通用户sudo-sadd-apt-repositoryppa:ubuntu-toolchain-r/testapt-getupdateapt-getinstallgcc-7apt-g…

全栈程序员-用户IM
2022年6月7日
在Windows XP 上架设 FTP服务器

在Windows XP 上架设 FTP服务器架设一台FTP服务器其实很简单。首先，要保证你的机器能上网，而且有不低于ADSL512Kbps的网络速度。其次，硬件性能要能满足你的需要。最后，需要安装FTP服务器端的软件，这类软件很多，可以使用微软的IIS(InternetInformationServer因特网信息服务系统)，也可以使用专业软件。不同的软件提供的功能不同，适应的需求和操作系统也不同。一般来说，系统最低要求如下：CPU

全栈程序员-用户IM
2022年7月21日
PyTorch 中的数据类型 torch.utils.data.DataLoader

PyTorch 中的数据类型 torch.utils.data.DataLoaderDataLoader是PyTorch中的一种数据类型。在PyTorch中训练模型经常要使用它，那么该数据结构长什么样子，如何生成这样的数据类型？下面就研究一下：先看看 dataloader.py脚本是怎么写的（VS中按F12跳转到该脚本） __init__（构造函数）中的几个重要的属性：1、dataset：（数据类型dataset）输入的数据类型。看名字感觉就像是数据库，…

全栈程序员-用户IM
2022年5月20日
idea

golang 2021最新激活码_通用破解码[通俗易懂]

golang 2021最新激活码_通用破解码，https://javaforall.cn/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧！

全栈程序员-用户IM
2022年3月17日
java水仙花数代码，三位四位五位

java水仙花数代码，三位四位五位ShuiXianHua.javapublicclassShuiXianHua{publicstaticvoidmain(String[]args){for(inti=100;i<1000;i++){intx=i/100;inty=i/10%10;intz=i%10;if(x*x*x+y*y*y+z*z*z==i){

全栈程序员-用户IM
2022年7月8日
Python画图爱心_python语言画爱心

Python画图爱心_python语言画爱心都说程序员不浪漫，上次看到一个程序员小哥给自己老婆开发了一个专属的APP。其实程序员还有更多美好的事情可以做，比如，给你喜欢的妹纸，用代码的方式去表白(当然可能还有一些前戏啥的，自己结合实际场景再渲染下)，直接上代码：print’\n’.join([”.join([(‘loveyou'[(x-y)%8]if((x*0.05)**2+(y*0.1)**2-1)**3-(x*0.05)**2*(y…

全栈程序员-用户IM
2022年9月6日

发表回复

关注全栈程序员社区公众号