大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
受到 @ Ankan-Zerob 的挑战,这是我对可以存储在以字为单位的每种文本类型中的最大长度的估计:Type | Bytes | English words | Multi-byte words
———–+—————+—————+—————–
TINYTEXT | 255 | ±44 | ±23
TEXT | 65,535 | ±11,000 | ±5,900
MEDIUMTEXT | 16,777,215 | ±2,800,000 | ±1,500,000
LONGTEXT | 4,294,967,295 | ±740,000,000 | ±380,000,000
在英语中 ,每个单词 4.8 个字母可能是一个不错的平均水平(例如norvig.com/mayzner.html ),尽管单词长度会根据领域(例如口语与学术论文)而有所不同,所以没有一点太精确了。英文主要是单字节 ASCII 字符,偶尔还有多字节字符,因此每个字母接近一个字节。单词间的空格必须允许有一个额外的字符,因此我将每个单词的 5.8 个字节舍入为小数。带有重音符号的语言(如波兰语)将存储较少的单词,例如德语的单词会较长。
需要多字节字符的语言(例如希腊语,阿拉伯语,希伯来语,印地语,泰语等)在 UTF-8 中通常每个字符需要两个字节。疯狂地猜测每个单词 5 个字母,我舍弃了每个单词 11 个字节。
CJK 脚本(汉字,汉字,平假名,片假名等)我一无所知;我相信字符在 UTF-8 中通常需要 3 个字节,并且(经过大量简化)每个字符可能被认为使用大约 2 个字符,因此它们将位于其他两个字符之间。 (根据情况,使用 UTF-16,CJK 脚本可能需要较少的存储空间)。
当然,这忽略了存储开销等。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/170350.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...