大家好,又见面了,我是你们的朋友全栈君。
本文出处:http://blog.csdn.net/chaijunkun/article/details/22387305,转载请注明。由于本人不定期会整理相关博文,会对相应内容作出完善。因此强烈建议在原始出处查看此文。
今天写代码时需要实现获取文件大小的功能,目前有两种实现方法,一种是使用File的length()方法;另外一种是使用FileInputStream的available()方法,当InputStream未进行read操作时,available()的大小应该是等于文件大小的。但是在处理大文件时,后者会发生问题。我们来看一下:
在例子中,我使用了CentOS 6.5 的安装镜像文件,主要是考虑到这个文件足够大(大于2GB)。
1.使用File的length()方法
public static void main(String[] args) {
File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
if (f.exists() && f.isFile()){
logger.info(f.length());
}else{
logger.info("file doesn't exist or is not a file");
}
}
我们看一下输出结果:
4467982336
结果是4.16GB,与Windows上显示的结果一致。
接下来我们看一下通过FileInputStream来获取的文件大小:
public static void main(String[] args) {
FileInputStream fis= null;
try{
File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
fis= new FileInputStream(f);
logger.info(fis.available());
}catch(Exception e){
logger.error(e);
} finally{
if (null!=fis){
try {
fis.close();
} catch (IOException e) {
logger.error(e);
}
}
}
}
下面是运行结果:
2147483647
这个结果是不是很眼熟?它是Integer.MAX_VALUE,也就是有符号整型能表示的最大数值。
那么换算成熟悉的单位,这种方式获取的文件大小是多大呢?
约等于2GB,这显然不是正确的结果。
究其原因,File的length()方法返回的类型为long,long型能表示的正数最大值为:9223372036854775807,折算成最大能支持的文件大小为:8954730132868714 EB字节,这个量级将在人类IT发展史上受用很多很多年,而FileInputStream的avaliable()方法返回值是int,在之前也介绍了最大的表示范围,所能支持的最大文件大小为:1.99GB,而这个量级我们现在很容易就达到了。
2014年3月31日补充:
针对流式方法读取大文件大小也不是不可行,只是不能再使用传统的java.io.*下的包了,这里要用到java.nio.*下的新工具——FileChannel。下面我们来看下示例代码:
public static void main(String[] args) {
FileChannel fc= null;
try {
File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
if (f.exists() && f.isFile()){
FileInputStream fis= new FileInputStream(f);
fc= fis.getChannel();
logger.info(fc.size());
}else{
logger.info("file doesn't exist or is not a file");
}
} catch (FileNotFoundException e) {
logger.error(e);
} catch (IOException e) {
logger.error(e);
} finally {
if (null!=fc)){
try{
fc.close();
}catch(IOException e){
logger.error(e);
}
}
}
}
使用FileChannel后得到的结果与第一种情况吻合,准确地描述了文件的准确大小。
这里也同样提醒各位技术同仁,涉及到大文件读取的时候,对int类型的数据一定要留个心,以免出现隐藏的bug,定位起来很困难。
2022年1月11日补充:首先感谢大家的支持,当初在写这篇文章的时候也不知道它能带来这么多的阅读量。随着对这门语言的深入使用以及项目积累,也开始理解了为什么流剩余大小avaliable定义为int类型。我们都知道,tomcat中默认允许的post body大小是2MB,nginx对于该指标默认最大限制是1MB。虽然该参数都可以根据实际场景进行修改,但都不建议设置得过大。为什么呢?对于流来说,我们最好把它当成一个不稳定的传输管道。断网、丢包还有一些其他原因导致的网络抖动,都会让传输变得不那么可靠。超时重传的情况时有发生。那么如果为了方便,把一个超大的文件一股脑通过一个请求上传,很显然中间出一点差错就要整个重新上传(因为不知道具体是哪里出错了)。大文件中转站、网盘这些应用,上传2GB以上大小的文件再正常不过了,如果你仔细观察和分析就不难发现,它们都是分片上传的,而每一个分片都不会很大,从而确保传输稳定。从这个层面来讲,int类型绰绰有余。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/131670.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...