inputstream重复使用_简述读取文件的几种方法的区别

inputstream重复使用_简述读取文件的几种方法的区别在上篇博客中我们已经知道了Java的InputStream是不能重复被读取的。 但是在有的场合中,我们需要重复利用InputStream的数据。 比如: 1.一个officeword文件流,我需要首先读取InputStream中的前一些字节来判断word文件的实际内容(word文件可以保存html,mht的内容)。然后再根据实际内容决定我要解析InputStream的方式。 

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
上篇博客中
我们已经知道了Java的InputStream是不能重复被读取的。 


但是在有的场合中,我们需要重复利用InputStream的数据。 


比如: 


1. 一个office word文件流,我需要首先读取InputStream中的前一些字节来判断word文件的实际内容(word文件可以保存html,mht的内容)。然后再根据实际内容决定我要解析InputStream的方式。 




2. 一个Html文件流,我需要首先读取InputStream中的一些字节来判断Html文件编码方式。然后再根据html文件编码方式读取Html内容。 




3. 从socket收到的一个InputStream,我首先需要读取InputStream判断是什么类型的字符串。然后再将InputStream读取写到文件里。 




总之,在实际的工作当中,我们常常会需要多次读取一个InputStream的需求。 


如果该
InputStream是我们通过某种方式“主动”获取的
,那我们可以不必重复读取一个InputStream,而是再次获取一样数据的InputStream来处理。 


例如: 

Java代码  
收藏代码

  1. InputStream inputStream = new FileInputStream(path);  
  2. //利用inputStream  
  3. inputStream = new FileInputStream(path);  
  4. //再次利用inputStream  



再例如: 

Java代码  
收藏代码

  1. InputStream inputStream = httpconn.getInputStream();   
  2. //利用inputStream  
  3. inputStream = httpconn.getInputStream();  
  4. //再次利用inputStream  



但是,对于
“被动”利用InputStream
的接口,在接口内部需要重复利用InputStream,对于InputStream的来源,可能是文件,可能是网络,也可能是内存里的一个String,对于InputStream的方式接口内部不得而知,因此更谈不上在接口内部重复获取了。 


例如有这样一个接口: 

Java代码  
收藏代码

  1. //将InputStream转换成一个文本字符串  
  2. public String convert(InputStream inputStream);  



在接口内部我们可能需要首先读取InputStream前n个字节来判断InputStream流的数据流型,然后转化InputStream为一个字符串。 




最简单的方式就是缓存,首先将InputStream缓存到内存,然后重复使用内存里的数据。 


例如: 

Java代码  
收藏代码

  1. package com.gs.cvoud.attachment.converter;  
  2.   
  3. import java.io.ByteArrayInputStream;  
  4. import java.io.ByteArrayOutputStream;  
  5. import java.io.IOException;  
  6. import java.io.InputStream;  
  7.   
  8. import com.gs.cvoud.util.ObjectUtils;  
  9.   
  10. /** 
  11.  * 缓存InputStream,以便InputStream的重复利用 
  12.  * @author boyce 
  13.  * @version 2014-2-24 
  14.  */  
  15. public class InputStreamCacher {  
  16.       
  17.     private static final org.slf4j.Logger logger = org.slf4j.LoggerFactory.getLogger(InputStreamCacher.class);  
  18.       
  19.     /** 
  20.      * 将InputStream中的字节保存到ByteArrayOutputStream中。 
  21.      */  
  22.     private ByteArrayOutputStream byteArrayOutputStream = null;  
  23.       
  24.     public InputStreamCacher(InputStream inputStream) {  
  25.         if (ObjectUtils.isNull(inputStream))  
  26.             return;  
  27.           
  28.         byteArrayOutputStream = new ByteArrayOutputStream();  
  29.         byte[] buffer = new byte[1024];    
  30.         int len;    
  31.         try {  
  32.             while ((len = inputStream.read(buffer)) > –1 ) {    
  33.                 byteArrayOutputStream.write(buffer, 0, len);    
  34.             }  
  35.             byteArrayOutputStream.flush();  
  36.         } catch (IOException e) {  
  37.             logger.error(e.getMessage(), e);  
  38.         }    
  39.     }  
  40.       
  41.     public InputStream getInputStream() {  
  42.         if (ObjectUtils.isNull(byteArrayOutputStream))  
  43.             return null;  
  44.           
  45.         return new ByteArrayInputStream(byteArrayOutputStream.toByteArray());  
  46.     }  
  47. }  



接口内部使用情景: 

Java代码  
收藏代码

  1. InputStreamCacher  cacher = new InputStreamCacher(inputStream);  
  2. InputStream stream = cacher.getInputStream();  
  3. //读取stream  
  4. stream = cacher.getInputStream();  



上述的方式是将InputStream缓存到一个ByteArrayOutputStream中,当然缓存的数据类型和方式都是任意的,这只是一种解决思路。 


这种方式有一个最大的缺点,就是内存压力。 


外部传给接口的InputStream有可能很大。每调用一次接口就将InputStream缓存到内存中,内存要承受的压力是可想而知的。 




编程永远都是在时间和空间之间找到一个平衡点,前面说的“主动获取方式”的重复获取也有它的缺点,就是需要重新读取文件,获取重新建立网络连接等,这就是需要消耗更多的时间。 




万事万物都是这样,天下没有完美的事,有舍才有得,选择什么就意味着放弃什么,开了一扇窗可能就要关一扇门。所以不管是生活还是编程,我们都需要在舍与得,选择的与放弃的,窗和门之间做出相对合理的抉择,或者说不得不做的抉择。 



闲话扯远了,其实重复利用InputStream还有另一种方式: 

通过mark和reset方法重复利用InputStream


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/193709.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • webpack的性能优化_webpack不是内部或外部命令

    webpack的性能优化_webpack不是内部或外部命令webpack版本过高,会出现很多问题,因此可以降低版本高度1.可以直接覆盖原版本,可以输入`cnpmiwebpack需要降低的版本-g比如我们要降低到’3.6.0’’cnpmiwebpack@3.6.0-g’2.卸载当前版本,在重新下载需要的版本卸载命令:’npmuninstallwebpack-g’如果是局部安装,也可以在文件夹中找到node-modules中webpack模块删除。安装命令:’npminstallwebpack@3.6.0-g’

  • YOLO3训练自己数据(超详细步骤)

    YOLO3训练自己数据(超详细步骤)须知:对于占比较小的目标检测效果不好,虽然每个格子可以预测多个boundingbox,但是最终只选择IOU(预测的矩形框和真实目标的交集与并集之比)最高的boundingbox作为物体检测输出,即每个格子最多只预测出一个物体。当一个格子中包含多个物体时,如鸟群等,却只能检测出其中一个。另外,YOLO对车牌识别的效果一般。一:下载YOLO3项目gitclonehttps://githu…

  • tomcat日志配置——如何查看日志

    tomcat日志配置——如何查看日志Tomcat日志设定1、Tomcat日志概述Tomcat日志信息分为两类:一、是运行中的日志,它主要记录运行的一些信息,尤其是一些异常错误日志信息。二、是访问日志信息,它记录的访问的时间,IP,访问的资料等相关信息。2Tomcat日志配置2.1访问日志的配置默认tomcat不记录访问日志,如下方法可以使tomc…

  • mysql show status详解

    mysql show status详解

  • js控制30秒自动页面跳转,带读秒

    js控制30秒自动页面跳转,带读秒30秒后返回首页方式一://定义函数functioncount()   {   varmyspan=document.getElementById(‘myspan’); varnumber=myspan.innerHTML; number–; document.getElementById(‘myspan’).innerHTM

  • 如何求平均数众数中位数_离散系数

    如何求平均数众数中位数_离散系数平均数、中位数、众数,在分析中如何使用?01平均值的种类02平均数、中位数还是众数?03全距和数值分布01平均值的种类请检查下面的陈述:1、一个快速致富的方法就是做一名职业橄榄球员,2015年美国国家橄榄球联盟球星的平均收入是220万美元。2.、为在大学里取得好成绩,学生需要付出的努力越来越少了。根据最近一项调查,大学生每周平均花在学习上的时间是12.8小时,和20年前大学生的学习时长相比,前者大概只有后者的一半。两个例子当中都使用了“平均”这个词,但是实际上有三种不同的方法来测定平

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号