排查IOException Broken pipe 错误,偶遇国外小哥

大家好,我是阿飞云怕什么真理无穷,进一步有近一步的欢喜今天我们聊一个异常:java.io.IOException: Broken pipe,为什么会报这个异常,这个异常要怎么解决?以及最后…

大家好,又见面了,我是全栈君。

大家好,我是阿飞云

怕什么真理无穷,进一步有近一步的欢喜

今天我们聊一个异常:java.io.IOException: Broken pipe,为什么会报这个异常,这个异常要怎么解决?以及最后偶遇外国小哥~

问题描述

最近遇到的一个小问题,希望对你有帮助。前几日在排查一个问题的时候,看到有几台服务器上日志偶发会打印这个错误 Caused by: java.io.IOException: Broken pipe 。

760da644d114d336905ef5b85c7499d0.png

下面贴了详细堆栈信息截图:

4564efdfc4cc327c1881aa09b8e8ced3.png

看堆栈信息是在写数据的时候,抛出了 IOException 异常,然后被 tomcat 中捕获抛出 ClientAbortException: java.io.IOException: Broken pipe。

跟踪了整个调用,发现业务处理是正常的,服务端也打印了响应需求返回的数据,但就是报了这个错误。还是怕这个异常对业务产生影响,于是检查了一下抛出这个异常产生的前后日志,发现只有一个接口会有这个问题。但这个也是偶现的,并不是每次请求就会抛这个异常。这更加让人迷惑。

于是去查了查相关资料,简单说一下Broken pipe。服务端向客户端的socket连接管道写返回数据时,链接(pipe)却断了!71a1a19f20c821204035e271cfd77e47.png出现这个异常的可能原因:

1、客户端请求服务器数据,服务器突然挂了;

2、Tomcat的connector在执行写操作的时候发生的,客户端读取超时关闭了连接,这时候服务器端再向客户端已经断开的连接写数据时就发生了broken pipe异常!

服务端肯定是没有挂的,可以排除第一点。那就是第二点了,大概率应该客户端自己的问题嘛,你断开了连接导致的我服务端没法写回数据了,然后就异常了,这是不是可以甩锅了~0921c6785d367e86856d90df382fdc24.png

模拟验证

秉着“科学严谨”的甩锅思路,对比了这个接口正常和异常情况下,入参和出参,以及响应时间。发现正常情况下响应时间10s,异常情况下响应时间高达40s,并且响应的数据量巨大。因为这个接口是第三方调用的,简单推测,应该是第三方调用此接口的时候设置了超时时间,超时后关闭了连接,导致服务端没法写出数据,异常了。

既然是这样那我自己验证一把,看是不是这个问题,找出出现异常的调用入参,使用Postman模拟第三方调用,看一看会发现什么。

软件环境: Spring Boot 2.0.3 Tomcat8 JDK8 Nginx代理

场景1:Postman不设置超时时间,发送请求。 结果: Postman响应正常,服务端也没有打印出异常信息

场景1:Postman设置超时时间,发送请求。1e498777d3a8cf4ceeee0311284c6975.png

设置请求应等待多长时间]超时前的响应。默认0,永不超生,这里我设置了5s

结果:postman没有收到响应,5s后直接异常,Response time out。2b8be21534660e87a1b5cbb9768c5f09.png等了一会服务端处理完后,服务端打印出broken pipe异常信息。

场景3Postman设置超时时间,发送请求后,立马关闭Postman进程。 结果:查看日志,发现也报了 Broken pipe 问题。

上面这个场景模拟下来,服务端业务都完成处理成功,就是在响应的时候出现了异常。那直接看一下异常那块的代码吧。org.apache.catalina.connector.OutputBuffer#realWriteBytes

769979836e6fb05f30cefb4aa0aedae0.png

当执行到coyoteResponse.doWrite(buf); 这里的时候,调用JDK方法去执行sun.nio.ch.FileDispatcherImpl#write0, write0是一个native的方法了,看看发生异常时候的注释内容:

An IOException on a write is almost always due to the remote client aborting the request. Wrap this so that it can be handled better by the error dispatcher.

大致的意思是:写时的IOException几乎总是由于远程客户端中止请求而导致的。将其包装起来,方便程序可以更好地处理它。

这里就不继续深入卷了,感兴趣的伙伴可以在看看网络Socket,或者经典书籍《UNIX网络编程卷1》。

解决方案

这个异常,对于服务端来说,并没有多少影响。到这里大致的处理方案就知道了

•1、延长客户端超时时间•2、合理优化服务端接口代码和返回数据量

最后闲聊

在排查这个问题的时候,找到国外小哥的一篇文章,写的很不错,值得学习。一开篇先介绍了他遇到了Broken Pipe 异常,给出异常出现的软件环境和版本,然后讲了Broken Pipe 是什么,这个异常是怎么发生的,这个异常是不是很严重,以及后面如何修复这个异常,总结以及参考文章。整个文章一气呵成,其中的英文也不难理解,看起来真丝滑。

感兴趣的伙伴可以在这里查看原文: How I fixed java.io.IOException: Broken Pipe in Java (Wildfly 10.1)[1]:https://bishwa.hashnode.dev/fix-broken-pipe-exception-wildfly6faa763007943a2788edf17b30db3b25.png

下面我大致翻译和加一下自己的解读。

 文章的标题:我如何修复Java中 java.io.IOException:Broken Pipe(Wildfly 10.1)

我经常接触的Tomcat,WildFly没用到,大致说明下:WildFly,原名 JBoss AS(JBoss Application Server) 或者 JBoss,是一套应用程序服务器,属于开源的企业级 Java 中间件软件,用于实现基于 SOA 架构的 Web 应用和服务。

开头预览就介绍了他第一次遇到 Broken Pipe 问题时候对应的软件环境和相关版本:

•JavaEE 7 with JAX-RS•Java 8•Wildfly 10.1 as application server•Nginx was used as reverse proxy and load balancer.

后面贴了异常的详细信息。有趣的是在分析完 Broken Pipe 是如何发生的,里面写到

Not every Broken Pipe exception is developer’s fault 并非每个 Broken Pipe 异常都是开发人员的错

他分析了导致此异常的可能因素:

最终用户数

由于 Broken Pipe 的主要原因之一是用户的行为(在服务器完成发送响应之前意外关闭了活动的浏览器会话),最终用户数量的增加增加了 Broken Pipe 的机会。

重响应负载(返回数据量大)

来自服务器的大量响应需要大量时间才能传输到客户端,而这个巨大的时间跨度可能就是 Broken Pipe 的情况。

服务器超时(有代理的情况)

如果 Web 服务器在等于服务器设置的超时值的特定时间内无法从服务获得响应,它会关闭与客户端的连接,返回 503: Gateway Timeout,从而导致 Broken Pipe。

内容后面小哥又详细介绍了他如何解决这个问题的一些步骤,最后小哥文章结尾写到:

It’s my first blog, yeah it’s a bit long, but I was giving insights into how I actually approached the issue and fixed it. Feel free to provide feedback in the comment section & watch this space for more development blogs in future.

这是我的第一个博客,是的,它有点长,但我正在深入了解我如何实际处理这个问题并修复它。请随时在评论部分提供反馈,并关注此空间,了解将来的更多开发博客。

小哥写的真不错,不过看了博客就只有这一篇,订阅了博客内容,在默默关注下。260dc1fa7d0be3559eeb0181df91aef2.png

上面是小哥的介绍:Get along with my journey of working as a Software Engineer

以上就是全部内容了,我是阿飞云,感谢你的阅读,希望对你有所帮助~

References

[1] How I fixed java.io.IOException: Broken Pipe in Java (Wildfly 10.1): https://bishwa.hashnode.dev/fix-broken-pipe-exception-wildfly
[2] Broken pipe错误终极解释: https://www.cnblogs.com/metoy/p/6565486.html
[3] tcp连接时,BROKEN PIPE错误的原因以及解决方法: https://www.cnblogs.com/cthon/p/9139553.html
[4] How I fixed java.io.IOException: Broken Pipe in Java (Wildfly 10.1): https://bishwa.hashnode.dev/fix-broken-pipe-exception-wildfly

往期推荐:

掌握这些常用Linux命令,一起提升工作效率

如何实现一个任务调度系统

4202a6773f37783f9ae752e4ff8a74ce.gif

整理了后端精选资料,包含JVM、Linux,分布式,高并发,多线程,面试题等 

回复1024,即可获取【秘籍

56799e9a96848f885621013fb21b1fe6.png

See you next good day~

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/120949.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • javascript定义数组,将数组中数组内容求和_数组求和JAVA

    javascript定义数组,将数组中数组内容求和_数组求和JAVA1.应用场景主要用于数组求和 2.学习/操作 TBD 3.问题/补充 TBD 4.参考 https://blog.csdn.net/weixin_40687883/article/details/85248195 https://www.jb51.net/article/154559.htm 后续补充……

  • 小树311_森林小道

    小树311_森林小道原题链接森森开了一家快递公司,叫森森快递。因为公司刚刚开张,所以业务路线很简单,可以认为是一条直线上的N个城市,这些城市从左到右依次从0到(N−1)编号。由于道路限制,第i号城市(i=0,⋯,N−2)与第(i+1)号城市中间往返的运输货物重量在同一时刻不能超过C​i​​ 公斤。公司开张后很快接到了Q张订单,其中j张订单描述了某些指定的货物要从S​j​​ 号城市运输到T​j​​ 号城市。这里我们简单地假设所有货物都有无限货源,森森会不定时地挑选其中一部分货物进行运输。安全起见,这些货物不会在中

  • ubuntu怎么安装vim编辑器_vim配置大全

    ubuntu怎么安装vim编辑器_vim配置大全1.linux默认自带vi,一般使用升级版vim2.第一次使用需要安装vimsudoaptinstallvim如果没有安装的话会提示安装vim执行安装sudoaptinstallvim测试vima.txt出现下面界面则安装成功3.vim的三种模式1.普通模式当vim打开的时候就直接进入普通模式,在…

  • 电商社交数据在大数据风控的应用实践

    电商社交数据在大数据风控的应用实践

  • pycharm配置python运行环境_C中调用Python

    pycharm配置python运行环境_C中调用Python目录前言一、系统路径说明二、环境配置1.在VS中选择ReleaseX642.菜单栏中选择:项目->属性3.生成dll答疑python程序目录下没有Numpy路径?具体代码参考博客前言本文主要讲解在Python程序中调用C(C++)程序的方法。主要思路是:在VS中配置好环境后,将C语言程序打包生成动态库文件.dll。将.dll改名成.pyd之后,装入相应路径,在pycharm中直接import即可环境:win10Pycharm(python3.6)(64位)VS2017(社区版)

  • ANSI编码表_ansi配列

    ANSI编码表_ansi配列在日常开发中,在思考一个问题,为什么是英文来编程,结果ASCII这个玩意在处理。ASCII,AmericanStandardCodeforInformationInterchange念起来像是”阿斯key”,定义从0到127的一百二十八个数字所代表的英文字母或一样的结果与意义。由于只使用7个位元(bit)就可以表示从0到127的数字,大部分的电脑都使用8个位元来存取字元集(characterset),所以从128到255之间的数字可以用来代表另一组一百二十八个符号,称…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号