tomcat大量time wait问题

tomcat大量time wait问题在服务端访问量大的时候检测到大量的timewait,并且接口请求延时较高。执行netstat-n|awk‘/^tcp/{++S[$NF]}END{for(minS)printm,S[m]}’这个shell命令的意思是把netstat-n后结果的最后一条放到S[]数组中,如果相同则执行+1操作。此时能看到TCP各种状态下的连接数量,示例服务端架构是采用nginx

大家好,又见面了,我是你们的朋友全栈君。

在服务端访问量大的时候检测到大量的time wait,并且接口请求延时较高。
执行 netstat -n |awk ‘/^tcp/{++S[$NF]}END{for(m in S) print m,S[m]}’
这个shell命令的意思是把netstat -n 后结果的最后一条放到S[]数组中,如果相同则执行+1操作。
此时能看到TCP各种状态下的连接数量,示例
这里写图片描述

服务端架构是采用nginx 负载均衡后台有多台tomcat。

先说下TCP建立连接和终止连接的流程
tcp三次握手过程:
1、客户端发送SYN(SEQ=x)报文给服务器端,进入SYN_SEND状态。
2、服务器端收到SYN报文,回应一个SYN (SEQ=y)ACK(ACK=x+1)报文,进入SYN_RECV状态。
3、客户端收到服务器端的SYN报文,回应一个ACK(ACK=y+1)报文,进入Established状态。
三次握手完成,TCP客户端和服务器端成功地建立连接,可以开始传输数据了。
这里写图片描述
tcp四次拜拜的过程:
(1) 某个应用进程首先调用close,称该端执行“主动关闭”(active close)。该端的TCP于是发送一个FIN分节,表示数据发送完毕。
(2) 接收到这个FIN的对端执行 “被动关闭”(passive close),这个FIN由TCP确认。
注意:FIN的接收也作为一个文件结束符(end-of-file)传递给接收端应用进程,放在已排队等候该应用进程接收的任何其他数据之后,因为,FIN的接收意味着接收端应用进程在相应连接上再无额外数据可接收。
(3) 一段时间后,接收到这个文件结束符的应用进程将调用close关闭它的套接字。这导致它的TCP也发送一个FIN。
(4) 接收这个最终FIN的原发送端TCP(即执行主动关闭的那一端)确认这个FIN。
这里写图片描述

关于tcp状态转换图建议看下http://www.cnblogs.com/qlee/archive/2011/07/12/2104089.html这篇文章。
这里写图片描述

重点说下time_wait、fin_wait_1、fin_wait_2这三个状态:
time_wait状态表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可回到CLOSED可用状态了。如果FIN_WAIT_1状态下,收到了对方同时带 FIN标志和ACK标志的报文时,可以直接进入到TIME_WAIT状态,而无须经过FIN_WAIT_2状态。
FIN_WAIT_1: 这个状态要好好解释一下,其实FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别 是:FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时,它想主动关闭连接,向对方发送了FIN报文,此时该SOCKET即 进入到FIN_WAIT_1状态。而当对方回应ACK报文后,则进入到FIN_WAIT_2状态,当然在实际的正常情况下,无论对方何种情况下,都应该马 上回应ACK报文,所以FIN_WAIT_1状态一般是比较难见到的,而FIN_WAIT_2状态还有时常常可以用netstat看到。
FIN_WAIT_2:上面已经详细解释了这种状态,实际上FIN_WAIT_2状态下的SOCKET,表示半连接,也即有一方要求close连接,但另外还告诉对方,我暂时还有点数据需要传送给你,稍后再关闭连接。

清楚原理后,我们就知道优化方式了。
方法一、加快time_wait状态回收
此部分可以通过调整内核参数完成
vi /etc/sysctl.conf

#表示开启重用,即允许将time_wait socket用于新的tcp连接。默认是关闭的
net.ipv4.tcp_tw_reuse = 1 
#表示开启time_wait的快速回收
net.ipv4.tcp_tw_recycle = 1
#表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间,默认是60
net.ipv4.tcp_fin_timeout = 10

方法二、建立长连接(推荐)
短连接的方式在请求量大的时候需要频繁的进行连接的建立和回收。
长连接节省了三次握手的时间,但是比较占用服务器资源。如果每个用户建立一个长连接,那么很快就到系统瓶颈。这时候可以采用长连接复用技术。以nginx+tomcat为例。
nginx配置
nginx利用tomcat实现长连接复用keepalive_timeout与tomcat配置保持一致

upstream mysdc {
# server 127.0.0.1:8081;
        #最大失败次数 3 次 超时 10s 8080 优先 4:3
        server  127.0.0.1:8080 max_fails=3 fail_timeout=10s weight=5;
        server  127.0.0.1:8081 max_fails=3 fail_timeout=10s weight=3;
# server 127.0.0.1:8081 backup;

      # http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive
    # 连接到上游服务器的最大并发空闲keepalive长连接数(默认是未设置,建议与Tomcat Connector中的maxKeepAliveRequests值一样)
    # 当这个数被超过时,使用"最近最少使用算法(LUR)"来淘汰并关闭连接。
     keepalive 8000;
}

keepalive_timeout 120s 120s;

tomcat配置maxKeepAliveRequests表示每个长连接支撑多少请求,keepAliveTimeout超时时间120s

<Connector executor="tomcatThreadPool" port="8080" protocol="org.apache.coyote.http11.Http11NioProtocol" processorCache="-1" maxHttpHeaderSize="8192" maxThreads="5000" minSpareThreads="500" acceptorThreadCount="32" connectionTimeout="120000" keepAliveTimeout="120000" maxKeepAliveRequests="100" redirectPort="8443" URIEncoding="UTF-8" enableLookups="false" acceptCount="5000" disableUploadTimeout="true" />
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/132724.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • zg584_O-Z39663

    zg584_O-Z396631396:队列问题(2)TimeLimit: 1Sec  MemoryLimit: 128MB[Submit][Status][WebBoard]Description有一个含有n个元素的队列q,每个元素的大小满足1Input输入数据第一行是一个整数T(1Output对于每组测试数据,输出xm是第几个出队列。S

  • 静态网站(博客)生成器Static Site Generators(SSGs)大集合

    静态网站(博客)生成器Static Site Generators(SSGs)大集合这是一份静态网站生成器的推荐集合,按开发语言或者平台分类和排序,大家各取所需。如果大家有用什么新的静态网站生成器未在本文章中列出,麻烦在评论中说下,我会不断更新该集合。ClojureCryogen-Asimple,static,automatedCMSshippedasatemplateonLeiningen,aClojurebuildtool.misak…

  • 一句话讲清楚什么是JavaEE「建议收藏」

    一句话讲清楚什么是JavaEE「建议收藏」Java技术不仅是一门编程语言而且是一个平台。同时Java语言是一门有着特定语法和风格的高级的面向对象的语言,Java平台是Java语言编写的特定应用程序运行的环境。Java平台有很多种,很多的Jav

  • dm348_再论不平等

    dm348_再论不平等UBL前两篇文章中我们有提到过了。参看:DM368开发–文件烧写参看:DM368开发–Bootloader开发简单点来说,UBL主要功能是实现将U-boot代码拷贝到DDR2内存中,建立运行环境并引导U-boot。但是现在我有个问题,我想让DM368开发板运行在432Mhz,目前它的状态是AR,297Mhz、DDR为243Mhz。具体操作为,修改/ps

  • 基于.Net开源框架

    基于.Net开源框架转 https://www.cnblogs.com/hgmyz/p/5313983.html自从学习.NET以来,优雅的编程风格,极度简单的可扩展性,足够强大开发工具,极小的学习曲线,让我对这个平台产生了浓厚的兴趣,在工作和学习中也积累了一些开源的组件,就目前想到的先整理于此,如果再想到,就继续补充这篇日志,日积月累,就能形成一个自己的组件经验库。分布式缓存框架:MicrosoftV…

  • python 函数进阶与闭包

    函数的命名空间和作用域引言现在有个问题,函数里面的变量,在函数外面能直接引用么?上面为什么会报错呢?现在我们来分析一下python内部的原理是怎么样:我们首先回忆一下Python代码运行的时候

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号