1. 三次握手
三次握手其实就是指建立一个TCP连接时,需要客户端和服务器总共发送3个包。进行三次握手的主要作用就是为了确认双方的接收能力和发送能力是否正常、指定自己的初始化序列为后面的可靠性传送做准备。实质上其实就是连接服务器指定端口,并同步连接双方的序列号和确认号,交换TCP窗口大小信息
刚开始客户端处于Closed的状态,服务端处于Listen状态。
进行三次握手:
- 第一次握手:客户端给服务端发一个 SYN 报文,并指明客户端的初始化序列号 ISN。此时客户端处于 SYN_SENT 状态。
首部的同步位 SYN = 1,初始化序号 seq = x,SYN = 1 的报文段不能携带数据,但要消耗掉一个序号。- 第二次握手:服务器收到客户端的 SYN 报文之后,会以自己的 SYN 报文作为应答,并且也是指定了自己的初始化序列号 ISN(s)。同时会把客户端的 ISN + 1 作为ACK的值,表示自己已经收到了客户端的 SYN,此时服务器处于 SYN_RCVD 的状态
在确认报文段中 SYN = 1,ACK = 1,确认号 ack = x + 1,初始序号 seq = y。- 第三次握手:客户端收到 SYN 报文之后,会发送一个 ACK 报文,当然,也是一样把服务器的 ISN + 1 作为 ACK 的值,表示已经收到了服务端的 SYN 报文。此时客户端处于 ESTABLISHED 状态。服务器收到 ACK 报文之后,也处于 ESTABLISHED 状态,此时,双方已建立了连接。
确认报文段 ACK = 1,确认号 ack = y + 1,序号 seq = x + 1(初始为 seq = x,第二个报文段所以要 +1),ACK报文段可以携带数据,不携带数据则不消耗序号
发送第一个 SYN 的一端将执行主动打开 (active open),接收这个 SYN 并发回下一个 SYN 的另一端执行被动打开 (passive open)
在socket编程中,客户端执行 connect() 时,将触发三次握手
【三次握手的特点】
- 没有应用层的数据
- SYN 这个标志位只有在 TCP 建立连接时才会被置1
- 握手完成后 SYN 标志位被置0
1.1 为什么需要三次握手,两次不行吗?
要想弄清楚这个问题,就需要先弄明白三次握手的目的是什么,能不能只用两次握手来达到同样的目的。
- 第一次握手:客户端发送网络包,服务端收到了。
这样服务端就能得出结论:客户端的发送能力,服务端的接受能力是正常的。- 第二次握手:服务端发包,客户端收到了。
这样客户端就能得出结论:客户端的发送能力和接受能力,服务器端的发送能力和接受能力是正常的。- 第三次握手:客户端发包,服务端收到了。
这样服务端就能得出结论:客户端的发送和接受能力,服务端的发送和接受能力都是正常的。
因此,需要三次握手才能确认双方的接收和发送能力是否正常。
试想一下,如果是两次握手,则会出现下面这种情况:
如果客户端发送请求,但因连接请求报文丢失而未收到确认。于是客户端又发了一次连接请求,后来收到了服务端的确认,此时客户端和服务端就建立了连接,在数据传输完毕后,就释放了连接。在此过程中,客户端共发了两个请求连接报文段,其中一个丢失了,第二个到达了服务端,但是第一个丢失的报文段只是在某些网络节点长时间滞留了,延误到连接释放以后的某个时间到达了服务端,此时服务端又认为客户端发送了一个新的连接请求,于是服务端发送确认报文,此时客户端和服务端又成功建立了连接,此时客户端认为自己并没有发起新的连接请求,所以会忽略服务端发来的确认,也不发送数据,则服务端一直等待客户端发送数据,这就会造成资源的浪费。
1.2 什么是半连接队列?
- 半连接队列
服务器第一次收到客户端的 SYN 之后,就会处于 SYN_SEND 状态,此时双方还未建立真正的连接,服务器会把这种状态下的请求连接放进一个队列中,我们把这种队列称之为半连接队列。- 全连接队列
已经完成三次握手,建立起连接就会放到全连接队列中。如果队列满了就有可能会出现丢包现象。
【补充说明 SYN-ACK 重传次数的问题】
服务器发送完 SYN-ACK 包,如果未收到客户端确认包,服务器将进行首次重传,等待一段时间仍未收到客户端确认包,进行第二次重传。如果重传次数大于最大重传次数,系统将该连接信息从半连接队列中删除。
【注意】每次重传等待的时间不一定相同,一般会指数增长,例如间隔时间为 1s,2s,4s,8s……
1.3 ISN(Initial Sequence Number)是固定的吗?
- 当一端为建立连接而发送它的 SYN 时,它为连接选择一个初始序号。ISN 随时间变化,因此每个连接都将具有不同的 ISN。ISN可以看做一个32比特的计数器,每 4ms 加 1。这样选择序号的目的在于防止网络中被延迟的分组在以后又被传送,而导致某个连接的一方对它错误的解释。
- 三次握手的其中一个重要的功能是客户端和服务端交换 ISN,以便让对方知道接下来接收数据的时候如何按序列号组装数据。如果 ISN 是固定的,攻击者很容易猜出后续的确认号,因此 ISN 是动态生成的。
1.4 三次握手过程可以携带数据吗?
其实第三次握手是可以携带数据的。但是,第一次、第二次握手绝对不可以携带数据
【原因】
大家可以想一个问题,假如第一次握手可以携带数据的话,如果有人要恶意攻击服务器,那他每次都在第一次握手的 SYN 报文中放入大量的数据。因为攻击者根本就不理服务器的接收、发送能力是否正常,然后疯狂重复发着 SYN 报文的话,会让服务器花费很多时间、内存空间来接收这些报文。
也就是说,第一次握手不可以放数据,其中一个很简单的原因就是不会让服务器更容易受到攻击。而对于第三次的话,此时客户端已处于 ESTABLISHED状态。对于客户端来说,它已经建立了连接,并且已经知道 服务端的发送和接受能力都是正常的,所以能携带数据也没啥毛病。
1.5 SYN攻击是什么?
- 服务器端的资源分配是在二次握手时分配的,而客户端的资源是在完成三次握手时分配的,所以服务器容易受到SYN洪泛攻击。SYN攻击就是客户端在短时间内伪造大量不存在的IP地址,并向服务端不断发送SYN包,服务端则回复确认包,并等待客户端确认,由于源地址不存在,因此服务端需要不断重发直到超时,这些伪造的SYN包将长时间占用未连接队列,导致正常的SYN请求因为队列满而被丢弃,从而引起网络拥塞甚至网络瘫痪。SYN攻击是一种典型的Dos/DDos攻击。
- 检测SYN的攻击非常方便,当你在服务器上看到大量的半连接状态时,特别是源IP地址时随机的,基本上可以确认这是一次SYN攻击。在Linux上可以使用 netstat 命令来检测 SYN 攻击
netstat -n -p TCP | grep SYN_RECV
常见的防御 SYN 攻击的方法如下:
- 缩短超时(SYN Timeout)时间
- 增加最大半连接数
- 过滤网关防护
- SYN cookies技术
2. 四次挥手
- 建立一个连接需要三次握手,而终止一个连接需要四次挥手。这由 TCP 的半关闭(half-close)造成的。所谓的半关闭,其实就是 TCP 提供了连接的一端在结束它的发送之后还能接受来自另一端数据的能力。
- TCP 连接的断开需要发送4个包,因此称为四次挥手,客户端或服务端均可主动发起挥手动作。
- 刚开始双方都处于
ESTABLISHED
状态,假如是客户端先发起关闭请求。
- 那么,四次挥手的过程如下:
- 第一次挥手:客户端发送一个 FIN 报文,报文中会指定一个序列号。此时客户端处于
FIN_WAIT1状态
即发出连接释放报文段(FIN=1,序号 seq = u),并停止再发送数据,主动关闭 TCP 连接,进入 FIN_WAIT1(终止等待1)状态,等待服务端的确认。- 第二次挥手:服务端收到 FIN 之后,会发送 ACK 报文,且把客户端的序列号值 +1 作为 ACK 报文的确认号值,表明已经收到客户端的报文了,此时服务器处于
CLOSE_WAIT状态。
即服务端收到连接释放报文段后即发出确认报文段(ACK=1,确认号 ack = u + 1,序号 seq = v),服务端进入 CLOSE_WAIT(关闭等待)状态,此时的 TCP 处于半关闭状态,客户端到服务器的连接释放。客户端收到服务端的确认后,进入 FIN_WAIT2(终止等待2)状态,等待服务器发出的连接释放报文段。
-第三次挥手:如果服务端也想断开连接了,和客户端的第一次挥手一样,发出 FIN 报文,且指定一个序列号。此时服务端处于LAST_ACK(最后确认)状态
即服务端没有要想客户端发送的数据,服务端发出连接释放报文段(FIN=1,ACK=1,序号seq=w,确认号ack=u+1),服务端进入 LAST_ACK(最后确认)状态,等待客户端的确认。- 第四次挥手:客户端收到 FIN 之后,一样发送一个 ACK 报文作为应答,且把服务端的序列号值 +1作为自己 ACK 报文的确认号,此时客户端处于
TIME_WAIT状态。需要过一阵子以确保服务端收到自己的 ACK 报文之后才会进入 CLOSED 状态,服务端收到 ACK 报文之后,就关闭连接了,处于
CLOSED状态
即客户端收到服务端的连接释放报文段后,对此发出确认报文段(ACK=1,seq=u+1,ack=w+1),客户端进入 TIME_WAIT 状态。此时 TCP 未释放掉,需要经过时间等待计时器设置的 2MSL后,客户端才进入 CLOSED 状态
2.1 挥手为什么需要四次
在三次握手中,由于三次握手不携带数据,当服务端收到客户端发来的连接请求报文段后,可以直接发送 SYN+ACK报文。其中 ACK报文是用来应答的,SYN 报文是用来同步的。但是关闭连接时,当服务端收到 FIN 报文,服务端有可能还有数据并没有发完,很可能不会立即关闭 SOCKET,所以只能先回复一个 ACK 报文,告诉客户端,“你发的 FIN 报文我收到了”。只有等我服务端所有报文都发送完了,我才能发送 FIN 报文,因此不能一起发送,所以需要四次挥手。
2.2 2MSL等待状态
MSL是 Maximum Segment Lifetime 的英文缩写,可译为 “最长报文段寿命”,它是任何报文在网络上生存的最长时间,超过这个时间报文将被丢弃
- TIME_WAIT 状态也称为 2MSL 等待状态。每个具体 TCP 实现必须选择一个报文段最大生存时间 MSL(Maximum Segment Lifetime),它是任何报文段被丢弃之前在网络内的最大时间。这个时间是有限的,因为 TCP 报文段以 IP 数据报在网络内传输,而 IP 数据报则有限制其生存时间的 TTL 字段
- 对一个具体实现所给定的 MSL 值,处理的原则是:当 TCP 执行一个主动关闭,并发回最后一个 ACK,该连接必须在 TIME_WAIT 状态停留的时间为2倍的 MSL。这样可让 TCP 再次发送最后的 ACK以防这个 ACK 丢失(另一端超时并重发最后的 FIN)
- 这种 2MSL 等待的另一个结果是这个 TCP 连接在 2MSL 等待期间,定义这个连接的插口(客户的IP地址和端口号,服务器的IP地址和端口号)不能再被使用。这个连接只能在 2MSL 结束后才能再被使用。
2.3 四次挥手释放连接时,等待 2MSL 的意义?
为了保证客户端发送的最后一个 ACK 报文能够达到服务器。因为这个 ACK 有可能丢失,从而导致处在 LSAT-ACK 状态的服务器收不到对 FIN-ACK 的确认报文,服务器会超时重传这个 FIN-ACK,接着客户端再重传一次确认,重新启动时间
等待计时器
。最后客户端和服务器都能正常的关闭。假设客户端不等待 2MSL,而是在发送完 ACK 之后直接释放关闭,一但这个 ACK 丢失的话,服务器就无法正常的进入关闭连接状态。
两个理由:
- 保证客户端发送的最后一个 ACK 报文段能够到达服务端
这个 ACK 报文段有可能丢失,使得处于 LAST_ACK 状态的服务端收不到已发送的 FIN+ACK 报文段的确认,服务端超时重传 FIN+ACK 报文段,而客户端能在 2MSL 时间内收到这个重传的 FIN+ACK报文段,接着客户端重传一次确认,重新启动 2MSL 计时器,最后客户端和服务端都进入到 CLOSED 状态,若客户端在 TIME_WAIT状态不等待一段时间,而是发送完 ACK 报文段后立即释放连接,则无法收到服务端重传的 FIN+ACK 报文段,所以不会再发送一次确认报文段,则服务端无法正常进入到 CLOSED 状态。- 防止\”已失效的连接请求报文段\”出现在本连接中
客户端再发完最后一个 ACK 报文段后,再经过 2MSL,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失,使下一个连接中不会出现这种旧的连接请求报文段。
2.4 为什么 TIME_WAIT 状态需要经过 2MSL 才能返回到 CLOSED 状态?
理论上,四个报文发送完毕,就可以直接进入到 CLOSED 状态,但是网络可能是不可靠的,有可能最后一个 ACK 丢失。所以 TIME_WAIT 状态就是用来重发可能丢失的 ACK 报文。
3. 总结
《TCP/IP详解 卷1:协议》有一张TCP状态变迁图,很具有代表性,有助于大家理解三次握手和四次挥手的状态变化。如下图所示,粗的实线箭头表示正常的客户端状态变迁,粗的虚线箭头表示正常的服务器状态变迁