绝大部分情况下, 从 TCP 接收数据都存在一个把 "TCP 流" 转成 "数据块" 的问题, 那么为什么 TCP 当初还要设计成 "流"

TCP 设计成 "流", 只是实现起来容易一些吧, 但用起来真不爽实际上程序里用到的都是一块一块的内存, TCP 强行弄出一个"流"来. 这样在接收方必然要从 "流" 转换成 "块", 转换的方式有: 固定长度, 加包头指定长度, 用特殊的间隔标记.

固定长度: 简单无开销, 但是太死板不灵活, 适用场合很少. 加包头指定长度: 编程简单, 但会多一次读取开销. 用特殊的间隔标记: 比如 HTTP 这种, 就需要遍历全部内容

如果 TCP 原本就保留“块”信息，则使用起来就会简单很多了。比如这样定义

struct iovec {
   void  *iov_base;
   size_t iov_len;
};

/*
  返回发送出去的 struct iovec 的个数, 不要发送半个
  出错的情况的返回值和 write()/send() 一样
 */
int my_writev(int fd, struct iovec *vec, size_t n_vec);

/*
  返回接收到的 struct iovec 的个数, 不要接收半个
  出错的情况的返回值和 read()/recv() 一样
  接收的时候可以把 struct iovec *vec 预先分配，也可以不分配直接接收到 buf 里面同时把分块信息保存到 struct iovec *vec。
 */
int my_readv(int fd, struct iovec *vec, size_t n_vec, void *buf, size_t size_of_buf);

这样用来起来再很多场合就非常方便了。

bao3

2018-07-08 13:37:14 +08:00

楼主你把一杯水倒入另一个杯子，你期待的是水像冰块一样掉到另一个杯子里吗？可是你不确定另一个杯子的口径，你也无法提前分割冰块的大小。另外冰块掉到另一个杯子可能的先后顺序是乱的。

但当你用液态水来倒的话，你就不作关心对方的口径以及到达的顺序。
对你来说，你期待的是用块来发送数据还是用流发送？

CRVV

2018-07-08 14:06:19 +08:00

> 如果 TCP 原本就保留“块”信息，则使用起来就会简单很多

如果程序说要发送一个 1200 字节的块，要求保证送达，当前链路的 MTU 只有 800，该怎么处理？

1. 返回错误，这太难用了
2. 把 1200 的块拆开发出去
2.1 用 2 个包只发 1200 字节，这样浪费了 400 字节（ 2 个包本来可以发 1600 ）
2.2 用第 1 个包发 800，第 2 个包发 400 再加上下一个块的 400

1 大约是带重传的 IPv6
2.1 大约是带重传的 IPv4
2.2 是 TCP 加上分块，所以新的问题是应该用哪个方法来分块? 固定长度, 加包头指定长度还是用特殊的间隔标记？

结论是 TCP 不能保留“块”信息，这样做只是把分块的问题推到了 TCP 上，而传输层比应用层更不知道需要什么分块方式

c3824363

2018-07-08 14:33:34 +08:00

@CRVV 用 UDP 那种方式就行，现有的 iphdr 就能处理。参考 IP 分片
知道块的长度总会带来很多方便的，很多用户态的代码都在处理下面这个事情

接收固定长度包头
根据包头信息接收指定长度的包
重复以上步骤

从实用的角度看，TCP 可以携带分块信息。

ipwx

2018-07-08 14:34:11 +08:00

那当然是因为“流”比“块”更底层啊。

楼主你以为 UDP 是发了多大的块，就接收到多大的块嘛？ IP 协议允许的包大小不超过 64K，但实际中不一定能达标。而且事实上这个 64K 打包会发生分片传输，实际的包传输大小也不过几百字节。

https://en.wikipedia.org/wiki/IP_fragmentation
https://stackoverflow.com/questions/3712151/udp-ip-fragmentation-and-mtu

而且就算 IP fragmentation 默默地帮你搞定了重整，性能也实打实损失了的。
- - - -

总结一下，IP 协议中的“分块”是 IP 协议根据大部分传输介质的性质定出来的 IP 协议实现的标准，本身对于上层应用具有很有限的参考意义。由于 IP 包传输过程中大小不确定、分片机制不明，对于上层应用而言，“流”才是比“包”更底层的模型。

redsonic

2018-07-08 14:52:09 +08:00

楼主你理解错了，TCP 设计之初主要是面向文件传输的，在这种情况下没人会关心或干涉“流”之中的“块”。另一种用途是远程登录，因为这是人机的不间断交互所以本质也是流，同样不会关心“块”。如果你需要通过某些精心设计的“块”来驱动应用程序，那么 UDP 是干这事的。或者是 sctp。

hjc4869

2018-07-08 15:03:01 +08:00

@c3824363 能否 NAT 跟 SEQPACKET 无关，关键在于路由设备是否支持特定传输层协议。例如如果路由器支持 SCTP NAT，那么自然也支持 SCTP 的 SEQPACKET。

HTTP 的头部内容直接顺序读取流即可，直到 \r\n\r\n 即头部结束。后续的 content 也不需要分包，是货真价实的流。

momocraft

2018-07-08 21:38:22 +08:00

首先流是個很好的抽象, tcp 不是一個對上層的消息完整性負責的協議.

另外發明 tcp 時不像現在, 隨便人寫個 protobuf 就能正確處理消息邊界 (看看中文互聯網有多少人糾結"粘包問題"). 在黎明時期一個連接只傳輸一個消息, 用關閉連接表示消息結束并不罕見, 比如 ftp 甚至很久后的 http0.9

協議和應用是互相推動的, 現在責怪 tcp 不是消息單位可説事後諸葛亮

yankebupt

2018-07-09 00:54:45 +08:00

@c3824363 估计是参考当时的网速综合了实时性做出的妥协...
以包为单位，确认了这个包，这个包就算传到了，如果是实时聊天或者网游的话就可以拿去渲染了，延迟和 ping 一样...
如果是流，确认频次和包一样的话对比包没多大节省，如果确认间隔太长了碰到误码稍大，实时性差太远，即使 UDP 自定义纠错也比强行用 FEC 之类的纠错码压误码率来的性能略高（应该）。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/468985