CRUD 工程师提问：最佳实践是把逻辑放在数据库中还是后端代码中？

crud 搞久了，最近坐下来想些问题就发现脑子有点乱。假如现在有这么一个按类别查询某用户未读帖子数量场景：

有 2 张表
用户表 user，字段：用户唯一标识符：uuid
帖子表 post，字段：帖子类别：type ；帖子已读用户：readers （用户每打开一个帖子就往这个字段写入用户 uuid，并以逗号分隔）

Java 代码中有对应的实体类，orm 使用 Spring Data Jpa。

现在需要按类别查询某用户未读帖子数量，有两个方案：
1、直接查出所有帖子的类型和已读用户字段，然后用 Java8 的 Stream.filter、Collectors.groupingBy 来过滤、分类，直接给前端一个返回一个 Map （体现了 orm 的思想……）
2、用包含 couting、not like、group by 等关键字的 sql 直接查出结果，直接给前端返回一个 Set<map>。

如果使用方案 1，那么项目这部分 Java 代码应该放在哪里（ service or controller ）？项目结构应该怎么划分呢？

虽然问题很小，不知道这算是钻牛角尖不……请有经验的 Ver 指教下

xy90321

2018-12-08 20:04:23 +08:00

除非你用的数据库性能很差或者不提供类似功能语法的支持，否则我看不出全拿出来有什么好处。特别是你的数据量稍微大一点的时候，那已经不是蛋疼而是蛋碎了。（前提是如果内存和磁盘还没爆炸的话）

更重要的是，很多复合 SQL 语法你要自己在 Java 端实现一遍那简直就是…

MegrezZhu

2018-12-08 20:33:24 +08:00

首先既然是 SQL 数据库的话，这样设计表是有问题的…应该抽出一个用户已读帖子的表（ userid+postid ），然后做一些外键 /索引，这样直接通过 SQL 查询的时候数据库能对查询做优化，不用读取全部数据。第一种方法在数据量大的时候基本不现实。
可以去看看数据库范式，挺经典的理论。

V2XEX

2018-12-08 21:46:35 +08:00

@MegrezZhu 有 n 个帖子，m 个用户，那么这张中间表至多就会有 m × n 条记录，以后每新发一个帖子至多会增加 m 条记录。还需要考虑删除情况……这样的开销对于原来直接将用户 uuid 写入帖子表某个字段来说不知道哪个更优？

azzwacb9001

2018-12-08 22:25:34 +08:00

好问题。我是一个菜鸟，但我觉得方案 2 是比较合理的方案。如果不考虑具体的场景，那我觉得这个问题可以这么看：
如果从数据库中取出来的数据，没有在中间层进行二次加工的需求，那就使用方案 2 ；如果一些从数据库中用比较复杂的 SQL 语句取出来的数据，还可能二次加工或者供多方使用，那就用方案 1.

不知道我有没有理解楼主的问题= =我没搞过 JAVA

MegrezZhu

2018-12-08 22:31:58 +08:00

@V2XEX 直接将 uuid 写入帖子表的话，帖子表里面不也一样会是至多 m × n 个 uuid 吗，顶多减少了帖子 tid 的存储空间，所以我才说不会有数量级上的差距。
而且考虑删除情况的话，考虑在某个帖子下删除某个用户的阅读记录（呃，为啥会有这个需求，还是我理解错了？），首先就会有 O(n)的查询复杂度。相对地如果是采用访问记录表的话，依靠索引可以近似地达到 O(1)的复杂度。
如果是删帖带来的删除所有该帖子下的阅读记录的话，方法 1 可能会略有优势，但访问记录表依然可以利用索引高效删除，而且删除操作相对也不多。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/515705

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

CRUD 工程师提问：最佳实践是把逻辑放在数据库中还是后端代码中 ？

CRUD 工程师提问：最佳实践是把逻辑放在数据库中还是后端代码中？