哪里找一些大量模拟数据来练习 SQL

2021-12-24 17:20:11 +08:00
 linglin0924

才意识到 sql 执行也会很浪费时间,以前做什么缓存、中间件节省的时间,还不如改一个 sql 语句效率明显 。

哪里找一些大量模拟数据来练习 SQL ,亿? 十亿? 数据少了跑 sql 语句效果不够明显。

或者有什么数据库用法可以观察到 sql 的执行效率

2695 次点击
所在节点    数据库
16 条回复
Itoktsnhc
2021-12-24 17:45:42 +08:00
执行计划
zhensjoke
2021-12-24 18:17:50 +08:00
社工库
LING97
2021-12-24 19:01:47 +08:00
啥数据库呢? Sql 效率无非就是索引吧,分析下走没走索引就行了,数据量少一样能学。如果数据量上十亿,还有查询需求的话,我们一般上搜索引擎,或者分表,或者离线表定时查。不头铁就行😂
milk97
2021-12-24 19:26:38 +08:00
https://dev.mysql.com/doc/employee/en/employees-introduction.html

400 万数据,用来分析 SQL 执行效率配合 explain 应该是够了的
CEBBCAT
2021-12-25 02:05:39 +08:00
@LING97 #3 SQL 分析器也会关注到数据尺寸,如果数据量太少,可能会什么索引都不走,直接扫表
gavindexu
2021-12-25 09:32:23 +08:00
官网上装的 好像已经带了一些数据。sakila
noparking188
2021-12-25 11:50:57 +08:00
插一句,合理的 Schema 设计也很重要,优化半天 SQL 不如对表稍作修改
huaouo
2021-12-25 21:39:22 +08:00
billly
2021-12-26 00:02:12 +08:00
之前看 clickhouse 的时候,官网上有个几十 G 的数据集
hooopo
2021-12-26 09:08:11 +08:00
想搞一个
fly0512
2021-12-26 22:05:37 +08:00
tpc 了解一下,可以自己按需生成模拟数据。
http://tpc.org/
silencefly
2021-12-26 23:09:10 +08:00
Joker123456789
2021-12-27 12:47:23 +08:00
数据自己插啊,循环 + insert 你总会写的吧?

执行效率 可以看执行计划
MoYi123
2021-12-27 13:18:54 +08:00
凭空想象一个场景,设计表结构,造数据, 然后去优化它

https://github.com/mmooyyii/mmooyyii/blob/master/docs/database/tiplist1.md
VVValent
2021-12-28 13:39:22 +08:00
我也想知道
likeunix
2022-03-12 17:48:45 +08:00
推荐一个测试数据集的工具,一键生成各种数据类型,支持导出到 JSON 、SQL 、XML 等文件。官网地址: http://www.redisant.cn/da

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/824277

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX