一个看似简单的 sql 优化问题，但是把我给难住了

在我看来，这是个很合理的需求，我在项目中没做优化，对于 ToB 项目的数据量实测完全没问题，但是对于数据量大的情况下，确实需要优化，可是我想不出解决方案。

以下例子基于 postgres，但是这个问题应该不限于 postgres 。

有一张货币表 c： create table currency (id bigserial not null primary key, rate double precision not null);

造数据： insert into currency (rate) select random()*10 from generate_serial(1, 100);

有一张薪资表 s： create table salary(id bigserial not null primary key, salary double precision not null, currency_id bigint not null references currency(id));

造 1000w 条数据： insert into salary(salary, currency_id) select random()*1000, random()*99::int+1 from generate_series(1, 10000000);

薪资表通过 currency_id 外键引用 c，c 里面记录了每个货币的汇率，这个汇率会定期更新，所以不方便将汇率直接写入 salary 表。

当过滤薪资条件时，会使用 SQL： explain analyze select * from salary s left join currency c on s.currency_id = c.id where salary/rate > 1000;

这个查询不会使用索引，会很慢，怎么优化？

有大佬有思路的吗？

EchoUtopia

2021-10-09 16:36:03 +08:00

@masterclock 另外我想了下，薪资也没问题吧，比如公司总部在美国，公司有的部门在成都，有的在东京，那总部发给成都的工资应该是以人民币计的固定薪资，东京类似，但是总部那边各种统计、计算啥的都是以美元计的，所以总部想统计以美元计的所有工作人员的薪资范围的人，这个时候应该是要把不同国家的薪资换算成美元。

EchoUtopia

2021-10-09 17:01:58 +08:00

@machtimes 耗时是原始查询 1 倍多
@debuggerx 应该可以，但是我想最好是把这个字段单独拆一个表出来，只有两个字段，salary_id, converted_salary，这样更新的时候需要写的数据页就少了，实际薪资表会有很多其他字段。另外一个问题就是更新数据的时候会上排他锁，所有数据都要更新一遍，不知道对查询有多大影响。

zlowly

2021-10-10 00:38:13 +08:00

直觉上，传统关系型数据库对这种 sql 是无法应对实时查询的。
当然如果货币种类十分有限，通过分区的思路是可以改善查询，比较麻烦而且仍然不足以应付查询性能。
因为可以看出，currency 的 rate 变化，足以导致整个结果完全不同，极端情况下，全表扫描是无法避免的，这不是什么简单优化可以应对的。这种需求，毕竟 rate 变动应该也是不频繁的，通常都只是转为定期报表加工，并不需要特别考虑 sql 和结构优化。

如果类似需求有实时性要求而且 rate 时刻动态彼变化，请考虑传统关系型数据库以外的方案，例如分布式数据库、分布式计算等。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/806668