MoYi123 最近的时间轴更新
MoYi123

MoYi123

V2EX 第 469223 号会员,加入于 2020-02-14 14:02:50 +08:00
今日活跃度排名 14686
MoYi123 最近回复了
6 天前
回复了 avadakur 创建的主题 程序员 关于数据库高并发插入的版本号问题
直接用 mysql 的事务 id 怎么样?
@249239432 r-tree ,kd-tree 这些数据结构都不行, 还得是我最爱的集群 for 循环最高效
26 天前
回复了 main1234 创建的主题 程序员 [求问] 没学历没基础咋入门 AI 啊
很多年前收藏的 https://github.com/microsoft/ML-For-Beginners
当然看是不可能看的.
28 天前
回复了 SJH0402 创建的主题 MySQL mysql 分表能带来哪些显著的,可见的提升?
@SJH0402 你要是能直接把查询优化好, 有人会不听你的方案吗?
1. 把关键词列表放到一个 list, 去重排序, 并且把原先的关键词列表替换为这里的 rank, 关键词列表变成 list<list<rank>> 即把 string 离散化.

2. 把上面的 list<string> 变成 ac 自动机, 在文本中搜索. 得到一个 list<int>

3. 在 list<list<rank>>里搜索有哪几个 list<rank>是 list<int>的子序列, 在这里面抄一个最快的算法 https://leetcode.cn/problems/number-of-matching-subsequences/description/
个人建议别熔断, 做这种事情就是纯背锅的.
53 天前
回复了 dyv9 创建的主题 MySQL 全表价格排序的性能
n = 3000000
id = [i for i in range(n)]
原价 = [random.random() * 99999999 for _ in range(n)]
厂家折扣 = [random.random() * 1000 for _ in range(n)]
卖家折扣 = [random.random() * 1000 for _ in range(n)]
买家折扣 = [random.random() * 1000 for _ in range(n)]
汇率 = [random.random() * 10 for _ in range(n)]

table = list(zip(id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率))


def sort_by(row):
id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率 = row
return 原价 - 厂家折扣 - 卖家折扣 - 买家折扣 * 汇率


import time

start = time.time()
table.sort(key=sort_by)

print(time.time() - start) # 1.0334241390228271


300w 行用 python 全部排序也才 1 秒, 数据库里 c/c++的排序怎么可能要 10 秒呢?
况且 limit n 的情况下只需要 O(n)的排序算法. python 里的还是 O(nlogn)的.

你该不会是把数据全拉到本地再计算的吧.
54 天前
回复了 Mithril 创建的主题 职场话题 如何避免波音这类问题发生在你公司
怎么上来就复读程序员思维? 我看 op 也没说要用技术来解决吧?
69 天前
回复了 zwyyy456 创建的主题 程序员 caddy 的内存占用异常高
core dump 下来, 到本地的 goland 里看
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5549 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 05:57 · PVG 13:57 · LAX 22:57 · JFK 01:57
Developed with CodeLauncher
♥ Do have faith in what you're doing.