我发明的算法,登上了 Hacker News 日榜第二!

3 天前
 diyer22

我在之前 ICLR 2025 的论文中提出了一种全新的生成模型——「离散分布网络」(Discrete Distribution Networks)

前两天在 Hacker News 上宣传,反响热烈,竟然来到了日榜第二名,给项目的网页带来了近 1.5 万的访问量。

所以,现在想在 V2EX 也宣传交流一下~

一句话介绍:「离散分布网络」是一个原理简单、性质独特的全新生成模型,有着非常多有趣的性质。期待 DDN 能给更多人带来灵感~

PS. GitHub 五万关注者的算法大 V lucidrains 也复现了 DDN 算法: https://github.com/lucidrains/discrete-distribution-network

详情:

英文介绍: https://x.com/diyerxx/status/1978531040068321766 ( twitter 冷启动实在太难啦,求互动一下鼓励鼓励🥺)

中文介绍: https://zhuanlan.zhihu.com/p/1935903948990047972

项目网页: https://discrete-distribution-networks.github.io/

GitHub: https://github.com/DIYer22/discrete_distribution_networks

3576 次点击
所在节点    分享创造
37 条回复
chen88ijn
3 天前
太强了,巨佬
JoeJoeJoe
3 天前
K-means?
Wcowin
3 天前
先收藏慢慢看
diyer22
3 天前
@JoeJoeJoe DDN 的形式上和 k-means 比较相似,且都支持无监督聚类。但他们不同点有:算法作用(生成建模 VS 聚类)、优化目标、优化方式、DDN 的层次结构、DDN 的样本点是神经网络的 outputs 等。 所以,属于独立的两个算法。
molvqingtai
3 天前
虽然看不懂,但我大受震撼!
JoeJoeJoe
3 天前
@diyer22 刚才只是大概看了下项目网页, 感觉很像, 收藏以后细读.

ps: 想给你点个 V 币赞赏,看你没绑定钱包,直接给你来个铜币赞吧.
monmon
3 天前
知道我为什么喜欢来 V 站了吗,这里个个都是人才,说话又好听,超喜欢在里面
pianjiao
3 天前
虽然看不懂,但是佬就是牛逼
spike0100
3 天前
虽然不知道你在说什么,但是感觉很厉害的样子!
hikarumx
3 天前
v 站就是大佬多。
xion21
3 天前
大佬
tanglindan6
3 天前
仰望一下大佬!
irrigate2554
3 天前
是大佬
Simon95
3 天前
支持,x 关注了,github 星星了。我简单看了下,感觉有点像 RVQ ?
Simon95
3 天前
哇,大佬一个人创新算法,膜拜。还有请教下最近做的工作感觉,FSQ codebook usage 能到 1 ,大佬觉得 VQ-VAE codebook collapse 还是问题吗?
halberd
3 天前
非常有才华的想法啊,用一棵树撑起整个特征空间。
从网络参数分配的角度讲,我感觉直观上存在这样一个问题:第 i 层网络负责的区域实际上会分散在特征空间的各处,它做的事是把负责的这一块空间再向下切分成 K 小块。也就是说每一层并不会去擅长某种类型的特征,而是专门做某一级的细分。给我一种缺乏“局部性”的感觉,好像这个专家分配并没有很优,会不会潜在地影响能力呢。
当然这是用线性的参数量去拟合指数的空间肯定会遇到的问题。默认的多层实现相当于按照树深度、也即特征空间中的位置层级来分配参数,属于一种人为、简洁有效的策略;而共享参数实现和 diffusion 类似,是把全部任务交给整个模型,让模型自己学习不同位置的策略(以 v-pred diffusion 为例,使用全部参数去完成在任意位置 x_t 上的 v_t(x_t)预测)。
cjh1095358798
2 天前
牛批啊佬
ik
2 天前
我什么身份和大佬在一个帖子
diyer22
2 天前
@Simon95 DDN 和 VQ-VAE ( RVQ ) 明显不同。
相似之处:
- 两者都把数据映射到离散的潜空间。
区别:
- VQ-VAE 需要额外的先验模型(如 PixelCNN 或 transformer 先验)来建模码本的分布; DDN 自己就能构建层次离散分布,甚至可作为类似 VQ-VAE 系统的先验模型。
- DDN 的 K 个输出是随输入变化的特征; VQ-VAE 的码本是一组与输入无关、固定不变的独立参数( embedding )。
- VQ-VAE 输出二维 code index 网格 latent ; DDN 输出一维/树状结构的 latent 。
- VQ-VAE 需要 Straight-Through 梯度估计器。
- DDN 支持零样本条件生成。
因此,我认为它们挺互补的。(参见论文中的“Connections to VQ-VAE”部分。)

---

我对 VQ-VAE 不是很了解,在我看来 VQ-VAE codebook collapse 应该有很多方法能缓解,比如和 DDN 论文中 Split-and-Prune 类似的 reinitialization 的方案。(也在“Connections to VQ-VAE”部分。)
itechify
2 天前
虽然看不懂,但我大受震撼!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1166208

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX