两年实盘 +135%,聊聊我用 Claude Code 搭的多 Agent 投研框架

8 小时 36 分钟前
 xbtlin

做了个 AI 投研系统,4 个 Agent 互相挑刺,结果比我自己分析靠谱多了


你直接问 Claude"帮我分析拼多多值不值得买",它会给你一篇"一方面...另一方面..."的平衡文。看起来全面,但没法拿来做决策。

我想做的系统必须给出明确倾向:一个合理价格区间,当前价位偏高、合理还是偏低,附上置信度。做不到这一点的分析,对决策没有帮助。

花了一年多,把投研流程拆成了一套多 Agent 对抗系统。项目开源在 GitHub: https://github.com/xbtlin/ai-berkshire

先看产出

拿拼多多举例,系统实际跑出来的结论:

一个说"真便宜",另一个说"不确定就不买"。这种矛盾不是 bug ,是投资决策的真实状态。

完整的报告样本放在仓库 reports/ 目录下,有 100+ 份,随便翻。

核心设计:多 Agent 对抗

/investment-team 会启动 4 个独立的 Claude Code subagent ,每个从不同分析维度(商业模式 / 财务估值 / 行业竞争 / 风险评估)各自搜索网络、各自交叉验证数据、各自给出结论。这不是把一个 prompt 拆成四段再拼回来——是 4 个"分析师"各自做了完整研究,最后由 Team Lead 综合,并且专门有一轮挑战环节:A 的结论要经受 B 、C 、D 的质疑。

单个 LLM 容易自我强化——前面说了看好,后面就不自觉找支撑证据。多 Agent 对抗就是为了打破这个倾向。

最终报告输出分层建议:激进型 / 稳健型 / 保守型各自的仓位和价格区间,加上一个"镜子测试"——5 句话说不清为什么买,就是不该买。

架构

Skill 层( 16 个入口)— 定义你要做什么研究
    ↓
Agent 层( 4 Agent 并行)— 各自搜索、独立判断、互相挑战
    ↓
工具层 — Decimal 精确计算 + 实时检索 + 报告校验

两个工程细节:

不信 LLM 心算。 LLM 算 PE 能算错小数点,港币人民币单位搞混更是常见。所有财务计算走 Python decimal.Decimal,关键数据至少 2 个独立来源交叉验证。还内置了 Benford 定律检测——用首位数字分布异常发现财务数据可疑的线索。

多层纠偏。 AI 最危险的不是给错答案,而是给一个看起来很对但经不起推敲的答案。框架里内置了信息丰富度分级、逆向检验(强制思考"这家公司怎么会死")、快速否决清单( 8 条红线一票否决,管理层诚信有问题不管多便宜都直接否决)。

怎么用

npm install -g @anthropic-ai/claude-code
git clone https://github.com/xbtlin/ai-berkshire.git
cp ai-berkshire/skills/*.md ~/.claude/commands/

/investment-team 腾讯           # 4 Agent 并行深度研究
/earnings-review 腾讯 2025Q4    # 财报精读
/quality-screen 茅台, 英伟达     # 快速筛选

实盘记录

附一下自己用这套流程辅助决策的实盘,仅供参考:

指标 2024 全年 2025 至今
我的实盘 +69.29% +66.38%
标普 500 +23.31% +16.39%
恒生指数 +17.67% +27.77%

几个注脚:样本量只有两年,统计上说明不了什么;集中持仓 3-5 只,波动极大;买入决策是人做的,系统只负责研究;工具是投资过程中逐步搭建的,不构成因果关系。

这个帖子不是来说"用 AI 炒股能赚钱"的——收益来自集中持有深度研究过的公司,框架的作用是提高研究效率和分析质量。

已知局限

最后

GitHub: https://github.com/xbtlin/ai-berkshire

MIT License ,没有付费版,没有课程,没有星球。有问题直接开 issue ,我都会回。

一个我自己还没想清楚的问题:LLM 做投资研究最大的风险是什么?是幻觉?是数据滞后?还是给了你虚假的信心让你加大仓位?欢迎聊聊。

如果你想看某只股票跑出来什么样,评论区留名字(美股/港股),我挑几个跑一下贴上来。

5534 次点击
所在节点    分享创造
111 条回复
xiaojizhuodami
5 小时 3 分钟前
楼主这两年仓位都在半导体吗?
Huxley42
5 小时 2 分钟前
看起来不错,实战不知道效果怎样
hailaz
4 小时 54 分钟前
你跑下小米 HK 看看,恒生科技下跌了半年
xbtlin
4 小时 46 分钟前
godmiracle
4 小时 46 分钟前
中国联通为什么被排除啊
xbtlin
4 小时 45 分钟前
@digitv 谢谢你的建议,暂时不搞群,精力有限先把项目做好。有问题直接在 GitHub 开 issue ,讨论质量比群聊高,而且沉淀下来后来的人也能看到。
Zeyes
4 小时 42 分钟前
好东西,今晚研究一下。
帮跑一下,A 股 洛阳钼业 603993
Haller
4 小时 38 分钟前
用 AI 最大的风险点是你信不信任的问题
shuqin2333
4 小时 35 分钟前
有没有技术分析的,什么压力位、缠论之类的
xbtlin
4 小时 34 分钟前
@digitv 会调用 WebSearch 、Fetch 的工具获取,有时候是可以拿到官网数据的,我看国外网站还是蛮多的。
mywjyw
4 小时 29 分钟前
考不考虑把最近那个白毛股神的 skill 加进来
Colderer
4 小时 29 分钟前
@xbtlin 帮忙跑下康方生物,谢谢~
mankismi
4 小时 27 分钟前
能知道大概會消耗多少 token 嗎?
xbtlin
4 小时 22 分钟前
评论区提到的股票我都看到了,在陆续跑,跑完一个贴一个,别急。
javazero
4 小时 17 分钟前
max 20x 跑一次大概需要多少周限额呢?
xbtlin
4 小时 17 分钟前
@wpl 一句话总结:GE Vernova 是一家好公司——但在 Forward PE 61x 的价位,好公司不等于好投资。等一个大幅回调再考虑。完整报告: https://github.com/xbtlin/ai-berkshire/blob/main/reports/GE%20Vernova/GEV-research-20260623.md
MasterC
4 小时 16 分钟前
m ,学习一下
fangqiu1992
4 小时 13 分钟前
---
⚠️ 一处需你确认:标准 report_audit.py 准出流程依赖二级市场公开数据源,对未上市公司不适用,我改用"逐点标注置信度"替代,并在附录如实说明了——这是对规范的合理偏离,特此告知。
Gyj123
4 小时 11 分钟前
@xbtlin 哥,帮跑下 德业股份&川润股份,感谢🙏
jimrok
4 小时 6 分钟前
看到这种收益率,应该回撤也不小。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1222186

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX