我做了一个工具,给 Claude Code 会话打分——找出 AI 协作里的得分点

1 天前
 chengrui0428

用 Claude Code 久了,有个问题一直困扰我:不知道自己的使用方式好不好。每次 session 结束,感觉有收获,但说不清楚哪里低效、哪里做对了。

于是写了这个工具:session-score-plugin


它做什么

Claude Code 每次 session 结束后,自动读取会话记录,输出一个 1–100 的分数,分解成 7 个维度:

维度 满分 衡量什么
🔒 Security 15 危险命令、凭证泄露、risky pattern
⚡ Effectivity 15 目标完成度、纠错轮次、人工干预次数
🏗 Solidity 10 测试覆盖、commit 规范、PR 流程
💡 Efficiency 15 token 消耗、重复读文件、冗余步骤
🗺 Planning Quality 15 先问清楚再动手、用了 plan mode 吗
🔄 Recovery Ability 15 遇到报错能恢复吗、还是一直重复同一个错
🎯 Hallucination Rate 15 有没有引用不存在的文件/函数

安装

brew tap Laotree/tap
brew install session-score-plugin
session-score-plugin install   # 注册 Stop hook ,之后每次 session 结束自动打分

我自己用下来的感受

最让我意外的是:数字化之后,坏习惯变得非常清晰。我 Planning Quality 一直偏低——经常一上来就开始写代码,没有先把需求问清楚。Efficiency 也差,反复 Read 同一个文件。

以前这些都是模糊的感觉,有了分数之后就变成了可以改的具体问题。


开源: https://github.com/Laotree/session-score-plugin Rust 写的,MIT 协议。

欢迎用过 Claude Code 的朋友试试,也欢迎提意见——特别是评分维度的权重合不合理,以及有没有遗漏的重要维度。

272 次点击
所在节点    Claude
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1215587

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX