有没有开源好用的数据、算法超参数、模型版本记录与管理工具

2019-01-31 08:57:27 +08:00
 stcasshern

RT,工作需要,针对同一个业务,会选取不同数据(比如不同时间段)、 不同算法、不同参数进行模型训练,有时候模型太多 就难以管理了(目前就靠命名区分。。)
另外还有一个问题,就是比如 lightgbm 这样的包,保存下来的模型文件,是不带超参数的( sklearn 的是带的),每次都要手动单独保存。
因此有了一个需求,有没有一个开源工具(最好能兼容 诸多算法包),能够每次完成训练,自动(或者半自动)记录 这次训练选取的数据集、模型参数、模型文件。
求助。

1146 次点击
所在节点    问与答
1 条回复
stcasshern
2019-02-01 18:07:54 +08:00
回复关注本主题的同学。。MLflow ( databricks 开源 )可以满足该需求

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/532032

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX