问个数学问题 关于机器学习 SVM

2022-03-18 15:44:32 +08:00
 zxCoder

max_{a} min_{w,b} L(w,b,a)

这个表示什么意思啊,后部分能理解,就是要找到一组 w 和 b ,使得 L 这个函数值最小,那前面再加一个 max 是什么意思?

不是说怎么推导出这个式子,是怎么理解这个式子的含义

1038 次点击
所在节点    问与答
13 条回复
fyex
2022-03-18 15:53:04 +08:00
极小值前提下的极大值,好像是这样的
czqzero
2022-03-18 16:04:18 +08:00
1 楼说的对
zxCoder
2022-03-18 16:22:38 +08:00
@fyex 意思是说极小值会有很多个吗,然后在里面再找一个最大的?
fyex
2022-03-18 16:42:26 +08:00
@zxCoder {w,b}极小前提下的 极大 a
zxCoder
2022-03-18 16:46:41 +08:00
@fyex 能讲得再通俗一点吗,有点抽象
fyex
2022-03-18 17:06:40 +08:00
@zxCoder 可以找个推导过程看下怎么到这步的就比较容易理解了
goonervs
2022-03-18 17:08:12 +08:00
svm 是为了找最佳超平面需要找到到最大边界,那么需要找到 min_w ,这里用到了二次规划于是要求 min_L ,这里又用到了拉格朗日乘数法引入了 a 目的是将 min_L(w,b)问题转换为 maxL(a)问题,因为这样可以得到 x 的内积可以使用核方法解决非线性问题。
zxCoder
2022-03-18 17:11:35 +08:00
@goonervs
@fyex
大佬们误会了。。。我不是问怎么推导到这个式子的问题。单纯是不懂 maxmin 或者 minmax 这种表达式是怎么理解的。卡在这里,没找到解释
JustSong
2022-03-18 18:30:33 +08:00
min_{w,b} L(w,b,a) 指仅视 w 和 b 为自变量,求最小值。然后结果是一个包含 a 的函数。
zxCoder
2022-03-18 18:46:38 +08:00
@JustSong 我好像有点理解了,是不是可以这么讲,假设 a 是离散的取值,那就是对每个 a 分别找出一组 w 和 b ,使得 L 的值最大?
zxCoder
2022-03-18 18:46:53 +08:00
@JustSong *使得 L 的值最小
JustSong
2022-03-18 19:09:34 +08:00
@zxCoder 是的,看内层时直接把 a 视为常量
Xs0ul
2022-03-19 03:15:10 +08:00
maxmin 举个现实中直观的例子,比如刚毕业找初级的职位,又想挑工资高的,那就要找初级职位给的多的,也就是 max_{公司} ( min_{公司, 职位} (工资) )

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/841289

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX