在实际使用机器学习算法时，面对训练集，是如何知道它是线性可分的，还是不可分的？？

2016-05-12 15:49:41 +08:00

tony1016

是因为尝试使用某种算法，比如 LR ，发现代价函数不收缩，从而确定不合适？
还是有什么标准，一开始就能确定训练集是线性可分的，还是不可分的？？

2736 次点击

所在节点

云计算

3 条回复

menc

2016-05-12 18:20:24 +08:00

如果维数不高，可以任意取两维打出来看看，多取几次，两维都线性不可分，那么数据集就线性不可分了。

然而我一般不用。
直接上模型。

非线性模型， svm 啊， gbdt 啊，对线性可分的问题拟合能力也不错的。

如果要一个确定的方法确定是线性可分还是线性不可分，那这样的方法是不存在的，要不然 svm 的 kernel function 选什么就不是玄学了。

tony1016

2016-05-12 20:55:49 +08:00

@menc 哦，这样子，感谢

srlp

2016-05-13 07:28:13 +08:00

一般现实世界的，默认不可分吧。计算力足够的话，所有模型都强行上一次试试。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278195

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.