弱监督(学习):一种机器学习训练方式,使用不完全、不精确、带噪声或间接的标注信号来训练模型,而不是依赖大量高质量的人工精标数据。常见信号包括:启发式规则、远程监督(用知识库自动对齐)、弱标注、众包粗标、数据编程的标注函数等。(也常写作 weakly supervised learning。)
/wiːk ˌsuːpərˈvɪʒən/
Weak supervision helps us train a model without labeling every image by hand.
弱监督让我们不必为每张图片都手工标注,也能训练模型。
Using weak supervision from heuristics and noisy logs, the team built a classifier that generalized well to new data.
团队利用来自启发式规则和带噪日志的弱监督训练分类器,并在新数据上取得了较好的泛化效果。
weak 来自古英语 wāc,表示“软弱的、力量不足的”,在此引申为“信号强度不够、可靠性不高”。supervision 源自拉丁语 *super-*(“在上、之上”)+ videre(“看”),原义接近“监督、看管”。合起来在机器学习语境中指:监督信号“有但不强/不干净”,并非完全准确的真值标注。