条件随机场(CRF):一种用于结构化预测的概率图模型,常用于对序列数据(如分词、词性标注、命名实体识别)进行整体建模与标注。它通过对给定观测(输入)条件下的标签序列(输出)建模,充分利用上下文特征。
/kənˈdɪʃənəl ˈrændəm fiːld/
We used a conditional random field to label each word in the sentence.
我们使用条件随机场来给句子中的每个词进行标注。
In biomedical text mining, a conditional random field can combine many contextual features to improve named-entity recognition accuracy.
在生物医学文本挖掘中,条件随机场可以融合多种上下文特征,从而提高命名实体识别的准确率。
“Conditional”意为“条件的”,强调模型学习的是 在给定观测条件下 的输出分布;“Random field”源自统计物理与概率图模型中的“随机场”概念,表示由许多相互依赖的随机变量构成的整体。CRF可理解为:在随机场框架下,对输出结构进行条件化建模的一类方法(常见为线性链CRF用于序列)。