sequence modeling(序列建模):在机器学习与自然语言处理等领域中,指对按时间或顺序排列的数据(如文字、语音、传感器读数、点击流、股票价格等)进行建模,以学习元素之间的顺序依赖关系,用于预测、生成或标注序列。(该术语也常涵盖 RNN、LSTM、Transformer、HMM 等方法。)
/ˈsiːkwəns ˈmɑːdəlɪŋ/
Sequence modeling helps computers predict the next word in a sentence.
序列建模可以帮助计算机预测句子中的下一个词。
In modern NLP, sequence modeling with Transformers can capture long-range dependencies and improve translation quality.
在现代自然语言处理中,使用 Transformer 的序列建模能够捕捉长距离依赖关系,从而提升翻译质量。
sequence 来自拉丁语 sequi(“跟随”),强调“一个接一个的顺序”。modeling 源自 model(模型),与拉丁语 modulus(“尺度、标准”)相关,表示“用一个抽象结构去描述现实”。合起来,sequence modeling 就是“用模型来描述与学习按顺序发生的数据规律”。