V2EX  ›  英汉词典

Pomdp

释义 Definition

POMDPPartially Observable Markov Decision Process 的缩写,中文常译为部分可观测马尔可夫决策过程:一种用于序贯决策的数学模型。与 MDP 不同,智能体无法直接看到环境的真实状态,只能通过不完全/带噪声的观测来推断状态,并在不确定性下选择动作以最大化长期回报。(在机器人、对话系统、规划与强化学习中常见。)

发音 Pronunciation

/ˌpiː oʊ ˌɛm diː ˈpiː/

例句 Examples

I’m modeling the robot’s navigation as a POMDP.
我把机器人的导航问题建模为一个 POMDP。

Because the agent only receives noisy sensor readings, we maintain a belief state and solve the task as a POMDP to choose actions under uncertainty.
由于智能体只能获得带噪声的传感器读数,我们维护一个信念状态,并将任务作为 POMDP 来求解,以在不确定性下选择动作。

词源 Etymology

POMDP 来自首字母缩写:Partially Observable Markov Decision Process。该术语在人工智能与运筹学/控制领域用于扩展经典 MDP,以表达“状态不可完全观测”的现实情形。

相关词 Related Words

文学与经典著作 Literary Works

  • Artificial Intelligence: A Modern Approach(Stuart Russell & Peter Norvig)——在不确定性下的决策与规划部分常讨论/提及 POMDP。
  • Reinforcement Learning: An Introduction(Richard S. Sutton & Andrew G. Barto)——在“部分可观测”情形与相关扩展中涉及 POMDP 概念。
  • “Planning and acting in partially observable stochastic domains”(Kaelbling, Littman & Cassandra, 1998)——经典综述论文,系统阐述 POMDP 的表示与求解思路。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   671 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 20:47 · PVG 04:47 · LAX 12:47 · JFK 15:47
♥ Do have faith in what you're doing.