V2EX  ›  英汉词典

Schema-on-read

定义 Definition

Schema-on-read(读时建模/读时定义模式):一种数据处理与数据仓库/数据湖常见做法——数据先以原始或半结构化形式存储,在读取、查询或分析时再按需要解释字段、类型与结构(即“在读的时候套上schema”)。常与 schema-on-write(写时建模)对比。该术语也常用于描述数据湖、日志数据、JSON/Parquet等场景。

发音 Pronunciation (IPA)

/ˈskiːmə ɒn riːd/

例句 Examples

We use schema-on-read to analyze raw logs quickly.
我们使用“schema-on-read”来快速分析原始日志。

In a data lake, schema-on-read lets different teams query the same files with different assumptions, but it also increases the need for strong data governance.
在数据湖中,“schema-on-read”让不同团队可以用不同的假设去查询同一批文件,但也更需要完善的数据治理。

词源 Etymology

该术语由 schema(模式/结构)+ on read(在读取时)组合而成,属于数据工程领域的对比性命名:强调“写入时不强制统一结构,而在消费/查询时再定义结构”。它随着大数据与数据湖实践(如Hadoop生态、日志与事件数据分析)而普及,用来表达“灵活性更高,但对管理与一致性要求更强”的数据策略。

相关词 Related Words

文学与著作 Literary Works

  • Designing Data-Intensive Applications(Martin Kleppmann)——讨论数据系统与数据建模取舍时常涉及schema策略与读/写时约束。
  • Hadoop: The Definitive Guide(Tom White)——在Hadoop生态与数据处理方式的语境中常出现“读时解释结构”的实践表述。
  • Streaming Systems(Tyler Akidau 等)——在事件数据、管道与数据一致性讨论中,会提到与schema演进、读取时解析相关的理念与实践。
  • The Data Warehouse Toolkit(Ralph Kimball 等)——虽以传统数仓建模为主,但常被用作与数据湖/读时建模思路对照的经典参考。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   851 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 23:34 · PVG 07:34 · LAX 15:34 · JFK 18:34
♥ Do have faith in what you're doing.