数据剖析 / 数据概况分析:对数据集进行系统检查与统计汇总,以了解其结构、内容与质量(如缺失值、重复、取值范围、分布、异常、格式一致性、主键唯一性、字段依赖等),常用于数据清洗、ETL/数据集成、数据治理与建模前的准备。
/ˈdeɪtə ˈproʊfaɪlɪŋ/
We did data profiling to find missing values and duplicates.
我们做了数据剖析来找出缺失值和重复记录。
Before migrating the database, the team performed detailed data profiling to identify inconsistent formats, outliers, and potential key violations across tables.
在迁移数据库之前,团队进行了详细的数据剖析,以识别各表之间不一致的格式、异常值以及潜在的主键/唯一性违规问题。
data 源自拉丁语 datum(“给出的事物”),在现代英语中常指“数据”。profiling 来自 profile(“侧面轮廓、概况”),在技术语境中引申为“对对象做特征概览与分析”(如性能 profiling)。合在一起,data profiling 就是“对数据做概况画像/剖析”,强调用统计与规则检查来“看清数据长什么样、好不好用”。