🚀 核心新特性
1. 🧠 业务语义层 (Semantic Layer) —— 让 AI 理解业务
为了解决 AI 无法将您的口语(如“营收”)映射到数据库字段(如 xsqk)的问题,我们上线了语义层功能:
- AI 语义自动分析:在“结构编辑器”中点击“✨ AI 语义”,AI 将自动推断字段含义并生成业务别名。
-
精细化字段管理:
- 手动微调:您可以修正 AI 建议,设置字段业务分类(如金额、ID 、日期等)和描述。
- 可见性控制:支持“对 AI 隐藏”特定字段以节省 Token ,或在导入阶段直接“屏蔽”无需关注的列,保持分析环境整洁。
- 持久化:所有语义和过滤设置均随项目保存,确保业务逻辑的一致性。
2. 🔌 数据库连接器 (Database Connectors) —— 打破数据孤岛
打破文件壁垒,现在支持通过标准协议直接从数据库导入数据:
- 支持 MySQL & PostgreSQL:通过成熟的连接协议,支持从主流数据库直接摄取数据。
- 高性能流式导入:采用“数据流”架构,即使是百万级的大表也能平稳导入,保障系统极速响应。
- 极致存储效率:同步到本地的数据将转换为 DuckDB 高性能列式格式。数据占用空间通常仅为原始数据库的 1/5 到 1/10。
3. 🏎️ 统一的数据摄取流水线 (The Wansan Flow)
重构了整个数据处理机制,无论是本地文件( Excel, CSV, JSON, Parquet )还是数据库表,现在都遵循一致的高性能“三阶段”流程:
- 阶段一:资源扫描 (Inspect) —— 极速识别。瞬间列出所有工作表或数据库表名,无需等待数据加载。
- 阶段二:异步准备 (Prepare) —— 预加载机制。后台流式读取数据并自动标准化(如自动修复 CSV 乱码),在此阶段即可实时查看行数统计和数据预览。
- 阶段三:最终摄取 (Ingest) —— 秒级入库。利用 DuckDB 原生并行性能,将准备好的数据瞬间摄入本地数据库并建立高性能索引。
- “购物车”式导入向导:支持文件与数据库表在同一个清单中并发处理,非阻塞操作让您可以边导入边添加更多源。
- 新增 Parquet 格式支持:支持导入行业标准的 Parquet 文件,通过零拷贝技术实现处理速度的飞跃。
🌐 官网与文档更新
- 官网重构:使用 Astro 框架重新构建了官方网站,带来更快的访问速度和更清爽的视觉体验。
- 帮助手册完善:全面更新了产品使用手册,详细介绍了新版本的功能特性。您可以直接在官网进行查看。
依然 Beta
官网: https://studio.wansan.app
目前还是 Public Beta 阶段,输入激活码解锁全部功能:
再次感谢大家的支持!🫡