V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Edward4074
V2EX  ›  分享创造

Wansan Studio v0.7 -- Semantic & Connect

  •  
  •   Edward4074 · 8 小时 33 分钟前 · 186 次点击

    🚀 核心新特性

    1. 🧠 业务语义层 (Semantic Layer) —— 让 AI 理解业务

    为了解决 AI 无法将您的口语(如“营收”)映射到数据库字段(如 xsqk)的问题,我们上线了语义层功能:

    • AI 语义自动分析:在“结构编辑器”中点击“✨ AI 语义”,AI 将自动推断字段含义并生成业务别名。
    • 精细化字段管理
      • 手动微调:您可以修正 AI 建议,设置字段业务分类(如金额、ID 、日期等)和描述。
      • 可见性控制:支持“对 AI 隐藏”特定字段以节省 Token ,或在导入阶段直接“屏蔽”无需关注的列,保持分析环境整洁。
    • 持久化:所有语义和过滤设置均随项目保存,确保业务逻辑的一致性。

    2. 🔌 数据库连接器 (Database Connectors) —— 打破数据孤岛

    打破文件壁垒,现在支持通过标准协议直接从数据库导入数据:

    • 支持 MySQL & PostgreSQL:通过成熟的连接协议,支持从主流数据库直接摄取数据。
    • 高性能流式导入:采用“数据流”架构,即使是百万级的大表也能平稳导入,保障系统极速响应。
    • 极致存储效率:同步到本地的数据将转换为 DuckDB 高性能列式格式。数据占用空间通常仅为原始数据库的 1/5 到 1/10

    3. 🏎️ 统一的数据摄取流水线 (The Wansan Flow)

    重构了整个数据处理机制,无论是本地文件( Excel, CSV, JSON, Parquet )还是数据库表,现在都遵循一致的高性能“三阶段”流程:

    • 阶段一:资源扫描 (Inspect) —— 极速识别。瞬间列出所有工作表或数据库表名,无需等待数据加载。
    • 阶段二:异步准备 (Prepare) —— 预加载机制。后台流式读取数据并自动标准化(如自动修复 CSV 乱码),在此阶段即可实时查看行数统计和数据预览。
    • 阶段三:最终摄取 (Ingest) —— 秒级入库。利用 DuckDB 原生并行性能,将准备好的数据瞬间摄入本地数据库并建立高性能索引。
    • “购物车”式导入向导:支持文件与数据库表在同一个清单中并发处理,非阻塞操作让您可以边导入边添加更多源。
    • 新增 Parquet 格式支持:支持导入行业标准的 Parquet 文件,通过零拷贝技术实现处理速度的飞跃。

    🌐 官网与文档更新

    • 官网重构:使用 Astro 框架重新构建了官方网站,带来更快的访问速度和更清爽的视觉体验。
    • 帮助手册完善:全面更新了产品使用手册,详细介绍了新版本的功能特性。您可以直接在官网进行查看。

    依然 Beta

    官网: https://studio.wansan.app

    目前还是 Public Beta 阶段,输入激活码解锁全部功能:

    • 激活码: WANSAN-2026

    • macOS: 未签名(苹果税每年 99 刀),首次打开会提示“已损坏”。

      • 解决方法:在终端执行 sudo xattr -r -d com.apple.quarantine /Applications/Wansan\ Studio.app 即可。
    • Windows:不确定杀毒软件是否会误报。

    再次感谢大家的支持!🫡

    目前尚无回复
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1045 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 18:44 · PVG 02:44 · LAX 10:44 · JFK 13:44
    ♥ Do have faith in what you're doing.