为什么在本地运行 SQL 而不是上传到云端 BI 工具?
每天,数据分析师和开发人员都会收到来自生产系统的大量 CSV 导出、服务器日志或 JSON 转储。这些文件通常包含客户 PII、财务数据、IP 地址和内部系统指标,这些数据受到 GDPR、SOC 2 和内部安全政策的严格管控。
传统的工作流程迫使人们做出痛苦的选择:要么配置本地 PostgreSQL 实例(需要 CLI 技能和磁盘空间),要么将数据上传到云端 BI 工具(这过程中又违反了数据治理政策)。Excel 在处理超过 100 万行数据时会崩溃。Google Sheets 在处理 1000 万个单元格时会罢工。
DuckDB-WASM 如何改变游戏规则
- 完整 SQL 引擎: DuckDB 支持 SELECT, JOIN, GROUP BY, 窗口函数, CTE 和聚合:满足数据分析的一切所需。
- 列式存储: 与行式数据库不同,DuckDB 使用针对分析查询优化的列式存储。聚合 1000 万行数据仅需几毫秒。
- 零基础设施: 无需安装数据库,无需 Docker 容器,无需连接字符串。只需拖入文件即可查询。
常见问题 (FAQ)
我的 CSV 文件会被上传到服务器吗?
不会。DuckDB-WASM 完全在您的浏览器中运行。您的数据在本地内存中处理,永远不会离开您的设备。
它可以处理多大的文件?
根据您的浏览器和可用内存,DuckDB-WASM 可以处理高达约 1-4 GB 的文件。工具本身没有设置人为的大小限制。
它使用哪种 SQL 方言?
DuckDB 使用与 PostgreSQL 兼容的 SQL 方言,并具有额外的分析扩展,如 QUALIFY、PIVOT 和窗口函数。
