Excel 导出数据,同样的行数、同样的内容,为什么用 datagrip 导出的和我自己写的导出的文件 size 差别那么大

141 天前
 xiaohundun
datagrip 导出 11w 多数据只有 3.8M

我的要 21M
1478 次点击
所在节点    程序员
10 条回复
thinkershare
141 天前
格式问题,datagrip 可能内部去掉了单元格的 style.
thinkershare
141 天前
style 很多时候占用的空间,比数据本身还多,如果没有任何 style, xlsx 文件内部的 xml 这种纯文本压缩后,不会被 txt 大多少,如果实在追求极致的文件大小,cvs 并压缩,应该是是最小的。
thinkershare
141 天前
你可以解压后看看对比一下 2 个文件。
yushiro
141 天前
你自己的文件用代码导出的?查查是 xls 格式还是 xlsx 格式, 这 2 种格式文件大小相差挺大的,数据量大的情况下
undeflife
141 天前
可能你用的写 Excel 库并没有正确处理 sharedStrings.xml ,而是把所有重复内容都复制写到单元格上了
xiaohundun
141 天前
@undeflife 用的 easyexcel ,有推荐的库么
undeflife
141 天前
@xiaohundun 只有 POI 了,虽然代码有些封装理解起来不那么直观,但是功能很完善,而且要写 sst 就要在内存里去重,这个内存消耗是必要的
xuanbg
141 天前
@xiaohundun 阿帕奇的 POI ,我自己封装了一下,需要自取
xiaohundun
141 天前
@xuanbg 在哪呢,怎么取
xuanbg
140 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1001897

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX