一般来说, Python 和 excel 哪个处理数据更快?

2019-02-23 01:16:58 +08:00
 yellowtail
19409 次点击
所在节点    Python
32 条回复
zea
2019-02-23 18:12:34 +08:00
为嘛不用 matlab/octave
Ginson
2019-02-23 18:21:59 +08:00
Excel 处理几十万级的 vlookup 就慢得不行了,所以我专门整了个 Python 脚本来处理类 vlookup 问题
youthfire
2019-02-23 20:03:10 +08:00
@Ginson vlookup 不仅是慢,而且是功能有限,考虑到扩展性和速度性我也是用 pandas 取代了
anguiao
2019-02-23 20:08:35 +08:00
我记得微软以前好像说过打算在 Excel 里面添加 Python,不知道后来为什么鸽了。
JCZ2MkKb5S8ZX9pq
2019-02-23 21:06:50 +08:00
小东西用 excel 比较便利,可以利用 excel 作为数据输入的 GUI。
给客户演示及导出,大多数情况下也是 excel 比较便利。
但如果复杂查询,关联,Excel 里数组公式套多一点,明显就不大行了,还是要上数据库。
Excel 有概率崩,py/pandas/数据库更稳妥点。
snw
2019-02-24 13:55:10 +08:00
@anguiao
往 Excel 里添加 Python 只是用户提的愿望,然而微软已经大笔投资了 javascript/typescript,所以估计官方不会提供 Python 支持。

MS Office 已经提供了 javascript api
https://docs.microsoft.com/en-us/office/dev/add-ins/reference/javascript-api-for-office

预览版已经支持 javascript 自定义公式和插件(虽然第一时间就被用于挖矿了 233 )
https://docs.microsoft.com/en-us/office/dev/add-ins/excel/custom-functions-overview
snw
2019-02-24 14:05:19 +08:00
@lithiumii
对于没有格式的数据,Excel 半分钟足够打开十几万行×二三十列的数据。
Excel 慢的最主要原因是单元格格式太多,其他原因比如使用旧格式(.xlsx 和.xlsb 格式体积和读写速度都比.xls 好得多),用了太多插件,VBA 大量操作单元格时没暂停刷新,咖喱味的代码等等。
hunter2015
2019-02-24 15:42:19 +08:00
当然是 excel 了,这还用问
xpresslink
2019-02-25 12:58:26 +08:00
楼主详细定义一下“处理”二字的内涵和外延不然真心没法回答。
yellowtail
2019-02-26 14:52:12 +08:00
@xpresslink 就是最简单的处理吧,计算关系得到结果
xpresslink
2019-02-26 18:16:07 +08:00
@yellowtail 你说的等于没说。
其实这两个东西没有什么可比性,就跟比较跑车和高铁拉客哪个更好一样。
EXCEL 的强大在于可视化的操纵小量数据做简单处理的便捷性。几十万条以上数据基本上就没有可用性了。
python 的强大在于撸个尝试性的代码可用的库多简洁省事儿,再复杂的逻辑再大的数据量也不是问题。
yellowtail
2019-02-26 18:27:23 +08:00
@xpresslink 哎 我说的就是计算。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/537834

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX