问:多个 Excel 文件共百万条姓名手机号如何快速去重合并成一个文件?

2020-08-05 10:58:02 +08:00
 tmkook
2500 次点击
所在节点    问与答
24 条回复
Asshasahole
2020-08-05 11:17:52 +08:00
招几个人, 每个人划分号段区间, 挨个复制号段内的手机号, 粘贴到新的 Excel 里, 粘贴前搜索一下排重.
最后几个人的 Excel 复制+粘贴合并就行啦, 注意新的 Excel 要同一个格式噢.

Excel 的函数应该可以做到文件内去重吧?
runking
2020-08-05 11:19:35 +08:00
可以帮你解决,有偿
yvshen
2020-08-05 11:21:29 +08:00
编程解决吧,用 java 、python 写个脚本
tmkook
2020-08-05 11:24:23 +08:00
@runking 我会编程,就是想看看坛子里大神们是否有不用编程的快捷方法,或是否有轮子可用
Pho3nix
2020-08-05 11:25:07 +08:00
pandas
LiYanHong
2020-08-05 11:28:24 +08:00
先合并成一个文件,用 excel 里自带的去重功能试试
iamwho
2020-08-05 11:32:32 +08:00
“我要用记事本开始记事了!”
dexterzzz
2020-08-05 11:36:24 +08:00
power bi,power query 合并文件
renmu123
2020-08-05 12:35:36 +08:00
用 pandas 太简单,预计十几行解决
xyd1205148795
2020-08-05 12:48:25 +08:00
如果格式一样,直接放一个文件夹里,然后用 excel 从文件夹查询加载就好了,不过 excel 加载的行数有限制,好像一百多万行
Croxx
2020-08-05 12:50:39 +08:00
x 产?
Vegetable
2020-08-05 12:52:58 +08:00
@LiYanHong #6 这样一般电脑都受不了...
tmkook
2020-08-05 13:37:08 +08:00
@Croxx 不是 H 产,绝对是正向的!!!
qiayue
2020-08-05 13:39:26 +08:00
转成 csv,用程序处理
tmkook
2020-08-05 13:39:43 +08:00
@LiYanHong
@Vegetable
@xyd1205148795 本来想用 VBA 搞,但是百万级数据还没试过估计会卡死。目前想法是先导入 Mysql 然后再写代码查询去重。
liprais
2020-08-05 13:41:46 +08:00
pandas.read_excel 完事
cmllwxxl
2020-08-05 13:42:10 +08:00
Snapde 用这个简单
admin7785
2020-08-05 13:44:25 +08:00
@tmkook #15 百万条数据,字段不多的话( excel 文件不是很大的话),倒入数据库还是可以的,我 60 多兆,倒入半个小时左右
opengps
2020-08-05 13:45:06 +08:00
导入数据库,几行 sql 搞定,不超过 10 分钟
ccoming
2020-08-05 13:48:35 +08:00
@dexterzzz +1 。power query 好了,16 版本里面就有这组件。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/695757

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX