问:多个 Excel 文件共百万条姓名手机号如何快速去重合并成一个文件?

2020 年 8 月 5 日
 tmkook
3199 次点击
所在节点    问与答
24 条回复
Asshasahole
2020 年 8 月 5 日
招几个人, 每个人划分号段区间, 挨个复制号段内的手机号, 粘贴到新的 Excel 里, 粘贴前搜索一下排重.
最后几个人的 Excel 复制+粘贴合并就行啦, 注意新的 Excel 要同一个格式噢.

Excel 的函数应该可以做到文件内去重吧?
runking
2020 年 8 月 5 日
可以帮你解决,有偿
yvshen
2020 年 8 月 5 日
编程解决吧,用 java 、python 写个脚本
tmkook
2020 年 8 月 5 日
@runking 我会编程,就是想看看坛子里大神们是否有不用编程的快捷方法,或是否有轮子可用
Pho3nix
2020 年 8 月 5 日
pandas
LiYanHong
2020 年 8 月 5 日
先合并成一个文件,用 excel 里自带的去重功能试试
iamwho
2020 年 8 月 5 日
“我要用记事本开始记事了!”
dexterzzz
2020 年 8 月 5 日
power bi,power query 合并文件
renmu123
2020 年 8 月 5 日
用 pandas 太简单,预计十几行解决
xyd1205148795
2020 年 8 月 5 日
如果格式一样,直接放一个文件夹里,然后用 excel 从文件夹查询加载就好了,不过 excel 加载的行数有限制,好像一百多万行
Croxx
2020 年 8 月 5 日
x 产?
Vegetable
2020 年 8 月 5 日
@LiYanHong #6 这样一般电脑都受不了...
tmkook
2020 年 8 月 5 日
@Croxx 不是 H 产,绝对是正向的!!!
qiayue
2020 年 8 月 5 日
转成 csv,用程序处理
tmkook
2020 年 8 月 5 日
@LiYanHong
@Vegetable
@xyd1205148795 本来想用 VBA 搞,但是百万级数据还没试过估计会卡死。目前想法是先导入 Mysql 然后再写代码查询去重。
F281M6Dh8DXpD1g2
2020 年 8 月 5 日
pandas.read_excel 完事
cmllwxxl
2020 年 8 月 5 日
Snapde 用这个简单
admin7785
2020 年 8 月 5 日
@tmkook #15 百万条数据,字段不多的话( excel 文件不是很大的话),倒入数据库还是可以的,我 60 多兆,倒入半个小时左右
opengps
2020 年 8 月 5 日
导入数据库,几行 sql 搞定,不超过 10 分钟
ccoming
2020 年 8 月 5 日
@dexterzzz +1 。power query 好了,16 版本里面就有这组件。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/695757

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX