使用 pandas 合并多个 txt 文件里的字段的方法

2019-09-12 00:26:18 +08:00

kayseen

比如我有三个 txt 文件,
a.txt 和 b.txt 和 c.txt

其内容字段一致,内容如下:
time,tmp,water,light
2019-09-03 03:23:09,28,28,8
2019-09-03 03:23:10,29,29,9
2019-09-03 03:23:11,30,30,10
2019-09-03 03:23:12,31,31,11
2019-09-03 03:23:13,32,32,12

我现在需要合并这三个文件的数据到一起,也就是把 b.txt 和 c.txt 的文件追加到 a.txt 中去, 请教问题如下:

1.怎么样把三个文件的内容合并成一个新文件呢?
2.如果前端需要的是我合并这三个文件之后的内容,我还需要先合并数据成一个文件,然后再读数据返回给前端吗?
还是直接可以把合并之后的数据不保存直接返回给前端?

5174 次点击

所在节点

Python

24 条回复

XuanFei990

2019-09-12 11:52:41 +08:00

windows cmd

copy a.txt + b.txt + c.txt temp.txt

bantao

2019-09-12 17:12:06 +08:00

@idcspy 这个需求可以用 pandas join 完然后比较排名上升还是下降几位喽

abucus

2019-09-12 22:46:23 +08:00

楼主，在合并 txt 这个方面，用 pandas concat 并不会比 python open 更快，当然在小文件的时候这个差别其实看不大出来，文件越大差距越明显，pandas 的优势主要还是数据分析。

用 open 顺序打开读取（跳过后面文件的 header ）就可以了。

如果要把合并的结果返回给前端，不需要真正生成一个合并的文件，直接把 output 写到输出流就好，
一个相近的例子参看 https://flask.palletsprojects.com/en/1.1.x/patterns/streaming/

如果文件很大，再加一层 zip 比较好。

shm7

2019-09-13 09:16:22 +08:00

你们这些讲复制 shell io 的，人家能不懂，人家分明是几百 GB 的大文件要用分批读写，还要考虑重复过滤的好不好。人家说 1+1 的计算要用超算，很显然这 1+1 比较特殊啊

第 2 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/600216

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.