大量的文本文件处理用什么语言比较好?

2015 年 1 月 27 日
 lynnworld

主要是从文本中提取信息,转换加工。。数据量挺大的,希望速度快,还要容错性高.

8729 次点击
所在节点    问与答
28 条回复
vulgur
2015 年 1 月 27 日
人生苦短,我用Python
lululau
2015 年 1 月 27 日
最好的文本处理工具是 Perl,没有之一
roricon
2015 年 1 月 27 日
据说是Perl
lingo233
2015 年 1 月 27 日
awk?
acgeo
2015 年 1 月 27 日
C++搞定一切!

C++吸星大法好!!

C++能创造其他语言!!


哈哈哈
princelai
2015 年 1 月 27 日
perl,sed&awk不是专门干这个的嘛
sleeperqp
2015 年 1 月 27 日
sed或者awk把
python也可以~~
em70
2015 年 1 月 27 日
awk效率惊人,可以用来提取,给其他语言进行二次分析
loveuqian
2015 年 1 月 27 日
PHP大军还有30秒到达战场????
lxrmido
2015 年 1 月 27 日
PHP是最好的语言
tini9
2015 年 1 月 27 日
ruby就挺好
czheo
2015 年 1 月 27 日
感觉乱不是语言的问题
lu18887
2015 年 1 月 27 日
楼上的不要把这帖子变成月经贴好么!
tabris17
2015 年 1 月 27 日
大多数支持正则的脚本都没问题,看你熟悉哪个了

资格老点的就是perl了,但是python\ruby\php都没问题
garfeildma
2015 年 1 月 27 日
xml解析可以scala啊,内建xml支持
对ms不反感的话C#也挺好
NeoAtlantis
2015 年 1 月 27 日
xml解析,如果单个文件不算太大的话试试python的beautifulsoup。
Dongdong36
2015 年 1 月 27 日
1L +1
zythum
2015 年 1 月 27 日
字符串处理效率高。无疑awk
aa88kk
2015 年 1 月 27 日
数据量大,xml就别解析了, 太慢。直接正则提取。
invite
2015 年 1 月 27 日
很明显,应该用C。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/165760

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX