为啥 Python 爬虫这么火,相比 Java 爬虫有啥优势?

2020-06-28 21:53:07 +08:00
 gejun123456

java jsoup,多线程也方便,python 有哪些 java 爬虫没有的优势?

7930 次点击
所在节点    Python
47 条回复
namelosw
2020-06-29 11:11:23 +08:00
爬虫这种东西需要反复调试,BS4 在 Console 里直接写,可以直接 body.div.h2.a.text,Java 写不难受嘛……

而且爬虫这种一天一改的,Java 搞出来还给对方建模?不建模跟动态类型有什么区别?

聊性能的不知道爬虫主要是 IO ?

@wysnylc Py 现在可以加类型了
wysnylc
2020-06-29 11:16:45 +08:00
@namelosw #21 任何一个要长久发展的项目都需要多人协作和更新维护,就 py 这技术氛围有几个能考虑后面事写的几乎都是"一次性"无法更新无法协作的代码
还是那个老话,py 这类动态语言没有约束开发氛围散漫根本不适合大型项目只能做点胶水工作
securityCoding
2020-06-29 11:19:17 +08:00
短平快
XanderChen
2020-06-29 13:04:23 +08:00
一直认为 java 要装 jdk 来着?

是不是要装,要装的话我选 python 。(手动狗头
Rwing
2020-06-29 13:06:50 +08:00
我用 C# 写爬虫 ┑( ̄Д  ̄)┍
AlisaDestiny
2020-06-29 13:26:09 +08:00
就凭 Python 可以开个交互式环境,写一点调试一点看下输出,Java 稍微改一点就要重新编译执行太累。
zh584728
2020-06-29 13:41:37 +08:00
我觉得爬虫就是营销号为了卖课而带火的
geekeroro
2020-06-29 15:56:46 +08:00
优势就是方便……这么多现成的东西
chniccs
2020-06-29 16:04:49 +08:00
写起来快,改起来快,调试更快。运行快不快,大部分需求中倒是其次的
qsbaq
2020-06-29 16:27:00 +08:00
开发快+1
sidegem
2020-06-29 16:28:57 +08:00
简单
optional
2020-06-29 16:30:49 +08:00
python 爬虫已经过去了, 现在用 js 写爬虫不香吗
维护,typescript 了解一下。
optional
2020-06-29 16:31:51 +08:00
@wysnylc 动态类型不好维护? 我觉得 typescript 的维护性比 java 还高,java 经常改个类型改好几个文件(我是 java 开发)。
xuqiccr
2020-06-29 16:35:34 +08:00
@limuyan44 每次看到老哥头像都感觉在督促我减肥
wuwukai007
2020-06-29 16:46:51 +08:00
并不是 python 适合爬虫,是快速开发的场景( xxx )适合 python
silkriver
2020-06-29 16:52:00 +08:00
经常需要调参数和展示数据的场合,Jupyter Notebook 是神器
cweijan
2020-06-29 16:54:52 +08:00
@optional 其实是 py 不好维护, 编译没问题, 一运行就各种报错, js 相对来说稳定点, 不过用 js 类库显然是比不过 Java 的.
murmur
2020-06-29 16:55:32 +08:00
语法简单,其实现在都是用 headless
optional
2020-06-29 16:57:16 +08:00
@cweijan 就爬虫而言,js 比不过 java ?不存在的。
用 js 写,http request 不说了,html 解析各种 selector,headless chrome api 无缝兼容, 浏览器插件都可以直接写。
drackzy
2020-06-29 16:58:54 +08:00
python 爬的快,进监狱也快。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/685438

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX