requests 的作者的新项目 requests-html

2018-02-28 12:05:36 +08:00
 yangzhezjgs
https://github.com/kennethreitz/requests-html

This library intends to make parsing HTML (e.g. scraping the web) as simple and intuitive as possible.

When using this library you automatically get:

-Full JavaScript support!
-CSS Selectors (a.k.a jQuery-style, thanks to PyQuery).
-XPath Selectors, for the faint at heart.
-Mocked user-agent (like a real web browser).
-Automatic following of redirects.
-Connection – pooling and cookie persistence.
-The Requests experience you know and love, with magical parsing abilities.

对 requests 做了封装,添加了解析 html 的接口,总代码现在是 399 行,还在更新
11352 次点击
所在节点    Python
44 条回复
WildCat
2018-02-28 20:29:37 +08:00
@Ginson 你这个应该也是同样的问题我觉得。。。
换 jupyter lab/notebook 吧,命令行 IPython 还是有点不好用。
jimmyye
2018-02-28 21:26:41 +08:00
版本更新太快,所以用的时候要注意安装的版本和 Github 上的代码 commit 时间。
pdog18
2018-04-16 17:08:44 +08:00
我想问下这个库可以将<script>标签里面的 js 代码快速转换成 python 对象吗?有什么办法吗?正好遇到这个问题。
现在只能换成字符串强行切
windcode
2018-05-27 21:31:45 +08:00
目前已经 700 行代码,7700+ star,有没有人用过,感觉如何?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/433435

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX