如何抓取微信公共帐号发布的文章的阅读数和赞数

2014-10-10 16:11:03 +08:00
 macken
RT 求指教
36736 次点击
所在节点    程序员
107 条回复
withrock
2014-10-10 16:47:32 +08:00
withrock
2014-10-10 16:48:17 +08:00
我也很想知道,而且我还加了这个作者聊天,但是估计是不会开源的,我想我还是再琢磨琢磨吧。
macken
2014-10-10 16:48:55 +08:00
@withrock 这只能看到文章,无法拿到文章的阅读数和赞数
macken
2014-10-10 16:51:32 +08:00
@withrock 抓文章好弄了,可以直接抓搜狗的就好了,传送门弄的时候搜狗还没出微信搜索,估计作者肯定有方法越过验证了
withrock
2014-10-10 16:52:04 +08:00
@alexzhan 我知道你在这里 嘿嘿 传送门的作者
shiny
2014-10-10 16:54:48 +08:00
@macken 有没有试过对微信 app 抓包?
withrock
2014-10-10 17:02:59 +08:00
@macken 除了直接抓搜狗,还有其他方法么?
iyaozhen
2014-10-10 20:07:28 +08:00
阅读数和赞数估计不好拿,内置浏览器打开才看得见。
cheny95
2014-10-10 20:53:12 +08:00
确实是需要内置浏览器才可以看到赞和阅读数.新版的微信就是这样,链接做了改动,每个文章的Key都是随机生成并且又是有时效性的,所以2个办法,1.按键精灵模拟用户点击,一 个文章一个文章点,2.反编译微信安装包,找到关键代码..



抓取了一下,人工访问的,同一个文章每次key都不一样,只能模拟用户点击.安卓的按键精灵吧.


key: 92d93ba1b575468c7ff6c0fd655e1e8eaad445eb195c636072ba1c39f5a57765c635d71eee25c80ab97f81ddb181f2bb
文章标题: 古风歌曲TOP10,听了一定会喜欢!
文章描述: TOP10 断弦古人以弹琴为雅兴,常云:人生得一知己足以。弦则为琴弦,断弦则指琴弦已断,表达心中的悲愤之情。
阅读数量: 58
赞: 没有人赞呢
key: 94a250db12b2a6e1e9177653ea7dcb39eb38ef8d11dda4825596f02dd1eed5705177ffe464e23ff66fe59e681d5407e2
文章标题: 戴上耳机全世界都与我无关
文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱
阅读数量: 47
赞: 1
key: 6b49eeb57a8e66392d7b51c7d5d783463cef9689d177cd84774d84af3acc1e5dc8562458ef565f0c64930f6aa6ceb967
文章标题: 戴上耳机全世界都与我无关
文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱
阅读数量: 48
赞: 1
key: 5f545a9ae2d1a64bff0d2045d1d568efb25395e786cedc767483529410d7aadc0727cb3aee00fc3110f5e39a7fbd8dc8
文章标题: 戴上耳机全世界都与我无关
文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱
阅读数量: 48
赞: 1
cheny95
2014-10-10 20:58:04 +08:00
@shiny 抓包貌似是抓不到的.通过端口监听可以实现.
zhaohai
2014-10-10 23:12:44 +08:00
想知道在吗刷阅读量
zhaohai
2014-10-10 23:12:58 +08:00
想知道怎么刷阅读量
macken
2014-10-11 00:17:20 +08:00
@cheny95 我今天用tcpdump抓了下包,可以抓到数据包,微信除了心跳以外,用的都是短连接,分析了下包,我估计key的值的是通过ssl传递的,每次打开文章前都会有一个ssl的数据通信
macken
2014-10-11 00:19:39 +08:00
@cheny95 你这个监视软件是个什么东东?
macken
2014-10-11 00:20:23 +08:00
@iyaozhen 有了key无需内置浏览器也可以拿到
macken
2014-10-11 00:21:02 +08:00
@withrock 搜狗的数据也没有阅读数据
cheny95
2014-10-11 08:26:19 +08:00
@macken 朋友写的一个小程序,凑合玩...
xmvagrant
2014-10-12 15:11:54 +08:00
@macken key也有可能是客户端和服务器端通过某种相同的规则生成/验证。SSL的通信也可以抓包来看的。
macken
2014-10-13 09:58:42 +08:00
@xmvagrant ssl的包抓了怎么看?看到的都是乱码
aaronleo
2014-10-25 20:34:27 +08:00
我正在做的也是微信文章聚合平台,微口网 - http://www.vccoo.com/

所以以我的经验来回答一下楼主的问题吧。

思路一,利用rss生成工具,将搜狗的微信搜索结果生成一个rss,然后通过rss监控这个公众号的文章是否更新。(理论上应该可行,但没试过)

思路二,自己做一个桌面浏览器,IE内核。用这个浏览器登录web微信,这个微信帐号关注你想抓取的公众号,这样就可以监控到是这些公众号是否已更新,更新后链接是什么,从而达到抓取数据的目的。(使用过,效率不高,但非常稳定)

思路三,通过修改android的微信客户端来实现(这个方法是我们曾经使用过一段时间的)

思路四,想办法越过验证直接取到链接,再通过链接取到数据。

补充一下:阅读数和赞数内置浏览器打开才看得见。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/138062

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX