<无聊之作:抓取网页截图>--另一种实现。

2013-06-06 09:24:05 +08:00
 RobinFai
google cutycapt 各种帖子
yum 安装 flash player
上传字体

@vibbow 支持flash,外带可以设置延时多少ms XD
木有java有木有。。。
http://robinfai.com/capt.php
4713 次点击
所在节点    分享创造
19 条回复
cute
2013-06-06 09:47:46 +08:00
好玩啊
vibbow
2013-06-06 15:32:27 +08:00
在某些奇葩网站上cutycapt还是会有点小错位
http://vsean.net/pic/di-0M2X.png
http://vsean.net/pic/di-AOCC.png
vibbow
2013-06-06 15:42:21 +08:00
还有你的截不了https的网站...
RobinFai
2013-06-06 18:02:53 +08:00
@vibbow https 搞定,QQ兼容是因为字体的原因

o(︶︿︶)o 无压力。。。
vibbow
2013-06-06 18:23:11 +08:00
@RobinFai 那17173的那个呢?
shidenggui
2013-06-06 19:50:01 +08:00
http://www.ihaveu.com/
无法截取这个网站
vibbow
2013-06-07 03:06:19 +08:00
貌似你的截图服务器挂了...
RobinFai
2013-06-07 08:57:34 +08:00
@vibbow ,真有劲啊,大半夜的。
昨天 linode通知维护。 刚看了下又好了 - -#
另外 17173 什么东西? 游戏咨询站?

@shidenggui
这个..... 真不知道flash还有哪些判断。youku之类的视频网站也是一样,只能加载出播放器,不能播放出内容。
jiawenjun1126
2013-06-07 10:06:16 +08:00
我弄了一个java的
用的是DJNative和swing的组件,有一个问题一直没有搞定,就是组件里面没有提供"网站完全加载完"的事件回调操作. 不是很完美.
RobinFai
2013-06-07 11:09:01 +08:00
@jiawenjun1126 页面加载到一半就截图了?
用的是 Cutycapt 这个都不是自己控制的,有接口控制加载完再等待多少ms的。
不过flash的一些东西依然等待不出来,不太清楚是什么情况。
RobinFai
2013-06-07 16:17:10 +08:00
@vibbow
好吧,我错了。刚才看了下。昨天晚上在尝试看能不能弄出 flash的播放之后的截图来着。
搞到一半,被老婆大人拉去吃饭了。。。。。。
另外, http://www.ihaveu.com/ 这种站不是太大加载不出来,感觉像是 flash有什么机制去触发后面的展示,试过youku tudou 都不能截图到播放中。
whaon
2013-06-09 15:31:54 +08:00
我很好奇LZ是怎么实现的
而且这种展现是基于什么浏览器的,IE?
RobinFai
2013-06-09 16:47:46 +08:00
@whaon
怎么会是IE呢。 地地道道的centos啊。
大致过程是
1.shell脚本模拟x-server,也就是图形界面
2.Cutycapt启动Qt的浏览器组件
3.页面渲染后,Cutycapt截图,保存到命令行。
4.杀死,模拟x-server的脚本。
-------------------------------------------------------------------
以上,除第一步外,均为猜测,无任何佐证。
l0wkey
2013-06-09 16:54:08 +08:00
不知道是不是被我搞崩了,我贴了张图片的地址
RobinFai
2013-06-09 17:03:55 +08:00
@l0wkey 木有崩,我真的没重启啊。
话说刚配好的头两天到时真崩过两次,没查到是为啥。后来linode维护之后就没有了。
l0wkey
2013-06-09 21:43:23 +08:00
KiseXu
2013-06-09 22:38:12 +08:00
厉害,是用的这个么: http://cutycapt.sourceforge.net/
RobinFai
2013-06-14 08:38:41 +08:00
@l0wkey 浏览器应该是Qt封装的webkit内核.兼容问题肯定还是有的.
@KiseXu 是的,就是用的这个.
我也只是提供思路,因为两年前有个业务需求,接触到这个东西.也是因为业务需要,弄到一半就没弄来.
这次到看 @vibbow 同学发的帖子,就来凑凑热闹.
btw,这两天手里的站被CC攻击.折腾了两天
maja
2013-06-14 09:37:30 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/71412

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX