首页   注册   登录
 marcushbs 最近的时间轴更新

marcushbs

V2EX 第 148684 号会员,加入于 2015-11-26 04:58:53 +08:00
今日活跃度排名 4545
程序员当制片(野生)
程序员  •  marcushbs  •  180 天前  •  最后回复来自 caoliuxin
36
React Native 诚意不够的三点
  •  1   
    React  •  marcushbs  •  79 天前  •  最后回复来自 mailworks
    3
    ss-ng mac 版会把自己 mount 成目录吗?
    macOS  •  marcushbs  •  2017-09-20 21:54:20 PM  •  最后回复来自 marcushbs
    3
    今天 iPhone 上装新 app 居然要输入验证码
    Apple  •  marcushbs  •  2017-08-21 16:23:51 PM  •  最后回复来自 airmax
    11
    SSD 里操作系统占用的空间写入次数永远不涨?
    SSD  •  marcushbs  •  2016-09-27 18:18:03 PM  •  最后回复来自 vibbow
    14
    Minila Air 在 mbp 上出现连击,但是 windows 就没事
    MacBook Pro  •  marcushbs  •  2015-11-26 11:42:21 AM  •  最后回复来自 marcushbs
    5
    marcushbs 最近回复了
    16 小时 19 分钟前
    回复了 unstop 创建的主题 酷工作 新小科技正在招聘“隐姓埋名的现代魔法师”
    直接揭人伤疤直呼“魔法师”,这样好吗?
    自己拍
    grep -E "https?://[a-zA-Z0-9\.\/_&=@$%?~#-]*" urls.txt > u.txt
    很好,已收藏
    这会儿整一个 xml 的 storyboard 支持出来岂不是要火?
    强人♂锁男
    12 天前
    回复了 sagaxu 创建的主题 Python Python 爬虫改成 go,性能提高 5 倍?
    用过 scrapy/portia/puppeteer,遇到的有效反爬机制有两种:
    1. 封 IP
    2. captcha
    第一个只能用大规模部署的有独立 ip 的爬虫网络来解决,interval 的设置和数据存储 /合并需要有效调度;
    第二个颇为复杂,取决于 captcha 的设计:简单的识图可以通过一些库甚至 ml 来解决(比如 V2EX 的登录认证码ε=ε=ε=┏(゜ロ゜;)┛); 12306 或者 google captcha 那种需要让人点选 9 张里 N 张甚至让人算个微积分的,可以用 headless chrome 的截图机制(甚至 copy/paste DOM 重现),另一头连通到类似 Amazon Mechanical Turk 人肉智能服务上,还要对正确率和审核手段做调整。

    随着爬与反爬的不断斗争,针对 captcha 的工具库会不断增大和复杂,但新反爬模式总可以通过连接人肉服务解决
    ——综上,爬虫主要就是解决 1.分布式调度 2.和人肉服务的对接。至于单点性能,基本不算问题。
    15 天前
    回复了 Continental 创建的主题 酷工作 大陆集团正在招募软件工程师
    海报代码用的不是等线字体,没对齐,肯定不是程序员出的
    @Newbing 说得太对了,看来做过
    @XIAOAcao 我看介绍意思是:音箱听人说“苹果”,音箱说“ A P P L E"几个字母;顶楼里说的听人拼单词判定对不对也支持?
    @XIAOAcao
    ···
    技能使用说明:



    1、直接说出想要查询的单词,中文或英文都可以:苹果、苹果的英语怎么说、苹果怎么拼

    2、没听清可以说:重复一遍
    ···
    这个 stt 模型还是通用的,和听写 letter 不一样
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   716 人在线   最高记录 4019   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 20ms · UTC 21:35 · PVG 05:35 · LAX 13:35 · JFK 16:35
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1