V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  libook  ›  全部回复第 243 页 / 共 244 页
回复总数  4868
1 ... 235  236  237  238  239  240  241  242  243  244  
2015-12-08 16:11:33 +08:00
回复了 theKingOfTerrors 创建的主题 PHP 请大神们推荐一些关于 php 网络爬虫的书
@theKingOfTerrors 如果用的库并不冷门的话其实是可以在 Stack Overflow 上搜到答案的,没有的话也可以自己在 Stack Overflow 上提问,类似于国内的 CSDN 问答,好多开发者都会在 Stack Overflow 上关注自己参与开发的项目的相关问题的,实在不行,如果所用的库是在 github 上的可以直接提交 issue 提问。
如果你只是快速写一个程序用个一两次的话是没什么问题了,如果把爬虫产品化的话还是学学爬虫领域的尖端技术吧,毕竟爬虫程序对效率要求挺高的。
其实用什么语言都好,因为毕竟现在什么都可以用硬件来堆,就看你看重哪一点了,如果想省钱就用高效的编译型语言,如果想开发简捷就用解释型 OO 语言。

实时的话就不要用 HTTP 协议啦,因为一条消息都要重新三次握手建立一个 TCP 连接超级慢,建议用类 Web Socket 技术。

据说 Meteor (后端 Node ,前端跨平台)可以简单快速地开发出实时同步的应用,之前看人演示过,简直就像黑科技。

直接写入文件和直接写入数据库应该速度差别不大,差别有可能在于读,因为数据库是可以检索的。
如果你用 Linux 服务器的话操作系统是会自动使用空闲内存做高速缓存的( free 命令中的 buff/cache 字段),内存大的话无论是写文件还是普通的硬盘数据库也能像内存数据库一样快速响应(在理论命中率高的情况下),如果数据量大用不起太多内存的话可以用 Redis 一类的内存硬盘两栖数据库,将部分数据放到内存里使用,自动同步到硬盘上。

最后在写逻辑的时候不要忘记要处理同时操作的情况,非原子操作可能会导致死锁或脏数据的产生。。。
2015-12-08 11:27:03 +08:00
回复了 theKingOfTerrors 创建的主题 PHP 请大神们推荐一些关于 php 网络爬虫的书
如果只是想快速开发爬虫的话就用第三方库吧,楼上的大牛们都列出来了;如果你对做爬虫感兴趣的话可以看看那些开源库的源代码,对理解 HTTP 协议和前端技术有很大帮助。最后建议学的时候着重理解思想,因为思想在任何一个语言下都可以用的。另外有一个小窍门,就是如果你想找某一功能的代码或类库直接去 github 上搜索相关关键字就可以了,有的时候会有意外惊喜。
:-p s. 你确定不学学 python ? python 的爬虫技术可是出了名的强大和成熟。
:-p :-p s. 好吧,我本人也不怎么用 python ,我都是用 nodejs 的,只是因为可以直接实例化成 Document Object 像在浏览器里操作那样直接用 js 操作,另外也可以在 node 中直接用 jquery ,处理 DOM 很方便。
2015-12-08 11:15:31 +08:00
回复了 lucky2touch 创建的主题 程序员 大家第一次敲代码的体验是什么?
初中的事了。。。忘记什么感觉了,但貌似一开始就已经进入码农状态了。。。专注和死扣
2015-11-27 17:19:11 +08:00
回复了 loralei 创建的主题 程序员 需要给太多想做后端的应届生泼冷水吗?
题主的用意确实让人觉得温暖,产品、前端、后端、 App 、质量、运维等等角色都是平等的,在优秀的团队中都是同等重要的。
做技术的时间长了,好多人就形成了思维定势,整天都在说前端比后端怎么怎么样、网页比应用怎么怎么样、数据比业务怎么怎么样等等,正所谓好多搞技术的人都有一个通病——觉得同行都是 SB ( PHP 是世界上最好的语言?),实际上不同的人在不同的技术团队使用不同的技术栈在不同的产品上的工作方式是有很大差异的,单纯讨论究竟做前端好还是做后端好还是做其它职位好是没有意义的,需要把好多变量填全,即是: XX 人在 XX 技术团队使用 XX 技术栈在 XX 产品开发上是否更适合做 XX 角色。
对于还未迈入社会或刚迈入社会的人来说,毋需去掂量某一个职业本身有多大价值,重要的是尽可能地了解自己和与自己相关的职业圈,要知道自己究竟适合做什么职业、在什么样的团队做以及做什么产品。
我的导师有一句话影响我颇深:“一个技术人员的优秀与否并不在于他掌握多少语言、框架或工具库,因为那些都是别人的,一个技术人员的优秀与否取决于是否有自己的思想,以及是否能够解决问题。”当然这句话并不是说就可以不去学习别人开发出来的语言、框架和工具库了,这一点可以用我喜欢的另外一句格言来做补充:“找到解决所有问题的方法,如果实在没有,就去创造一个。”
题主引用的博客其实也并不是没有价值,至少说明了服务端工程师在某些团队、使用某些技术栈、做某类产品时的现状,对于应届生来说还是有一定的参考价值的。

个人见解,不喜勿喷。
2015-11-25 12:11:31 +08:00
回复了 isb 创建的主题 程序员 推荐一些你码代码时候的歌或者歌单吧ヽ(●´∀`●)ノ
我收集的一些电影配乐,包含 Hans Zimmer 、 X-ray Dog 等艺术家的佳作,无词,基本都是史诗类的。写代码的时候提神之余还能带来强烈的使命感。

http://music.163.com/#/playlist?id=91119351
2015-08-26 09:41:02 +08:00
回复了 Seymer 创建的主题 锤子手机 如何看待昨晚锤子科技服务器遭遇 DDOS 攻击?
DOS 只会造成服务不可用,采用这种攻击方式通常有三种目的:
1. 为了好玩;
2. 为其他正在进行的破坏活动作掩护;
3. 干扰其他相关业务。

锤子刚刚发布新产品,就遭到攻击,第三种目的的可能性大一些,有可能是竞争对手或者持有不同立场的人所为,通过使对方服务不可用来直接或间接地造成对方的经济损失。

由于没有任何技术成本,通常来说 DOS 攻击是最低端的攻击方式,没有之一,小学生使用 DDOS 来单纯消耗对方的带宽资源,达到服务不可用的效果;高手会利用 DDOS 同时消耗受害者的带宽、 CPU 、内存、硬盘 IO 等资源,将 DOS 攻击的效果最大化。
2015-08-26 09:28:45 +08:00
回复了 cmkpl 创建的主题 PHP 世界最好语言 5.6.x -> 7.0.x 的升级指南
Rest 风格的 API 经过设计从某中程度上可以达到多线程的效果,除非解释器本身效率就很低。。。
2015-05-26 11:30:25 +08:00
回复了 mianju 创建的主题 程序员 大一暑假有必要找公司实习么?
哈哈,去学车是正解。。。此外个人倾向于做一些工作后很少有机会做的事情,比如旅行、公益、学习艺术等等。。。
0.只要是有效的实习都会对你以后的职业发展有很大的作用,即便你以后的工作与实习工作完全不同,你也会发现之前实习积累的经验也是能用得到的。
1.确定(圈定)职业规划,你是想做(至少选择一个)网络工程师还是软件工程师还是系统工程师还是。。。
2.实习是实践学习,所以既要有实践又要有学习,建议选择自己感兴趣又不擅长的领域,比如各种新技术。学习不只是包括技术,还包括职业素养:完成一项工作的科学地流程是什么?如何与人沟通?如何开会?如何安排工作时间?。。。这些都是有学问的。
3.学会保护自己。以任何名义向你收取费用的实习单位都是不靠谱的,真正想用你的单位是不会收你一分钱的。
4.呃。。。实习的时候不能签订劳动合同,通常是签订劳务合同,劳务合同是(天杀的)20%的所得税,你要做好心理准备,除非你们地区有什么政策可以通过办理一些手续减免所得税。
5.要有实习目标,比如掌握某一个领域的宏观状况以及运转机制。这对于你以后的从业方向以及职业生涯规划都有很大作用。
2015-05-26 11:07:59 +08:00
回复了 catface 创建的主题 Linux Web 服务器,抛弃 CentOS 的话,换哪个发行版比较好呢?
稳定性基本上就只有Debian和CentOS最强了吧,之所以稳定就是因为旧。。。Ubuntu个人感觉稳定性还行,软件包也很新,而且PPA机制使得Ubuntu的软件非常多。
论兼容性Arch是王道,有了AUR这个神器几乎能通过包管理器一键安装互联网上的任何软件(包括商业软件),不过虽然没出过什么问题,但总感觉用得软件很新就意味着稳定性差,所以一直用于PC做开发。
@ctexlive @johnsmith123 虽然偏激了一些,但其实也在理;由于背后有强大的商业公司的支持,目前来说商业服务器的话,特别是VPS,CentOS的各方面表现都是很不错的,如果使用的技术稍微有些新的话就用CentOS7吧,要注意的是在系统软件结构和使用习惯上与CentOS6完全不同,好多老技术都被新技术替换了,比如firewall替换iptables、systemd替换initd等等,需要花些功夫重新学习。
2015-05-25 11:07:59 +08:00
回复了 banxi1988 创建的主题 程序员 招了个比较菜的开发,是继续培养还是放弃?
。。。开了吧,不用google不能忍,而且没有学习意识。
2015-05-25 10:42:50 +08:00
回复了 Shino 创建的主题 Linux [求教]centos 下 swap 分区使用率始终为 0
呃,手癌了。。。少一个0,是小于等于100的数字,你设置为100按理说是要尽可能使用swap的。。。要不你试试开chrome、java之类的内存大户消耗物理内存试一下?
2015-05-25 10:37:46 +08:00
回复了 Shino 创建的主题 Linux [求教]centos 下 swap 分区使用率始终为 0
系统可以配置使用swap的偏好,通常是设置一个小于等于10的数字,代表着在物理内存使用到何种程度才开始使用swap。
https://wiki.archlinux.org/index.php/Swap#Swappiness
2015-05-25 10:33:23 +08:00
回复了 scarecrow 创建的主题 信息安全 服务器被黑给我上了一课
呃,请叫他们骇客。。。
建议可以尝试用一些白帽众测平台,可以测出安全问题。
2015-03-22 13:39:08 +08:00
回复了 killerand1983 创建的主题 程序员 我了个去~ 被用户骂惨咯!
@killerand1983 你是想表达什么呢?
2015-03-21 18:34:53 +08:00
回复了 toughtalker 创建的主题 Linux 有人用 surface pro 3 装 linux 使用吗?
Geek精神万岁
不过,为什么????
你买surface pro的时候好多钱是花在操作系统上的,人家费了那么大劲给你做操作系统和硬件的协调,结果你只是想买硬件。。。让我想起了好多买了MAC再装Windows的人。。。
想用linux的话还是Thinkpad吧,个人觉得X11的超级本也很不错~

猜测:不会好用,因为听说M$做surface的时候是硬件和软件互相做了兼容处理的,换言之就是可能不是兼容机。。。
2015-03-21 18:29:33 +08:00
回复了 miki6180 创建的主题 C 寻求具体的方法、关于批量自动登录
哈哈,我当年是使用.NET的webbrowser来写的,相当于是写了一个程序来控制浏览器自动填写表单提交。
Socket编程呗,表示好久没摸C了,还是让大牛来解答吧,不过如果图开发快的话建议用Node.js或Python。
2015-03-21 18:24:33 +08:00
回复了 sallowdish 创建的主题 程序员 Server 端有装防火墙的必要吗?
防火墙不是万能的,不要把防火墙当成自己惰性的挡箭牌,防火墙的基本功能是控制哪些IP的哪些端口可以从哪张网卡的哪些端口访问进来;所谓的防DDOS、防暴力破解等功能都是附加的,只应该在极端情况下才发挥作用。
所以你的问题不是用不用防火墙,而是如何提升系统安全性,习惯为首,大多数骇客都是利用社会工程学来进行入侵的,如果你的习惯不好,攻下你的系统只是时间问题(有可能连时间都不成问题)。

几条拙见:
1.使用软防火墙(iptables/CentOS7 firewall)开白名单,只开放必用的端口。
2.密码使用强密码,不同用户的密码不得一样。登陆使用SSH Key,并为SSH key设置密码。
3.服务不要跑在管理用户上,只给服务用户必需的权限。

另外有一个技巧,如果预算足够的话,建议非公网服务只跑在局域网里,外网访问不到,只给公网服务配置公网IP,但是将所有的公网服务器的SSH端口配置为只允许内网访问,然后专门配置一台最低配的公网服务器作为SSH跳板机,如果想访问任何一台服务器都要先登陆跳板机,然后再使用内网IP(建议配置好hostname)SSH到任意一台服务器上。好处由于没有人知道跳板机的存在,所有服务器又不开放公网SSH端口,所以无处下手;缺点是使用SCP的话就只能先上传到跳板机再从跳板机传到目标主机,不过也可以临时在跳板机上开SSH隧道。
1 ... 235  236  237  238  239  240  241  242  243  244  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   928 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 66ms · UTC 21:17 · PVG 05:17 · LAX 14:17 · JFK 17:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.