谁有空闲时间,付费找人写个小偷程序

2022-06-21 14:01:58 +08:00
 tangknox1
小预算,穷屌丝一个,嫌弃钱少的也别骂我。

通过 https://www.qwant.com/?locale=zh_CN&q=%E7%BA%A2%E7%83%A7%E8%82%89%E6%80%8E%E4%B9%88%E5%81%9A%E5%A5%BD%E5%90%83&t=web

抓数据回来,用新的规则清晰数据,然后用自己的模板风格加载生成缓存文件后输出。

没啥负责的技术含量,估计整个程序就 2 到 3 个文件。

github 上貌似有 qwant 的 API 接口,不过看了下 检索页面的右键源代码,也有 json 数据输出。

我小白,也不懂啥技术,估计是 curl 取数据,正则啥的过滤和清洗,最后组合下数据生成缓存页面,前台输出。

能做的给我发个邮件联系,邮件实时能收到并回复你。

联系邮件:

tangknox # gmail.com
是 gmail 的邮箱
发的时候把 # 号 和前后空格删掉,# 改成 @

最后来个长期有空余时间接活的,都是一些小需求开发较多。
5713 次点击
所在节点    PHP
48 条回复
xwayway
2022-06-21 14:11:43 +08:00
[估计没啥技术含量] 这个话说得我好怕……这是搜索引擎的数据,拿回来还要清洗后再吐出去,清洗规则估计要做成,我想怎么配置就怎么配置。然后还要自己的模板风格,有 ui 设计了吗?估计也是坑,等人跳。整个程序就 2-3 个文件,,,我也觉得百度谷歌挺简单的,就一个搜索框页面,一个搜索结果展示页面。 坐等有缘人入坑
lshero
2022-06-21 14:15:34 +08:00
突破搜索引擎的反爬虫就是技术含量啊
本站对各种 SEO 优化的内容农场的态度还是比较负面的
omL72EEc
2022-06-21 14:18:14 +08:00
”我的想法挺简单的,做个淘宝京东之类的就行了“
tangknox1
2022-06-21 14:20:16 +08:00
@xwayway UI 风格不做都可以,就简单的 html 弄下输出数据,我自己改就行了。就一个小偷程序,我都说了没大预算,但是不等于说是几百块钱就打法了,我说成,您也不愿意对吧,所以最终价格还是要谈。至于需求,谈了你给个报价也行啊。有没有逼迫谁。哪里来的坑,如果谈好了需求和价格,完全可以去开源中国我先支付托管资金,或者先打钱给你定金也行啊。
tangknox1
2022-06-21 14:21:14 +08:00
@lshero 你先去 github 上搜下这个国外的搜索引擎吧,官网本身就有对外的 API 接口。免费。顶多加个在线代理功能罢了,
lower
2022-06-21 14:24:41 +08:00
这网站是干啥的啊?我挂着台湾代理,还不让我访问……
tangknox1
2022-06-21 14:26:40 +08:00
@omL72EEc curl 取个数据回来,很高深的技术吗?至于让你上升到 做个淘宝京东?搞得好像全球就您会或者就您懂编程一样,别人都不懂,你想把简单的说多高深都成对吧。。再说了,我也没说是对技术人员或者人为 PHP 廉价,也没不尊重吧,我自己技术不行小白一个,但是也不至于一点不懂吧,何况生意都是需要谈的,你觉得没我说的那么复杂,那你给个报价,我觉得预算能满足你的报价那就找你做对吧。。没必要阴阳怪气说这些。谁跟钱有仇啊
qwertyzzz
2022-06-21 14:27:42 +08:00
不是还有分页吗
tangknox1
2022-06-21 14:28:49 +08:00
@qwertyzzz 不需要分页数据,只需要抓第一页那 10 条,还有右侧那个相关文章的就行了。
janus77
2022-06-21 14:37:20 +08:00
直接说你最终想做个什么产品出来,不要用不专业的术语强行解释流程。
自己的风格是什么?需要设计吗?是否好看和成本挂钩
新的规则是谁给?我给的话随便给你能接受吗?有标准吗?标准和钱挂钩
输出是怎么输出?网页? app ?小程序?公众号? api ?还是直接给数据库文件?需要后台吗?需要开发者账号吗?这些都和钱挂钩
dwlovelife
2022-06-21 14:44:03 +08:00
·······你这个不是只抓那个红烧肉的搜索页吧 什么条件搜索页都得抓吧 咱姑且都抓第一页 就这一步 抓取数据的这一步就不是一件小工作
lshero
2022-06-21 14:44:35 +08:00
@tangknox1 大部分项目说的 API 都是 Unofficial API ,开放 API 和有风控并不冲突。加代理是不是得必须是原生 IP ,机房的 IP 行不行?采集前是否需要增加代理可用性检测和代理池更换代理的需求?这些做爬虫的前置条件不解决清除肯定没人愿意直接接单的。
tangknox1
2022-06-21 14:49:52 +08:00
@janus77 哥,不需要 UI ,最基础的 HTML 能输出数据就行,做好了我自己改风格样式就行了,就用 PHP 写个网页,txt 存储关键词,然后 curl 去这个搜索引擎网站抓检索结果第一页的数据回来,用正则规则清洗组合后前台输出就行了。不过你看下我贴里发的那个 URL ,邮件查看源代码,有 json 数据输出

比如,www.v2ex.com/?s=关键词
预算我可以适当放大,不过最终看你给的价格合适不合适
tangknox1
2022-06-21 14:50:43 +08:00
@lshero 还是你说的话中肯,我爱听。
qwertyzzz
2022-06-21 14:54:42 +08:00
@tangknox1 想试试 但是不知道代理咋弄
lshero
2022-06-21 14:59:13 +08:00
@qwertyzzz 原生代理有卖的价格比较贵基本都是按照流量收费的。

楼主的需求其实就是写个定时任务挂着代理把
https://api.qwant.com/v3/search/web?locale=zh_CN&q=需要搜索的内容&count=10&offset=0&device=desktop&safesearch=1

扒拉下来,然后选取一下合适的 Json 内容,写入他的 CMS 数据库生成静态页,然后搜索引擎里又会多一些大家感觉莫名其妙的网站了。
ppx199
2022-06-21 14:59:44 +08:00
自己先把需求理好吧,干多少活,拿多少钱。
再简单的活,工作量大也得加钱,活多钱少,傻子才干。
qwertyzzz
2022-06-21 15:09:57 +08:00
@lshero 还有 api 这!
Cbdy
2022-06-21 15:10:56 +08:00
一股坑爹的气息
oploverliu2012
2022-06-21 15:13:04 +08:00
看着好像不难,就是需求太不明确了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/861105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX