我这种需求应该去学什么

2024-08-30 12:51:44 +08:00
 sg8011
最近碰到一个需求,业务部门想要统计业务系统里的某个业务参数,但是业务系统里面并没有提供这项参数的统计功能,也没办法导出 excel 表来自己统计,只能在点开每个详情一一里面查看。但是这个业务每个月至少有 4000 多件,一件一件点进去的话算,非常费时费力,应该学点什么技术,可以实现提取并汇总每个项目详细信息里的这项数据,然后进行统计呢?
7303 次点击
所在节点    程序员
46 条回复
tool2dx
2024-08-30 12:57:57 +08:00
可以用 sql 统计,业务数据一般都是存在数据库里的。
zsh2517
2024-08-30 13:06:29 +08:00
@tool2dx 普通人应该没权限接触数据库。我建议学一下 js 和油猴脚本(或者一些爬虫相关的知识),从前端把数据扒拉下来
sg8011
2024-08-30 13:11:24 +08:00
@tool2dx 这个业务系统是上头开发的,不可能给你数据库权限
sg8011
2024-08-30 13:12:43 +08:00
目前只是模糊的感觉应该是爬虫方向或 rpa 方向,但我们这个是内部网络,不连互联网的,rpa 我看很多都得联网才能用
Frankcox
2024-08-30 13:50:59 +08:00
python selenium 爬虫
greycell
2024-08-30 14:02:06 +08:00
需要学会怎么给上面提需求。
sagaxu
2024-08-30 14:12:18 +08:00
内网一般不会反爬,抓一下详情页 API ,这点儿数据量也不用调度

简单学点 python, 依葫芦画瓢调 requests 请求数据,然后用 BeautifulSoup 解析,最后输出 csv
sillydaddy
2024-08-30 14:16:15 +08:00
方案 1 ,给老板提预算,招 5 个手下,手工统计。你负责做管理人。

方案 2 ,给老板提预算,5000 块外包解决。你整理几个模板页面,花 2000 块找个外包开发抓取功能是,自己挣 3000 块的辛苦费。

方案 3 ,给老板提预算,自己需要 1 个月的时间来学习爬虫。这段时间好好学点技术。
sillydaddy
2024-08-30 14:17:53 +08:00
让老板肉疼,他就会去找上面做业务的,用一个 SQL 语句解决这个问题。
fanersai
2024-08-30 14:22:02 +08:00
感觉是你们信息科的这个项目没有给尾款/维保费用克扣,甚至验收的时候数据库并没有给信息科的工程师开放,兼职愚蠢!
Ranhao
2024-08-30 14:29:07 +08:00
如果你不是开发相关,#9 说得好
9pr7im4IjQ9u0806
2024-08-30 14:36:00 +08:00
爬虫麻烦了,让 chatgpt 给你写一个脚本,脚本要求如下:
通过业务列表接口获取所有所有业务 id ,至于接口是啥,自己 f12 在列表页扒一下,
然后遍历这个接口返回的数据集合,取出里边的 id 字段,接着把这个 id 拼装到业务详情接口,至于接口是啥,自己 f12 在详情页面拔,一般详情页面的地址栏就能看到,这样能拿到业务详情数据,把接口返回的数据的 key 作为表头,value 作为一行内容,输出到一个 excle 中。
这样你就能得到一个汇总了所有详情数据的表格。
9pr7im4IjQ9u0806
2024-08-30 14:38:11 +08:00
当然接口是需要登录的,你需要 f12 把你们系统的登录凭证复制一下,使用 python 添加到请求头里,告诉 chatgpt 就行了
zhangkai1024
2024-08-30 14:40:55 +08:00
使用 postman 一次性请求所有数据,pageSize=4000
将 response 中 data 的不分贴给 chatGPT 生成表格
sg8011
2024-08-30 15:03:58 +08:00
统一回复楼上各位,这系统不是我们开发的,是上面的总公司找软件商开发的,我们只是用而已。什么 SQL 数据库提需求的啥的就不要想了,提预算也不可能给你。就是得自己解决
RandomJoke
2024-08-30 15:08:32 +08:00
爬虫方向没问题,而且也没多复杂,上面说的那些用请求的,前提都是前后端分离的
min
2024-08-30 15:09:18 +08:00
rpa 加 excel (或者统计分析软件)
hackhu2019
2024-08-30 15:28:55 +08:00
可以看看 rpa 工具,比如「影刀」,图形化配置,然后抓数据下来操作
leejinhong
2024-08-30 16:46:12 +08:00
合理利用 chatgpt ,把你的需求结合你们业务系统的网页结构直接描述给 chatgpt 生成脚本去执行。至于什么脚本语言都是可以的,看哪种比较容易看得懂,比如 js 、php 什么的。
sg8011
2024-08-30 17:28:52 +08:00
如果要通过爬虫解决,现在什么爬虫框架比较好,python 和 go 语言都会一点
还是要学习 selenium puppeteer 之类的工具?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1069010

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX