批量处理 MIS 系统记录,想问问用什么实现比较好

2022-10-26 15:15:25 +08:00
 shijingshijing

某个图书馆的古籍管理系统里面有几十万条扫描图片记录,每条记录有 ID ,名称,年代,类型,存储路径,日期等字段,整体是个用 ASP.Net 实现的 Web MIS 系统。现在需要把所有的记录遍历一遍,下载图片,然后执行一个机器学习的 flaw_detect.py 脚本,对其进行某种检测,生成一个 result.txt 的检测结果,然后回传到这个 MIS 系统里面的结果字段。

任务很简单,而且 MIS 系统有 REST API ,我自己用 Requests 撸了 python 脚本在跑,现在发现有几个问题:

1 ,flaw_detect.py 是以前学生做的,不太稳定。有可能在运行的时候会挂,有时候跑完了又不生成 result.txt ,我也不想动这个脚本,目前用了个 try-except 应付着。想问问有没有更优雅的处理方式。
2 ,现在的运行记录我只是简单的打了个 log 来保存,后面考虑还是弄个比较详细的报告,看了下 allure 好像还可以,不知道还有没有其他推荐的。
3 ,整个系统能用 Jenkins 直接替换么?总感觉手撸 Python 脚本实现有点挫,来个工具更稳定,放心点(也可能是我 Python 写的比较菜)

在网上看了一圈爬虫和 python 测试相关的东西,感觉还是测试这边框架和工具丰富一些,所以想问问还有什么比较好的方案帮我推荐一下?

425 次点击
所在节点    程序员
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/890048

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX