求助：大模型如何处理大量工单数据

sentinelK

213 天前

我看楼主的需求场景，真正需要大模型能力的其实就只是“被诉主体和被诉内容要保证一致”，也就是借用于语义分析？
那完全没有必要使用大模型来进行统计。

难道这个工单是非格式化的（比如整个工单是一个文字叙述）？

非精确数据要求一个精确的结果这也不合理啊。

listen2wind

213 天前

我靠，甲方也要我们接入 DeepSeek 然后对工单进行总结。

adgfr32

213 天前

如果大前提是一定要用大模型
不是特别明白为什么要批量请求，每个工单请求一次，做一些分析，分析结果做成结构化的数据保存起来。这样即使工单再多处理完也只是时间问题。不得不使用批量请求的原因是什么呢

Dav1s

213 天前

"prompt": "分析工单，输出 JSON 格式,其中 is_consistent 判断标准：被诉主体和被诉内容是否匹配一致"：
{
"ticket_id": "工单 ID",
"is_consistent": true/false,
"complaint_type": "收费争议/服务质量/虚假宣传/合同违约等"
}

我选择自费 671B......32B 输出感觉想约束其标准化输出有点难

cowcomic

213 天前

先用大模型对每条数据进行结构化或者分类
再在这个基础上用 BI 进行统计，或者封装成指标，前端直接调用

StarUDream

213 天前

上下文设置了多少，每次 120 条工单，还带着上次的结果。

KingCoding

213 天前

@sentinelK 每个工单就是数据库存储的一条用户反馈的问题，还要生成工作建议、总体情况还有敏感诉求和突发事件等，最终生成月报 word

encro

213 天前

多跑几次就可以了，
第一次跑出主要诉讼类别，
然后人工总结类别，
第二次跑让他按照你要求分类。

KingCoding

213 天前

@z1829909 由于算力限制和有其它业务也在调用大模型，不可能每个工单去调用一次，一次喂给大模型 120 条，1 万条左右的数据也需要 80 分钟，而且还是频繁调用大模型，对其他业务造成了影响，对数据做预筛选的原因就是尽可能少的去调用大模型

encro

213 天前

分类后，
然后总结变化，
然后让他根据变化再总结。

sentinelK

213 天前

@KingCoding 如果如此的话，万级 token 的上下文可能都不太够

每 120 条生成的“部分月报”和后面数据，并不是相同精度、相同层级的数据。这会导致误差累积和前后矛盾。而且你的误差累积是指数级别的。

所以我觉得有两条路来优化：

1 、要么像楼上说的，通过提示词建立一个评级标准，然后通过大模型对每条数据逐条分析，相当于对数据进行精简处理。然后最终靠大模型一次请求一万条数据获取结果。（前提是你的 token 数量得够）

2 、根据你 token 的大小限制，搞抽样。

qieqie

213 天前

找一个最小体积的模型比如 qwen 0.6B/ 1.7B ，拿你历史上跑过的数据微调一下

KingCoding

213 天前

@StarUDream 16K

hoythan

213 天前

随机从 1 万条抽 120 条出来总结，剩下的算运气不好。

zhifubao

213 天前

@hoythan 高手

Lambdua

213 天前

其实思路应该向上泛化一层。
将工单转为结构化的数据库表结构。然后针对表数据，使用大模型来进行数据分析和报表生成，这样可以降低幻觉和提高数据的准确性以及效率。

不过细节是魔鬼，我给你的思路肯定是可行的。

adgfr32

213 天前

@KingCoding 用大模型跑数据反而是少量多次更好，相比较模型生成内容的时间，中间的网络消耗可以忽略不计。
影响模型算力的消耗最直接的因素是你上下文的长度，假设你 8k 的上下文能跑 50 并发，16k 上下文可能 20 都没有。之所以你需要等这么久也是因为上下文比较长。
另外我突然想到一件事，你们为啥要自己部署呢，打线上有些 mini 模型跑个 1w 条不要钱一样。

DefoliationM

213 天前

没法，大小就是有限制，建议不要考虑用来干这个。

qbuer

213 天前

数据不能出域么，1w 条也不多呀

YsHaNg

213 天前

你这个是上下文召回率问题 r1-672b 都不怎么样 32b 更别想了 fiction.live/stories/Fiction-liveBench-April-29-2025/oQdzQvKHw8JyXbN87