Qwen MT 翻译尽然有这么严格的敏感信息审查

48 天前
 reaCodes

最近听说 Qwen MT 翻译质量挺不过了,把沉浸式翻译的默认翻译更换成了 Qwen MT ,结果翻译 hacker news 首页标题,经常遇到翻译不出来的情况,报错如下: 400: {"error":{"code":"data_inspection_failed","param":null,"message":"Output data may contain inappropriate content.","type":"data_inspection_failed"},"id":"chatcmpl-09db2a7c-4c66-9962-ba53-0f0100364cea","request_id":"09db2a7c-4c66-9962-ba53-0f0100364cea"}

一查才知道尽然是“数据检查错误,输入或者输出包含疑似敏感内容被绿网拦截。”

4132 次点击
所在节点    程序员
21 条回复
livc
48 天前
哈哈 HN 上有啥敏感的标题吗
liduoduo
48 天前
竟然
twig
48 天前
四行中文字有两个「尽然」。
Solix
47 天前
正常,默认国内所有模型都有审查
jixule
47 天前
"挺不过了","尽然"
skull
47 天前
语文老师也来审查了
iorilu
47 天前
肯定阿, 国内任何模型都要通过严格的审查的
gimp
47 天前
哈哈,好奇 OP 的 “尽然” 是从哪里学来的
czzt1
47 天前
@twig 我还想了半天,听不过了是什么意思
he1293024908
47 天前
@gaobh 这个不只是国产审核吧,gemini2.5pro ,写小说,大纲多点性感之类字眼都可能判定色情拒绝输出。
minami
47 天前
@he1293024908 只谈有无不谈程度不是耍流氓吗
xenme
47 天前
商业化的模型不可能没有审查,所有的,没有之一
minami
47 天前
沉浸式翻译前几天不是说塌房了吗
he1293024908
47 天前
@minami 他这个不是很明显是审查抽风了吗?翻译工具是把网页内容分成很多个小段给翻译模型的,而字越少因为敏感词而触发阻断的概率就越高,我还拿这个模型翻译 AV 字幕呢,他也给我翻译出来了呀,那我难道可以说这个模型他没有审核吗?很明显不是,商用模型有审核是必然的,马斯克的 grok 号称随便搞色情呢,gork4 出来还不是设了一道道坎封锁
minami
47 天前
@he1293024908 #14 别装外宾了,国内模型哪一块审查的最严重你自己懂
he1293024908
47 天前
@minami 是是是,骂国内就对了,反正审核严,所以啥都骂就是了,哪怕这个问题仅仅是抽风原因,但狠狠的鉴证就够了
reaCodes
47 天前
@he1293024908
@minami 这个问题昨晚在我发帖的时候,出现频率很高,现在不出现了。估计是审核抽风了。
twig
47 天前
「不影响意思传达」
—— 影响的。
wwxwlw
47 天前
@he1293024908 #16 他不过说了个审查严重, 你就又是"骂国内"又是"鉴证"的?
he1293024908
46 天前
@wwxwlw “别装外宾了,国内模型哪一块”这不是他说的话吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1151416

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX