怎么实现对翻译引擎的术语库进行自定义

2022-11-05 21:28:30 +08:00
 wgit
场景:
对翻译引擎给出的翻译答案不满意
但有大量的翻译需求,不得不使用免费的 api

需求:
想某些单词使用预设的解释 或某些单词选择不翻译

当前的想法:
为了一劳永逸,客户端通过 host 指向代理服务器
后端服务器对数据进行正则标记,然后发送给 api 服务器
得到的结果再正则进行内容替换,返回给客户端最终结果
(见下方的图 1 )

遇到的困难:
希望支持高并发
后端只会一些 python ,需要每秒接受大概至少 10 个请求,并对这些内容进行处理
api 服务器有速率限制,太快会返回无效内容,要对请求分发到多个 api
术语库少的话应该不难,如果术语定义了比如上千条或更多,可能会遇到各种瓶颈


时间上还有几个月,希望能完成这个项目
希望得到一些的建议或指点





图一




图二
1099 次点击
所在节点    程序员
5 条回复
l0o0
2022-11-05 21:44:30 +08:00
小牛翻译是支持自定义词汇的,我试过,自定义效果可以
wgit
2022-11-05 21:48:42 +08:00
@l0o0 #1 好像挺贵的,我是个人使用经济能力有限....
每个月需要翻译大概几千万字符
bigtear
2022-11-05 22:09:59 +08:00
刚好看到在用的这个翻译插件支持自定义翻译源,你可以看看
https://github.com/chunibyocola/sc-translator-crx/discussions/50
bigtear
2022-11-05 22:22:20 +08:00
@bigtear 对了,这个翻译插件还支持自定义词汇,正则替换词汇,应该能满足你的需求。
https://github.com/chunibyocola/sc-translator-crx
wgit
2022-11-05 22:40:40 +08:00
@bigtear #2#3 非常感谢,我去研究研究

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/892979

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX