开发了这样一个翻译 app,大家会用吗?

1 天前
 wbh

最近借助 AI 实现了这样一个翻译 App (名字还没想好)。

开发这个 App 的出发点是这样的。最近在看一本关于 PyTorch 的英文电子书,虽然也能看懂英文,但是效率肯定没有读母语来得高。同时书中的有些内容还不够理解,需要进一步提问澄清。所以我想把翻译和提问合在一起完成。简单找了下市面上的相关工具,发现没有特别称手的。有些 PDF 阅读器虽然能够翻译,但是要么收费,要么无法追问。另外就是这些阅读器的模型和提示词都是固定的,没法自定义(比如我想让用语接近中文习惯,减少机翻感)。

所以就有了自己开发的想法(这也是 AI 时代的好处吧,只要有想法和 token ,就可以自己实现)

使用上,你可以正常的输入文本让它翻译,但更好的方式直接把书中的某一页或多页直接截图贴给它。它会自动把图片拼接,同时识别文中的文字,代码,表格甚至插图,然后把翻译后的文字与这些内容重新组合在一起,形成一个排版好的 markdown 的文档,然后渲染出来。

另外上面说了,App 的定位是辅助阅读,除了翻译以外,你还可以就翻译中的内容直接提问。比如一开始我是用它来学习 PyTorch ,对于书中不理解的地方就直接问它。如果你在别的地方提问,需要把上下文搬过去,但这里由于本来就有上下文,所以 AI 会更好的理解你的问题。

后来我发现这个 App 对另外我之前看过的一本书——《 The Photographer's Eye 》(摄影师之眼)也很有用。这本书的排版上不太寻常,它的一页很宽,在显示器上看着很累。使用这个 App 翻译+重排以后,可看度提升了很多。当然,提问也是很重要的,原书文字有些晦涩,翻译+提问后理解更加准确了。

如果大家也觉得有用,我就把它再做进一步的 polish ,发布出来。

或者大家还有什么建议都可以说说。

1010 次点击
所在节点    分享创造
7 条回复
niboy
1 天前
我应该是用不着
1. 如果是 pdf 或网页,直接用沉浸式翻译就行了,不用自己截图发送啊
2. 如果说要理解内容,文档扔给 IMA ,在 IMA 直接问,或者 cursor 之类的截图问就行
wbh
1 天前
@niboy 是的,通过工具组合肯定也是能实现目的的。

不过我这里是想实现一站式的效果,我想了想,本质上我对它的定位应该是属于阅读辅助,不完全是简单的翻译。我的想法是,一本书你看到哪里,就截几张图丢进去,让它翻译和排版,方便你阅读和理解。然后有问题就提问,之于翻译结果你保不保留,都随你自己。最重要的是你吸收和理解了你所阅读的内容。
SuperDaniel313
1 天前
最近在用 NotebookLM 读一些大部头,有些没译本,摸索出来的方法就要么丢给豆包/IMA 来汉化,同时一份副本塞到 NLM 里,然后边读边问。或者把原文处理成 HTML ,直接用浏览器插件翻译,选择 LLM 的自由度更高。同样也是配合 NLM 来学习。

综合下来看,LLM 除了编码相关的实践,目前对我来说用处更大的是辅导学习。毫不夸张地说,NLM 堪比 7x24 小时的全领域专家实时解答。

NLM 背靠 Gemini 多模态,图表、公式、图片,全都能语义化理解,在这个领域还没看到其他能打的出来。
SayHelloHi
1 天前
如果是翻译 PDF 的话 可以看看 UPDF 这个软件

非常棒
wbh
1 天前
@SuperDaniel313 NLM 还没用过,我去了解一下
wbh
1 天前
@SayHelloHi UPDF 确实不错,之前也是经常用。不过还是 you 我提到的两个问题,一是模型和提示词不能自定义,不能调整翻译风格,有些书籍的文字完全直译的话不容易理解;二就是不能直接提问,如果要问问题,你得换别的 LLM 工具,有时还得把书中的内容复制过去作为上下文,比较麻烦
SuperDaniel313
1 天前
@wbh #5 看了一下你的场景,和我的差不多,只需要解决翻译方面的问题即可。

和 AI 的交互丢给 NLM 是当前优解。NLM 还可以多文档塞到一个笔记本里,能实现跨领域问答,回答都是基于文档,比普通网页版的附件检索更靠谱。

NLM 有开源的能代替,https://github.com/lfnovo/open-notebook

不过都要依赖模型,还是白嫖谷大善人的服务吧,总性价比最高。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1213478

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX