自研推荐:微软云语音合成、抖音火山语音合成、阿里云语音合成小工具

2022-07-04 20:37:59 +08:00
 baiyue

效果截图

内容简介

Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows 、Mac 、Linux 系统。

此次介绍的这三个语音合成工具,中文语音丰富、自带呼吸声,效果逼真,欢迎使用。

下载地址

如果对人工智能感兴趣,可以帮忙在 github 给个 star :)

https://github.com/Baiyuetribe/paper2gui

2870 次点击
所在节点    分享创造
14 条回复
a570295535
2022-07-04 20:47:09 +08:00
点进去东西挺多啊,厉害👍呀!
yanwen
2022-07-04 21:47:34 +08:00
一种接口一个 app 有点多 。如果可以的话,整合成一个 app 就更好了 (参考 Bob )
baiyue
2022-07-04 22:58:31 +08:00
@yanwen 已在规划中,近期会优先上线 web 在线体验版,后续整合最优的小工具为一个
baox2
2022-07-04 23:21:51 +08:00
RVM-GUI 智能图片抠图工具
速度很快,但抠像出来的图怎么都统一变成了 512*512 像素了阿?@baiyue
linKnowEasy
2022-07-05 09:26:53 +08:00
感谢, star 了, 希望有整合版后 @ 我一下
baiyue
2022-07-05 13:06:28 +08:00
@baox2 rvm 受限于模型转换问题,输出只能固定尺寸,推荐使用另外两个抠图工具,比如 modnet 或 mobilenet ,支持图片或视频抠图。
dfgxcvbcv
2022-07-05 14:36:26 +08:00
现在调现成的接口都能算自研了吗?
shuang
2022-07-05 23:54:45 +08:00
省流:下载 app 后需要自己提供 key 才能用
o00O00o
2022-07-06 09:12:46 +08:00
请教一下,桌面端是使用的什么技术栈呢?
baiyue
2022-07-06 09:40:47 +08:00
@o00O00o 项目里有介绍,该项目主要是基于 webview2 开发的图形界面,使用 wails 组合 vue 前端和 go 后端。所以界面是 VUE 写的,逻辑部分由 go 语言完成,AI 推理这块使用 c++里的 ncnn 推理框架,搭配 vulkan 实现任意显卡支持,同时也为基于 wasm 的网页应用和移动端 app 提供可能。
icebear0
2022-07-06 09:54:48 +08:00
看到 OP 的这个,我第一时间想到的就是 bob (一个翻译软件),前几天也发布了正式版本,也在 V 站上抽奖过。
所以如果 OP 做一个 bob 的插件(可以做成语音插件)的话,我相信肯定会有很多人使用,并且也能达到宣传自己这个项目的作用。
bob 这款软件之前在 GitHub 上获得了 6.3K 的星,而且对应的群中,也有几千人在使用
sjzjams
2022-07-06 10:07:31 +08:00
@dfgxcvbcv 整合成一个工具 这不是更方便使用了吗,算的
newledge
2022-08-19 11:10:43 +08:00
最近就想搞搞语音合成。
baiyue
2022-08-26 20:40:57 +08:00
@yanwen @sjzjams 感谢关注,项目已正式上线整合版,比现有开源的更全面更专业,持久维护。参见 https://github.com/Baiyuetribe/paper2gui

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/864057

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX