0 元购,听书阅读器 Aurader 征集新功能

5 月 17 日
 jobives2023

各位佬,大家好!

两个多月前,我上线了一款名为 Aurader 的听书应用。它是一款 AI 驱动的文本转语音( TTS )工具,核心定位是让用户用自然的声音去“听”电子书、PDF 、文档和网页。

除了上线初期的限免活动,应用基本没做过推广,目前在全球积累了大约 8 万用户。这两个月里,全靠用户的真实反馈在修 BUG 和迭代。深知自己才疏智浅,今天发帖的核心目的,就是希望能听到各位佬的反馈和建议!

核心功能亮点

坦白局:目前的缺陷与不足 本着不忽悠原则,目前产品还有很多不完美的地方,正在加紧掉头发开发中:

  1. 本地高级引擎暂仅支持英文,且未能完美兼顾“高音质+低能耗”,所以才妥协拆成了两个模型让大家按需选择。
  2. 暂未实现 iCloud 同步。
  3. 暂无阅读统计和自定义主题。
  4. 暂未加入部分用户期待的学习辅助功能(如单词本、影子跟读)。

交换您的宝贵意见(奉上终身会员码),以及新功能建议。 大家的建议对我至关重要,为了不白白占用各位的时间,特此奉上终身会员免费兑换码。 💡 兑换方式:

兑换码(先放 50 个,不够再加,也可以留言我直接定向给): EEF4YPNEYFF36KKR68 TMPLFRN4N3YNJT84JT PT4A38WXTK3YWK4H6M 7RAFWKAFY8EEY8Y6MW M7E68T3EYFEHLHJ6LJ 8RAWFH7M47HTJEW6YY A3AMHYXLMKJP6EWW8K EH3E6TWRL3YLYY487E KJ6E43MP78AJMKEN33 W4PLEL44EWF6NPNHT8 L7WHNRL4YMH6PPTAAR 8EXW8PN6FRFX7NM8MP 6N4HL3EFXHL4XK4LFY XTYP7YPXT3WF433NKP W7JK7EX8P7FMR8YPAW 74T7EWEK7ALY8MMJL8 6WY4TKYKNFMR3THL37 THPL8W3F8JAW8YY4FP RWLA63M3Y8RY8EXJY6 67PTKN6MK8HEKRJFKR 4EPP3KAJL7A3XWMPHW TNWNE8E7NX7A6KJR73 34R8LJ6EJEXN7864W4 MXA3MXJRPK86J8NWH8 4MN8PNJ37MK6LR3R7A FMM84F6WRJKRKHA67Y NTWEF7XKY84JRE3KXF MEMFL4KWN34J8TXM4L 6X377KP7WK8HWR3ER7 7R7EL3FEYHRX63WYLL 8T3483EJJMH7ATL3KN NJ3PKY4MM8KFATEYEL MFWJ67HE8MMEEPK87E RRXXRRAY87PXRYAMH7 AP6YFFJJT7TPARLKHX NETLMRHMH7WM834AK7 TXA7A7XELX4RHPJWR8 7PNPWFMRJKKFKFRKAM JNTT7J4FXKPXNXTM3J YPHP3RKK44R787P8NT 7LRM8PKLLPW8ALHEJR LMETW4PRRRNX4AMTY7 EPMHW3EARRNLY888LP 4JKYLMFF8K8YLYK73N 3APWYHK8FF667RM3LH 3LT37R4PNEY6N644LL 66T6PWYF8AFMYWT3LM P83R4PE84A4LETJ33W 8RNHPKMWP6PTMTX3XT P634FTN4APH4TWHJTL

为了方便后来的兄弟,兑换成功的大佬麻烦在评论区友情回复一下用了哪一个,万分感谢! 期待听到大家的真实反馈🙏

10725 次点击
所在节点    Apple
264 条回复
admirez
5 月 17 日
请支持 carplay
yxcycn
5 月 17 日
建议增加文件库功能(类似文件管理),方便大量电子书整理使用
Mmnni
5 月 17 日
3LT37R4PNEY6N644LL 已用,感谢
kirbyzhu
5 月 17 日
这个听书软件非常好 打 call

每次反馈都很快得到回应

再提一个优化建议 右滑翻章后左滑回到了上一章结尾 不知道能不能回到原来的位置而不是章尾
yzjudith
5 月 17 日
P634FTN4APH4TWHJTL 已用,感谢
wyd011011daniel
5 月 17 日
之前已经兑换了永久会员,在线的中文 tts 使用的是 azure ,想知道能不能开放使用自己的 api ,然后可以让用户自己调节情感 情感强度 语速(这个重点是上传给 api 的时候就添加了语速,这样的效果比 1 倍速下来再变速效果好很多)

用户填入 https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1 这样的 api 地址和自己的密钥 就可以使用

下面是我听书时候使用的配置 <speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="zh-CN"><voice name="zh-CN-XiaoxiaoNeural"><prosody rate="-34.00%"><mstts:express-as style="lyrical" styledegree="1.6">%@</mstts:express-as></prosody></voice></speak>

其中<mstts:express-as style="lyrical" styledegree="1.6"> 是情感和情感强度 调节这个能够很好的修改语音的感觉
wyd011011daniel
5 月 17 日
@wyd011011daniel 然后本地的那个英文 TTS 非常好用,希望尽快能有中文的版本
DearFox
5 月 17 日
之前反馈 tts 缓冲延迟的问题,后来等了很久都没解决呀,达不到指定发送长度用标点符号识别再加一句啊
bao3
5 月 17 日
不用试了,全用完了……

我是免费版的,这软件是真的好用
jobives2023
5 月 17 日
jobives2023
5 月 17 日
@admirez 好的 佬 已加入开发计划
jobives2023
5 月 17 日
@yxcycn 感谢佬反馈 导入书籍后可以用标签分类一下,更加精细的管理现在还不支持
jobives2023
5 月 17 日
@kirbyzhu 感谢佬反馈 我考虑考虑,看看好不好实现
jobives2023
5 月 17 日
@wyd011011daniel 感谢佬反馈,我最近测试了一个本地中文模型,但可惜太耗电了,不敢上,再等等吧,有优化好了的版本就会上,另外你说的接入自己的 API ,我考虑过,但这个实现有点麻烦,因为要兼容不同的模型,而且真正的情感朗读其实是要带情感标签的,这个需要快速的模型 api 支持才行,我后面再看看吧
jobives2023
5 月 17 日
@DearFox 感谢佬的反馈,这个问题还存在吗?我确实已经优化了缓冲,如果还存在这个问题,那应该不是缓冲的问题了,如果方便的话请通过 APP 设置页面的邮件把相关的书籍发给我测试一下看看具体是什么问题吧
rssf
5 月 17 日
P83R4PE84A4LETJ33W 已用,谢谢
wyd011011daniel
5 月 17 日
@jobives2023 #34

我对 API 兼容性还是挺期待的。如果开发者适配不同模型是有一些难度的话,建议可以引入类似“爱阅记”的自定义模式,允许用户自主配置 HTTP 请求。

对于具备一定技术基础(如了解 API 概念、熟悉云服务账户注册)的用户而言,在 AI 的辅助指导下,完成这类配置并非难事。如果平台能够提供可视化的自定义配置界面,或者支持导入他人分享的预设配置文件(简单的 json 文本),普通用户便只需填入自己的密钥( API Key )即可直接使用,这将大幅降低操作门槛。也就是说,每一个 AI 服务或者说语音 TTS 服务只需要某一个人完成适配,然后上传到例如 GitHub 的仓库里,就可以让所有用户一起使用,只需要填入自己的 API key 。此外,鉴于目前诸如小米等厂商已开放了自身的 TTS (语音合成)云服务,我觉得应该是有一定前景的。实际上阅读,爱阅记等软件就是这么做的。

然后你说的情感朗读,我知道真正的情感朗读是要带情感标签的,但是我自己是把语音情感当做一个全局化的设置作为特定音色进行听书。嗯,或者软件里的 TTS 使用的是 Azure 的 TTS 的话,也可以把那些情感类型和情感强度的选项加上。不过,Azure 的 TTS API 还是挺贵的,所以我期望是能够让用户用自己的。这样可以减轻开发者的负担
wyd011011daniel
5 月 17 日
@wyd011011daniel #37 嗯,这是爱阅记的听书配置文件的 JSON 文件直接复制。甚至我觉得可以直接按照类似爱阅记或者阅读的模板直接进行导入因为无论是字节或者百度之类的 TTS ,这样的模板已经有较大的应用,我看到很多用户就是按照这样的模板直接填入自己的 API 进行听书,很多用户也会分享和使用,如果能够参考这样的配置文件就可以把这方面的用户进行一个吸引{
"loginUrl": "",
"maxWordCount": "",
"ratePercent": 0.5,
"ttsConfigGroup": "Azure",
"_ClassName": "JxdAdvCustomTTS",
"_TTSConfigID": "对应的 id",
"httpConfigs":
{
"useCookies": 1,
"headers":
{ }
},
"ttsHandles":
[
{
"paramsEx": "",
"nextPageForGetMedthod": 1,
"processType": 1,
"maxPageCount": 1,
"method": 0,
"requestByWebView": 0,
"nextPageParams":
{ },
"parser":
{
"playData": "ResponseData"
},
"url": "https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1",
"params":
{
"text": "<speak version=\"1.0\" xmlns=\"http://www.w3.org/2001/10/synthesis\" xmlns:mstts=\"https://www.w3.org/2001/mstts\" xml:lang=\"zh-CN\"><voice name=\"zh-CN-XiaoxiaoNeural\"><prosody rate=\"-34.00%\"><mstts:express-as style=\"lyrical\" styledegree=\"1.6\">%@</mstts:express-as></prosody></voice></speak>"
},
"httpConfigs":
{
"useCookies": 1,
"customFormatParams": "params[text]",
"headers":
{
"User-Agent": "AiyueTTS",
"Content-Type": "application/ssml+xml",
"X-Microsoft-OutputFormat": "audio-24khz-48kbitrate-mono-mp3",
"ocp-apim-subscription-key": "对应的 key"
}
}
}
],
"_TTSName": "Azure 晓晓 gentle"
}
wyd011011daniel
5 月 17 日
@wyd011011daniel #38 因为我觉得阅读作为安卓的比较领先的阅读软件,iOS 上并没有能够与它太好进行竞争的软件。如果能做这样的适配,我觉得能在一定程度上吸引从安卓转 iOS 的阅读用户。同时,我觉得这样子可以借助社区社群的力量完成大部分 TTS 服务的适配,也是一件好事
DearFox
5 月 17 日
@jobives2023 刚试好像 OK 了,我以为你还没改,我的问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1213307

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX