tts-importer
综合介绍
tts-importer是一个免费的在线工具,它的核心功能是帮助用户将微软Azure云服务提供的“文本转语音”(TTS)功能,方便地配置到第三方的安卓阅读软件中。许多阅读软件本身支持自定义语音朗读引擎,但配置过程往往比较复杂。这个工具通过一个简单的网页界面,让用户输入自己的Azure服务密钥和区域信息,然后选择喜欢的声音、语速、语调等参数,就能自动生成一个专属的配置链接或代码。用户把这个链接或代码复制到阅读软件(如“阅读”legado、“源阅读”等)的设置里,就可以用上Azure提供的高质量、接近真人发音的语音来听书或阅读文章,提升了听书的体验。该工具的所有逻辑都在用户的浏览器里完成,不会在服务器上储存用户的密钥信息,保障了安全性。
功能列表
- 简化配置:将复杂的Azure TTS语音服务配置流程简化为在网页上填写几个选项即可完成。
- 支持多种阅读软件:目前支持“阅读”(Legado)、“爱阅记”、“源阅读”、“爱阅书香”等多种流行阅读APP。
- 支持Read Aloud:同时为浏览器插件Read Aloud生成配置文件。
- 高度自定义:用户可以自由选择Azure提供的多种语言和语音模型,并详细调整语音的风格、语速和语调。
- 保障隐私安全:用户的Azure Key等敏感信息仅在用户的浏览器本地处理,不会上传或储存在网站服务器上。
- 一键导入:为支持的阅读软件生成网络导入链接,简化在手机端的操作。
- 跨平台使用:作为网页工具,在任何有现代浏览器的设备上都可以访问和使用,无需安装。
使用帮助
这个工具的使用流程分为两大步:第一步是获取Azure语音服务的凭证(密钥和区域),第二步是在tts-importer网站上生成配置并导入到阅读APP中。
第一步:获取Azure语音服务密钥(Key)和区域(Region)
要使用这个工具,你首先需要一个微软Azure账户,并创建一个“语音服务”的资源。这个过程是免费的(在Azure的免费额度内),但需要一些操作。
- 创建Azure账户:如果你还没有Azure账户,需要先访问Azure官方网站注册一个。这通常需要一个有效的信用卡作为验证,但微软会提供一定的免费额度,对于个人听书使用来说一般是足够的。
- 创建语音服务资源:
- 登录到Azure门户网站。
- 在顶部的搜索框中搜索“语音服务” (
Speech services
) 并选择它。 - 点击“创建”按钮。
- 在创建页面,你需要填写一些基本信息:
- 订阅:选择你的Azure订阅。
- 资源组:你可以新建一个资源组,比如命名为
MyTTSResource
。 - 区域:选择一个离你地理位置近的区域,这会影响响应速度。例如,可以选择
East Asia
(东亚) 或Southeast Asia
(东南亚)。这个区域信息非常重要,后续需要填入tts-importer网站。 - 名称:为你的服务起一个独特的名字,例如
MyTTSForReading
。 - 定价层:选择
Free F0
这个免费套餐,它有每月50万个字符的免费额度,足够个人使用。
- 填写完毕后,点击“审阅 + 创建”,然后再次点击“创建”。
- 获取密钥和区域:
- 等待资源部署完成后,点击“转到资源”进入你刚刚创建的语音服务页面。
- 在左侧菜单中,找到并点击“密钥和终结点” (
Keys and Endpoint
)。 - 在这里你会看到两个密钥(
密钥1
和密钥2
)以及“位置/区域”信息。将密钥1
和这个“区域”信息复制下来,这就是我们需要的两个核心凭证。
第二步:使用tts-importer生成和导入配置
获取到密钥和区域后,就可以使用tts-importer工具来生成配置了。
- 访问工具网站:
- 打开浏览器,访问tts-importer的官方网站:
https://tts.yfi.moe
。 (根据项目信息,此为工具主页)
- 打开浏览器,访问tts-importer的官方网站:
- 填写基本信息:
- 在网页上找到对应的输入框,将上一步获取的Azure 密钥 粘贴到
Azure Key
或类似的输入框中。 - 将上一步获取的Azure 区域 代码(例如
eastasia
)粘贴到Azure Region
或类似的输入框中。
- 在网页上找到对应的输入框,将上一步获取的Azure 密钥 粘贴到
- 配置语音参数:
- 选择阅读器APP:网站上会有一个选项让你选择目标APP,例如
阅读(legado)
或源阅读
。请根据你手机上安装的APP进行选择。 - 选择语音:点击语音选择框,这里会列出Azure支持的所有语言和语音模型。你可以选择一个听起来最舒服的中文普通话声音,比如
zh-CN-XiaoxiaoNeural
(女声) 或zh-CN-YunjianNeural
(男声)。 - 选择语音风格:部分语音支持不同的情感或场景风格,如
chat
(聊天)、newscast
(新闻播报)等。你可以根据喜好选择,或者保持默认。 - 调整语速和语调:通过拖动滑块或输入数值,可以调整朗读的速度和音高,直到你觉得满意为止。
- 选择阅读器APP:网站上会有一个选项让你选择目标APP,例如
- 生成并导入配置:
- 完成所有设置后,页面下方通常会有几个生成选项:
- 复制配置:点击此按钮会生成一大段文本代码。你需要将这段文本完整地复制下来。然后打开手机上的阅读APP,进入朗读引擎设置,选择“自定义”或“导入”,将这段代码粘贴进去保存即可。
- 一键导入 或 复制网络链接:点击此按钮会生成一个URL链接。这种方式更方便。你可以将这个链接复制下来,然后通过微信、QQ等方式发送到手机上。在手机上打开这个链接,通常会自动唤起并提示你将配置导入到对应的阅读APP中。
- 完成所有设置后,页面下方通常会有几个生成选项:
- 在APP中启用新配置:
- 导入成功后,回到阅读APP的朗读引擎设置界面,你应该能看到一个以你选择的语音命名的新引擎。
- 选中这个新创建的引擎作为默认朗读服务。
- 现在,打开任意一本书,点击“朗读”或“听书”按钮,APP就会开始使用你刚配置好的、由Azure提供的流畅自然的声音来为你读书了。
应用场景
- 提升个人听书体验对于喜欢使用“阅读”(Legado)、“源阅读”等APP听小说的用户,这个工具可以让他们摆脱安卓系统自带的生硬机械的TTS声音。通过配置Azure的神经网络语音,用户可以享受到接近真人朗读的听书体验,发音更自然、流畅,支持多种情感风格,让长时间听书变得更加舒适。
- 语言学习辅助用户可以利用Azure TTS丰富的多语言语音库,将外语电子书或文章导入阅读软件中进行朗读。这有助于学习者跟读、模仿标准发音,矫正口音。通过调整语速功能,可以放慢朗读速度,更好地掌握单词的发音细节。
- 内容创作者素材准备对于需要制作有声读物、播客或视频配音的内容创作者,可以使用该工具快速将文本转换成高质量音频,作为临时的配音或内容预览。虽然它不能直接导出音频文件,但在阅读APP中播放时可以进行录音,作为一种低成本的音频内容生产方式。
QA
- 这个工具是免费的吗?tts-importer网站本身是完全免费的开源项目。但它依赖的后端服务是微软的Azure TTS,Azure对该服务有定价。不过,新用户通常可以获得一个免费套餐(Free Tier),其中包含每月50万个字符的免费额度。对于普通用户每天听几小时书的需求来说,这个额度基本上是够用的。
- 我的Azure密钥安全吗?网站会不会窃取我的信息?根据该项目在GitHub上的隐私说明,tts-importer是一个前端项目,所有的计算和逻辑处理都在你的浏览器本地完成。你输入的Azure密钥不会被上传到它的服务器上,仅用于在你自己的浏览器中生成配置。当使用“一键导入”功能时,密钥信息会被编码在生成的URL中,服务器也仅是做一个转发,并不会储存这些信息,所以安全性较高。
- 配置好后,声音听起来断断续续或者不稳定怎么办?这通常是网络问题。因为Azure TTS是在线的服务,阅读软件需要将文字发送到Azure服务器,然后接收返回的音频流。如果你的网络连接不稳定或速度较慢,就可能导致声音延迟或卡顿。可以尝试连接更稳定的Wi-Fi网络,或者检查所选的Azure“区域”是否离你太远。
- 我可以在哪些阅读软件里使用这个工具?根据项目说明,目前主要支持“阅读”(legado)、“爱阅记”、“源阅读”、“爱阅书香”、“源阅”等安卓端的阅读软件,以及浏览器的“Read Aloud”插件。你需要确保你的阅读软件版本支持自定义TTS接口。