tts-importer
扫码查看

为阅读软件配置Azure TTS语音服务

tts-importer

综合介绍

tts-importer是一个免费的在线工具,它的核心功能是帮助用户将微软Azure云服务提供的“文本转语音”(TTS)功能,方便地配置到第三方的安卓阅读软件中。许多阅读软件本身支持自定义语音朗读引擎,但配置过程往往比较复杂。这个工具通过一个简单的网页界面,让用户输入自己的Azure服务密钥和区域信息,然后选择喜欢的声音、语速、语调等参数,就能自动生成一个专属的配置链接或代码。用户把这个链接或代码复制到阅读软件(如“阅读”legado、“源阅读”等)的设置里,就可以用上Azure提供的高质量、接近真人发音的语音来听书或阅读文章,提升了听书的体验。该工具的所有逻辑都在用户的浏览器里完成,不会在服务器上储存用户的密钥信息,保障了安全性。

功能列表

  • 简化配置:将复杂的Azure TTS语音服务配置流程简化为在网页上填写几个选项即可完成。
  • 支持多种阅读软件:目前支持“阅读”(Legado)、“爱阅记”、“源阅读”、“爱阅书香”等多种流行阅读APP。
  • 支持Read Aloud:同时为浏览器插件Read Aloud生成配置文件。
  • 高度自定义:用户可以自由选择Azure提供的多种语言和语音模型,并详细调整语音的风格、语速和语调。
  • 保障隐私安全:用户的Azure Key等敏感信息仅在用户的浏览器本地处理,不会上传或储存在网站服务器上。
  • 一键导入:为支持的阅读软件生成网络导入链接,简化在手机端的操作。
  • 跨平台使用:作为网页工具,在任何有现代浏览器的设备上都可以访问和使用,无需安装。

使用帮助

这个工具的使用流程分为两大步:第一步是获取Azure语音服务的凭证(密钥和区域),第二步是在tts-importer网站上生成配置并导入到阅读APP中。

第一步:获取Azure语音服务密钥(Key)和区域(Region)

要使用这个工具,你首先需要一个微软Azure账户,并创建一个“语音服务”的资源。这个过程是免费的(在Azure的免费额度内),但需要一些操作。

  1. 创建Azure账户:如果你还没有Azure账户,需要先访问Azure官方网站注册一个。这通常需要一个有效的信用卡作为验证,但微软会提供一定的免费额度,对于个人听书使用来说一般是足够的。
  2. 创建语音服务资源
    • 登录到Azure门户网站。
    • 在顶部的搜索框中搜索“语音服务” (Speech services) 并选择它。
    • 点击“创建”按钮。
    • 在创建页面,你需要填写一些基本信息:
      • 订阅:选择你的Azure订阅。
      • 资源组:你可以新建一个资源组,比如命名为 MyTTSResource
      • 区域:选择一个离你地理位置近的区域,这会影响响应速度。例如,可以选择 East Asia (东亚) 或 Southeast Asia (东南亚)。这个区域信息非常重要,后续需要填入tts-importer网站
      • 名称:为你的服务起一个独特的名字,例如 MyTTSForReading
      • 定价层:选择 Free F0 这个免费套餐,它有每月50万个字符的免费额度,足够个人使用。
    • 填写完毕后,点击“审阅 + 创建”,然后再次点击“创建”。
  3. 获取密钥和区域
    • 等待资源部署完成后,点击“转到资源”进入你刚刚创建的语音服务页面。
    • 在左侧菜单中,找到并点击“密钥和终结点” (Keys and Endpoint)。
    • 在这里你会看到两个密钥(密钥1 和 密钥2)以及“位置/区域”信息。密钥1和这个“区域”信息复制下来,这就是我们需要的两个核心凭证。

第二步:使用tts-importer生成和导入配置

获取到密钥和区域后,就可以使用tts-importer工具来生成配置了。

  1. 访问工具网站
    • 打开浏览器,访问tts-importer的官方网站:https://tts.yfi.moe。 (根据项目信息,此为工具主页)
  2. 填写基本信息
    • 在网页上找到对应的输入框,将上一步获取的Azure 密钥 粘贴到 Azure Key 或类似的输入框中。
    • 将上一步获取的Azure 区域 代码(例如 eastasia)粘贴到 Azure Region 或类似的输入框中。
  3. 配置语音参数
    • 选择阅读器APP:网站上会有一个选项让你选择目标APP,例如 阅读(legado) 或 源阅读。请根据你手机上安装的APP进行选择。
    • 选择语音:点击语音选择框,这里会列出Azure支持的所有语言和语音模型。你可以选择一个听起来最舒服的中文普通话声音,比如 zh-CN-XiaoxiaoNeural (女声) 或 zh-CN-YunjianNeural (男声)。
    • 选择语音风格:部分语音支持不同的情感或场景风格,如 chat (聊天)、newscast (新闻播报)等。你可以根据喜好选择,或者保持默认。
    • 调整语速和语调:通过拖动滑块或输入数值,可以调整朗读的速度和音高,直到你觉得满意为止。
  4. 生成并导入配置
    • 完成所有设置后,页面下方通常会有几个生成选项:
      • 复制配置:点击此按钮会生成一大段文本代码。你需要将这段文本完整地复制下来。然后打开手机上的阅读APP,进入朗读引擎设置,选择“自定义”或“导入”,将这段代码粘贴进去保存即可。
      • 一键导入 或 复制网络链接:点击此按钮会生成一个URL链接。这种方式更方便。你可以将这个链接复制下来,然后通过微信、QQ等方式发送到手机上。在手机上打开这个链接,通常会自动唤起并提示你将配置导入到对应的阅读APP中。
  5. 在APP中启用新配置
    • 导入成功后,回到阅读APP的朗读引擎设置界面,你应该能看到一个以你选择的语音命名的新引擎。
    • 选中这个新创建的引擎作为默认朗读服务。
    • 现在,打开任意一本书,点击“朗读”或“听书”按钮,APP就会开始使用你刚配置好的、由Azure提供的流畅自然的声音来为你读书了。

应用场景

  1. 提升个人听书体验对于喜欢使用“阅读”(Legado)、“源阅读”等APP听小说的用户,这个工具可以让他们摆脱安卓系统自带的生硬机械的TTS声音。通过配置Azure的神经网络语音,用户可以享受到接近真人朗读的听书体验,发音更自然、流畅,支持多种情感风格,让长时间听书变得更加舒适。
  2. 语言学习辅助用户可以利用Azure TTS丰富的多语言语音库,将外语电子书或文章导入阅读软件中进行朗读。这有助于学习者跟读、模仿标准发音,矫正口音。通过调整语速功能,可以放慢朗读速度,更好地掌握单词的发音细节。
  3. 内容创作者素材准备对于需要制作有声读物、播客或视频配音的内容创作者,可以使用该工具快速将文本转换成高质量音频,作为临时的配音或内容预览。虽然它不能直接导出音频文件,但在阅读APP中播放时可以进行录音,作为一种低成本的音频内容生产方式。

QA

  1. 这个工具是免费的吗?tts-importer网站本身是完全免费的开源项目。但它依赖的后端服务是微软的Azure TTS,Azure对该服务有定价。不过,新用户通常可以获得一个免费套餐(Free Tier),其中包含每月50万个字符的免费额度。对于普通用户每天听几小时书的需求来说,这个额度基本上是够用的。
  2. 我的Azure密钥安全吗?网站会不会窃取我的信息?根据该项目在GitHub上的隐私说明,tts-importer是一个前端项目,所有的计算和逻辑处理都在你的浏览器本地完成。你输入的Azure密钥不会被上传到它的服务器上,仅用于在你自己的浏览器中生成配置。当使用“一键导入”功能时,密钥信息会被编码在生成的URL中,服务器也仅是做一个转发,并不会储存这些信息,所以安全性较高。
  3. 配置好后,声音听起来断断续续或者不稳定怎么办?这通常是网络问题。因为Azure TTS是在线的服务,阅读软件需要将文字发送到Azure服务器,然后接收返回的音频流。如果你的网络连接不稳定或速度较慢,就可能导致声音延迟或卡顿。可以尝试连接更稳定的Wi-Fi网络,或者检查所选的Azure“区域”是否离你太远。
  4. 我可以在哪些阅读软件里使用这个工具?根据项目说明,目前主要支持“阅读”(legado)、“爱阅记”、“源阅读”、“爱阅书香”、“源阅”等安卓端的阅读软件,以及浏览器的“Read Aloud”插件。你需要确保你的阅读软件版本支持自定义TTS接口。
微信微博Email复制链接