什么是文字转语音?

文本转语音工具利用设备内置的语音合成引擎朗读任意文本。选择语音,调整语速和音调,解放双手收听内容。所有处理均在您的设备上完成。

声音直接来自设备的系统语音引擎,因此列表会因 Windows、macOS、Android、iOS、Linux 而不同。语速可从 0.1 倍调到 10 倍,音调范围 0–2。Chrome 和 Edge 还能通过「共享标签页」对话框,把朗读结果录制成 WebM 或 MP4 文件下载。

使用方法

  1. 在文本框中输入或粘贴您想要收听的内容——从一句话到完整文章均可。
  2. 从下拉菜单中选择语音——可用语音取决于您的设备和操作系统。
  3. 调整语速和音调滑块至合适水平,然后按播放按钮开始收听。需要时可使用暂停和停止控件。

何时使用

  • 做饭或通勤时,听一篇没空读完的文章或 PDF。
  • 把刚写好的邮件或报告念出来,听到不顺的句子再修改。
  • 把外语段落速度调到 0.75 倍,跟着练发音。

结果

一位语言学习者粘贴了一段法语文本,选择法语语音并将语速调至 0.75 倍速,仔细聆听以练习发音和理解能力。

常见问题

为什么下拉菜单里看不到任何声音?
部分系统(尤其是 Chrome 环境)声音是异步加载的。开页后稍等一两秒,或刷新一次。Linux 系统大多没有自带 TTS 引擎,可能需要先装一个,比如 espeak 或 festival。
可以直接下载 MP3 吗?
请用「录制并下载」按钮。录制功能会把标签页的音频保存为 WebM(Chromium)或 MP4(Safari)。授权弹窗里要勾选「共享标签页音频」。需要 MP3 的话,把下载下来的文件再用任意音频转换器转一下。
为什么同一个声音在朋友的电脑上听起来不一样?
每个操作系统都带自己的语音引擎。macOS 上 Apple 的 Siri 语音和 Windows 上 Edge 的神经语音差别很大。即使名字一样,不同系统版本背后用的模型也可能略有不同。
字数有上限吗?
没有硬性长度限制,但大多数语音引擎内部会把文本切成约 32 KB 的块。一次粘贴多篇文章这类超长输入,有时会在中途断掉,遇到这种情况就分成几段再朗读。
粘贴进去的文字会上传吗?
不会。语音合成由设备本身的 TTS 引擎完成。录音功能把音频暂存在本机内存里,直到你点下载。文字和音频都不会传到任何服务器。

相关工具