Question 1

为什么下拉菜单里看不到任何声音?

Accepted Answer

部分系统(尤其是 Chrome 环境)声音是异步加载的。开页后稍等一两秒,或刷新一次。Linux 系统大多没有自带 TTS 引擎,可能需要先装一个,比如 espeak 或 festival。

Question 2

可以直接下载 MP3 吗?

Accepted Answer

请用「录制并下载」按钮。录制功能会把标签页的音频保存为 WebM(Chromium)或 MP4(Safari)。授权弹窗里要勾选「共享标签页音频」。需要 MP3 的话,把下载下来的文件再用任意音频转换器转一下。

Question 3

为什么同一个声音在朋友的电脑上听起来不一样?

Accepted Answer

每个操作系统都带自己的语音引擎。macOS 上 Apple 的 Siri 语音和 Windows 上 Edge 的神经语音差别很大。即使名字一样,不同系统版本背后用的模型也可能略有不同。

Question 4

字数有上限吗?

Accepted Answer

没有硬性长度限制,但大多数语音引擎内部会把文本切成约 32 KB 的块。一次粘贴多篇文章这类超长输入,有时会在中途断掉,遇到这种情况就分成几段再朗读。

Question 5

粘贴进去的文字会上传吗?

Accepted Answer

不会。语音合成由设备本身的 TTS 引擎完成。录音功能把音频暂存在本机内存里,直到你点下载。文字和音频都不会传到任何服务器。

文字转语音

什么是文字转语音？