Was ist Text-zu-Sprache?
Text-to-Speech liest beliebigen Text mithilfe der integrierten Sprachsynthese Ihres Geräts vor. Wählen Sie eine Stimme, passen Sie Geschwindigkeit und Tonhöhe an und hören Sie freihändig zu. Die gesamte Verarbeitung bleibt auf Ihrem Gerät.
Die Stimmen kommen direkt aus der Sprach-Engine deines Betriebssystems, deshalb sieht die Liste auf Windows, macOS, Android, iOS oder einer Linux-Distribution unterschiedlich aus. Die Geschwindigkeit lässt sich von 0,1x bis 10x regeln, die Tonhöhe von 0 bis 2. In Chrome und Edge kannst du die Wiedergabe zudem über den Tab-Teilen-Dialog als WebM- oder MP4-Audiodatei aufzeichnen.
Anleitung
- Geben Sie den Text, den Sie hören möchten, in das Textfeld ein oder fügen Sie ihn ein — von einem einzelnen Satz bis hin zu ganzen Artikeln.
- Wählen Sie eine Stimme aus dem Dropdown-Menü — die verfügbaren Stimmen hängen von Ihrem Gerät und Betriebssystem ab.
- Stellen Sie Geschwindigkeit und Tonhöhe über die Schieberegler nach Ihren Wünschen ein und drücken Sie dann auf Wiedergabe. Verwenden Sie bei Bedarf die Pause- und Stopp-Steuerung.
Wann verwenden
- Einen Artikel oder ein PDF beim Kochen oder Pendeln anhören, statt ihn zu lesen.
- Einen Mail- oder Berichtsentwurf vorlesen lassen, um vor dem Versand sperrige Sätze zu hören.
- Aussprache in einer Fremdsprache üben, indem du die Geschwindigkeit auf 0,75x reduzierst.
Ergebnis
Ein Sprachlerner fügt einen Absatz auf Französisch ein, wählt eine französische Stimme, verlangsamt die Geschwindigkeit auf 0,75x und hört aufmerksam zu, um Aussprache und Hörverständnis zu üben.
Häufige Fragen
- Warum sehe ich gar keine Stimmen im Dropdown?
- In manchen Umgebungen, vor allem Chrome, werden die Stimmen asynchron geladen. Warte nach dem Öffnen ein, zwei Sekunden oder lade die Seite einmal neu. Unter Linux musst du eventuell eine TTS-Engine wie espeak oder festival nachinstallieren, weil die meisten Distributionen keine mitbringen.
- Kann ich das Audio direkt als MP3 herunterladen?
- Nutze die Schaltfläche Aufnehmen & Herunterladen. Die Aufnahme erfasst das Tab-Audio als WebM (Chromium) oder MP4 (Safari). Setze im Berechtigungsdialog den Haken bei „Tab-Audio teilen“. Für MP3 jagst du die Datei anschließend durch einen beliebigen Audiokonverter.
- Warum klingt dieselbe Stimme auf dem Rechner einer Freundin anders?
- Jedes Betriebssystem bringt eine eigene Sprach-Engine mit. Die Siri-Stimmen von Apple unter macOS unterscheiden sich deutlich von den Neural-Voices in Edge unter Windows. Selbst gleichnamige Einträge können hinter den Kulissen auf leicht andere Modelle verweisen.
- Gibt es ein Zeichenlimit?
- Eine harte Obergrenze gibt es nicht, doch die meisten Engines zerteilen den Text intern in Blöcke von rund 32 KB. Sehr lange Eingaben (mehrere Artikel hintereinander) brechen manchmal ab. Tritt das auf, füge den Text in mehreren kleineren Portionen ein.
- Verlässt der eingefügte Text mein Gerät?
- Nein. Die Sprachsynthese läuft lokal über die TTS-Engine deines Geräts, und die Aufnahme bleibt im lokalen Speicher, bis du sie herunterlädst. Weder Text noch Audio werden an einen Server geschickt.
Ähnliche Tools
Spektrumanalysator
Visualisieren Sie das Audio-Frequenzspektrum in Echtzeit
Mono-zu-Stereo-Konverter
Mono-Audiodateien in Stereo konvertieren
Audio-Bitrate-Konverter
Bitrate von Audiodateien ändern
Audio-Crossfade
Überblendung zwischen zwei Audiospuren
Chorus-Effekt
Chorus-Audioeffekt hinzufügen
Wellenform-Bildgenerator
Audio-Wellenform als Bild exportieren