Question 1

音声はサーバーに送られますか?

Accepted Answer

認識は端末内蔵の音声サービスに音声を送ります。ChromeならGoogle、SafariならApple、ごく一部のプラットフォームは端末内で処理します。テキストが表示された後は端末内に留まります。さらに自動的にローカル保存するので再読込しても作業が消えません。「クリア」ボタンで保存済みのコピーも消えます。

Question 2

マイクボタンを押しても反応しません

Accepted Answer

ブラウザがWeb Speech APIを実装していない(古いFirefoxや一部のプライベートウインドウ)か、マイクの許可が拒否されています。アドレスバーのサイト設定アイコンを確認してください。デスクトップやAndroidのChrome、Edgeが一番安定します。

Question 3

数秒で止まってしまいます。原因は?

Accepted Answer

多くのブラウザはリソース節約のため、数秒の無音で自動停止します。話し続ければ継続します。途中で切れた場合はマイクをもう一度押せば、既存の文字起こしは残り、続きが末尾に追加されます。

Question 4

句読点や改行は入れられますか?

Accepted Answer

可能です。「カンマ」「ピリオド」「疑問符」「改行」と声に出してください。エンジンごとに認識精度が違うので、後で本文を一度見直すのが普通の流れです。

Question 5

方言や訛りが誤認識されます。辞書を編集できますか?

Accepted Answer

認識モデルはブラウザのもので、ここからは編集できません。一番近い地域バリアント(ja-JPほか)を選べば多くは解消します。人名や専門用語は文字起こしを終えてから手動で修正し、それからコピーしてください。

音声テキスト変換

文字起こし

音声テキスト変換とは？

使い方

使用するタイミング

結果

よくある質問

関連ツール

スペクトラムアナライザー

モノラルからステレオへの変換ツール

オーディオビットレート変換

オーディオクロスフェード

コーラスエフェクト

波形画像ジェネレーター

音声テキスト変換

文字起こし