什麼是語音轉文字?

語音轉文字工具利用裝置內建的語音辨識功能,將您說的話即時轉換為文字。可以拿它口述筆記、草擬訊息,或隨手記下靈感,全程不必動手。所有處理都在您的裝置上私密完成。

辨識使用 Chrome、Edge 與 Safari 內建的 Web Speech API,準確度取決於你的裝置與麥克風,不依賴遠端伺服器。支援十三種辨識語言,包含英文各變體、普通話、阿拉伯文與印地文。標點不會自動加上,要說出「逗號」「句號」才會插入。

使用方法

  1. 第一步——點擊麥克風按鈕,在彈出提示時授予麥克風存取權限。
  2. 第二步——對著麥克風清晰地說話,您的語音會即時顯示為文字。
  3. 第三步——說完後點擊停止,然後複製或下載轉錄好的文字。

何時使用

  • 開車或下廚時雙手忙不過來,用語音口述訊息、郵件或筆記。
  • 開會時來不及打字,用語音先把重點錄下來,事後整理。
  • 手腕痠或不方便敲鍵盤時,讓語音輸入幫忙省力。

結果

開會時需要快速做筆記?按下麥克風按鈕,自然地講述討論要點,即可取得一份整齊的文字記錄,直接貼到您的筆記應用程式中。

常見問題

我的聲音會被傳到伺服器嗎?
辨識會把音訊交給裝置內建的語音服務處理 —— Chrome 走 Google、Safari 走 Apple,少數平台直接在裝置本地完成。文字一旦顯示就只留在你的裝置上。我們還會把轉錄自動儲存到本地,這樣意外重新整理也不會弄丟內容,按「清除」即可抹掉已儲存的副本。
麥克風按鈕點了沒反應,怎麼辦?
可能是瀏覽器沒有 Web Speech API(較舊的 Firefox 或部分隱私視窗),或者麥克風權限被拒。檢查網址列的網站權限圖示。桌面或 Android 上的 Chrome、Edge 通常表現最好。
錄個幾秒就自動停了,怎麼回事?
大多數瀏覽器為了節省資源,偵測到幾秒沉默就自動停止。持續說話通常可以維持。如果話講到一半被切斷,再點一次麥克風,已有的轉錄會保留,新內容會接在後面。
可以加逗號、句號和換行嗎?
可以,直接念出來:「逗號」「句號」「問號」「換行」。辨識引擎對這些指令的靈敏度不一,所以結束後快速校對一遍是正常流程。
口音辨識錯了,可以修改字典嗎?
辨識模型是瀏覽器內建的,這裡無法修改。選擇最接近的區域變體(英美/英國、墨西哥西/西班牙西)能解決多數口音問題。人名或行話辨識不準時,在轉錄完成後手動修改再複製即可。

相關工具