음성을 텍스트로이란?

음성 텍스트 변환은 기기에 내장된 음성 인식 기능을 사용하여 말한 내용을 문자로 변환합니다. 메모 받아쓰기, 메시지 작성, 아이디어 기록까지 손을 쓰지 않고 처리할 수 있습니다. 모든 처리는 기기 안에서 비공개로 이루어집니다.

인식은 Chrome, Edge, Safari에 들어 있는 Web Speech API를 사용해서, 정확도는 원격 서버가 아니라 기기와 마이크 성능에 달려 있어요. 영어 변형, 표준 중국어, 아랍어, 힌디어 등 열세 가지 언어를 지원합니다. 구두점은 자동으로 들어가지 않으니 '쉼표', '마침표'처럼 직접 말해 주세요.

사용 방법

  1. 1단계 — 마이크 버튼을 클릭하고 메시지가 나타나면 마이크 접근을 허용하세요.
  2. 2단계 — 마이크에 또렷하게 말하세요. 실시간으로 텍스트가 나타납니다.
  3. 3단계 — 완료되면 정지 버튼을 클릭하고, 변환된 텍스트를 복사하거나 다운로드하세요.

사용 시기

  • 운전이나 요리 중에 손이 비지 않을 때 메시지, 메일, 메모를 음성으로 받아쓰기.
  • 회의에서 타자가 못 따라갈 때 음성으로 핵심을 먼저 잡아두기.
  • 키보드 사용이 손목에 무리가 갈 때 음성 입력으로 부담 줄이기.

결과

회의 중 빠르게 메모가 필요할 때 마이크 버튼을 누르고, 논의 사항에 대해 자연스럽게 말하면 깔끔한 텍스트 기록이 만들어져 메모 앱에 바로 붙여넣을 수 있습니다.

자주 묻는 질문

제 목소리가 서버로 전송되나요?
인식은 기기에 내장된 음성 서비스로 음성을 보냅니다. Chrome은 Google, Safari는 Apple, 일부 플랫폼은 기기 내부에서 처리해요. 텍스트가 표시되면 그 뒤로는 기기에만 남아요. 또한 자동으로 로컬에 저장하기 때문에 새로 고침해도 작업이 사라지지 않고, ‘지우기'를 누르면 저장된 사본도 삭제됩니다.
마이크 버튼을 눌러도 반응이 없어요
브라우저가 Web Speech API를 노출하지 않거나(구버전 Firefox, 일부 시크릿 창) 마이크 권한이 거부된 상태예요. 주소창의 사이트 설정 아이콘을 확인해 보세요. 데스크톱이나 안드로이드의 Chrome, Edge가 가장 안정적입니다.
몇 초 만에 자동으로 멈춰요. 왜 그럴까요?
대부분의 브라우저는 자원 절약을 위해 일정 시간 침묵하면 자동으로 멈춥니다. 계속 말하면 유지돼요. 중간에 끊기면 마이크를 다시 눌러 주세요. 기존 전사는 그대로 남고 새로 들어온 말이 끝에 이어집니다.
쉼표, 마침표, 줄바꿈은 어떻게 넣나요?
구두점을 소리 내어 말하면 됩니다: '쉼표', '마침표', '물음표', '줄바꿈'. 엔진마다 인식률이 달라서 받아쓰기 후 빠르게 한 번 다듬는 게 정상적인 흐름이에요.
사투리가 잘못 인식돼요. 사전을 편집할 수 있나요?
인식 모델은 브라우저의 것이라 여기서 손댈 수 없어요. 가장 가까운 지역 변형(ko-KR 등)을 고르면 대부분의 발음 문제가 해결됩니다. 고유명사나 전문 용어는 전사 완료 후 직접 수정하고 복사하세요.

관련 도구