음성을 텍스트로이란?
음성 텍스트 변환은 기기에 내장된 음성 인식 기능을 사용하여 말한 내용을 문자로 변환합니다. 메모 받아쓰기, 메시지 작성, 아이디어 기록까지 손을 쓰지 않고 처리할 수 있습니다. 모든 처리는 기기 안에서 비공개로 이루어집니다.
인식은 Chrome, Edge, Safari에 들어 있는 Web Speech API를 사용해서, 정확도는 원격 서버가 아니라 기기와 마이크 성능에 달려 있어요. 영어 변형, 표준 중국어, 아랍어, 힌디어 등 열세 가지 언어를 지원합니다. 구두점은 자동으로 들어가지 않으니 '쉼표', '마침표'처럼 직접 말해 주세요.
사용 방법
- 1단계 — 마이크 버튼을 클릭하고 메시지가 나타나면 마이크 접근을 허용하세요.
- 2단계 — 마이크에 또렷하게 말하세요. 실시간으로 텍스트가 나타납니다.
- 3단계 — 완료되면 정지 버튼을 클릭하고, 변환된 텍스트를 복사하거나 다운로드하세요.
사용 시기
- 운전이나 요리 중에 손이 비지 않을 때 메시지, 메일, 메모를 음성으로 받아쓰기.
- 회의에서 타자가 못 따라갈 때 음성으로 핵심을 먼저 잡아두기.
- 키보드 사용이 손목에 무리가 갈 때 음성 입력으로 부담 줄이기.
결과
회의 중 빠르게 메모가 필요할 때 마이크 버튼을 누르고, 논의 사항에 대해 자연스럽게 말하면 깔끔한 텍스트 기록이 만들어져 메모 앱에 바로 붙여넣을 수 있습니다.
자주 묻는 질문
- 제 목소리가 서버로 전송되나요?
- 인식은 기기에 내장된 음성 서비스로 음성을 보냅니다. Chrome은 Google, Safari는 Apple, 일부 플랫폼은 기기 내부에서 처리해요. 텍스트가 표시되면 그 뒤로는 기기에만 남아요. 또한 자동으로 로컬에 저장하기 때문에 새로 고침해도 작업이 사라지지 않고, ‘지우기'를 누르면 저장된 사본도 삭제됩니다.
- 마이크 버튼을 눌러도 반응이 없어요
- 브라우저가 Web Speech API를 노출하지 않거나(구버전 Firefox, 일부 시크릿 창) 마이크 권한이 거부된 상태예요. 주소창의 사이트 설정 아이콘을 확인해 보세요. 데스크톱이나 안드로이드의 Chrome, Edge가 가장 안정적입니다.
- 몇 초 만에 자동으로 멈춰요. 왜 그럴까요?
- 대부분의 브라우저는 자원 절약을 위해 일정 시간 침묵하면 자동으로 멈춥니다. 계속 말하면 유지돼요. 중간에 끊기면 마이크를 다시 눌러 주세요. 기존 전사는 그대로 남고 새로 들어온 말이 끝에 이어집니다.
- 쉼표, 마침표, 줄바꿈은 어떻게 넣나요?
- 구두점을 소리 내어 말하면 됩니다: '쉼표', '마침표', '물음표', '줄바꿈'. 엔진마다 인식률이 달라서 받아쓰기 후 빠르게 한 번 다듬는 게 정상적인 흐름이에요.
- 사투리가 잘못 인식돼요. 사전을 편집할 수 있나요?
- 인식 모델은 브라우저의 것이라 여기서 손댈 수 없어요. 가장 가까운 지역 변형(ko-KR 등)을 고르면 대부분의 발음 문제가 해결됩니다. 고유명사나 전문 용어는 전사 완료 후 직접 수정하고 복사하세요.