텍스트 음성 변환이란?

텍스트 음성 변환은 기기의 음성 합성 기능으로 텍스트를 소리 내어 읽어줍니다. 음성을 선택하고, 속도와 음높이를 조절하여 핸즈프리로 들을 수 있습니다. 모든 처리는 기기 내에서 수행됩니다.

음성은 운영체제의 음성 합성 엔진에서 직접 가져오기 때문에 Windows, macOS, Android, iOS, 리눅스 배포판에 따라 목록이 달라집니다. 속도는 0.1배에서 10배, 음높이는 0에서 2까지 조정할 수 있습니다. Chrome과 Edge에서는 탭 공유 대화상자를 통해 재생 결과를 WebM이나 MP4 오디오 파일로 녹음·다운로드할 수도 있습니다.

사용 방법

  1. 듣고 싶은 텍스트를 텍스트 영역에 입력하거나 붙여넣으세요 — 한 문장부터 전체 기사까지 모든 길이가 가능합니다.
  2. 드롭다운에서 음성을 선택하세요 — 사용 가능한 음성은 기기와 운영 체제에 따라 다릅니다.
  3. 슬라이더로 속도와 음높이를 원하는 대로 조절한 다음 재생을 누르세요. 필요에 따라 일시 정지 및 정지 컨트롤을 사용하세요.

사용 시기

  • 요리하거나 출퇴근하면서 시간이 없어 읽지 못하는 기사나 PDF를 귀로 듣고 싶을 때.
  • 작성한 메일이나 보고서 초안을 보내기 전에 어색한 문장을 찾기 위해 들어보고 싶을 때.
  • 외국어 문장을 0.75배 속도로 들으면서 발음을 따라 연습하고 싶을 때.

결과

언어 학습자가 프랑스어 문단을 붙여넣고 프랑스어 음성을 선택한 후 속도를 0.75배로 낮추고 주의 깊게 들으며 발음과 듣기 이해력을 연습합니다.

자주 묻는 질문

음성 드롭다운에 아무 항목도 보이지 않는 이유는?
Chrome 같은 일부 환경에서는 음성 목록을 비동기로 불러옵니다. 페이지를 열고 1~2초 기다리거나 한 번 새로 고치면 보입니다. 리눅스에서는 대부분의 배포판이 TTS 엔진을 기본으로 포함하지 않아 espeak이나 festival 같은 엔진을 따로 설치해야 할 수 있습니다.
오디오를 MP3로 바로 받을 수 있나요?
녹음하고 다운로드 버튼을 사용하세요. 녹음은 탭 오디오를 Chromium 계열에서는 WebM, Safari에서는 MP4로 저장합니다. 권한 대화상자에서 '탭 오디오 공유'를 반드시 체크해야 합니다. MP3가 필요하면 다운로드한 파일을 음성 변환기로 한 번 더 변환하면 됩니다.
같은 음성인데 친구 컴퓨터에서는 왜 다르게 들리나요?
운영체제마다 자체 음성 합성 엔진이 있기 때문입니다. macOS의 Apple Siri 음성과 Windows Edge의 신경망 음성은 결이 많이 다릅니다. 이름이 같아 보여도 버전에 따라 뒤에서 동작하는 모델이 미묘하게 다를 수 있습니다.
글자 수 제한이 있나요?
엄격한 상한은 없지만 대부분의 음성 엔진은 내부적으로 약 32KB 단위로 텍스트를 나눕니다. 여러 기사를 한꺼번에 넣는 식의 아주 긴 입력은 도중에 잘리기도 하므로 그런 경우 여러 번 나눠서 붙여 넣으세요.
붙여 넣은 글이 외부로 전송되나요?
전송되지 않습니다. 음성 합성은 기기 내부 TTS 엔진에서 처리되고, 녹음된 오디오는 다운로드할 때까지 로컬 메모리에만 머무릅니다. 텍스트도 오디오도 어떤 서버로도 업로드되지 않습니다.

관련 도구