보컬 제거이란?

Vocal Remover는 스테레오 음악에서 중앙 채널 위상 상쇄 기법으로 보컬을 빼내거나 제거합니다. 노래방용 인스트루멘털 트랙과 리믹스용 분리 보컬, 이렇게 두 파일이 나옵니다. 오디오는 브라우저 탭 안에서 처리되며 서버로 올라가지 않습니다.

처리 엔진은 4096 샘플 윈도, 75퍼센트 중첩으로 단시간 푸리에 변환을 수행한 다음 지정한 대역에서 스테레오 가운데 성분을 빼냅니다. Center Width가 넓을수록 보컬은 더 깔끔히 사라지지만 가운데 정위된 드럼과 베이스도 함께 깎입니다. 200 Hz~8 kHz로 대역을 좁히면 킥드럼과 심벌은 또렷이 남습니다.

사용 방법

  1. 스테레오 오디오 파일을 업로드하세요. 모노 파일은 좌우 채널이 독립적으로 필요하기 때문에 처리할 수 없습니다.
  2. 「Center Width」 슬라이더로 가운데 성분을 얼마나 지울지, 「Frequency Range」로 어느 대역에서 상쇄를 적용할지 설정합니다.
  3. 인스트루멘털이나 분리 보컬을 들어보고, 0.5×로 늦추거나 구간을 반복해 세밀하게 맞춘 뒤 WAV, MP3, OGG 중에서 다운로드합니다.

사용 시기

  • 공식 인스트루멘털이 없는 곡의 노래방 반주를 직접 만들고 싶을 때.
  • 완성된 곡에서 보컬만 뽑아 리믹스, 매시업, 커버 베드로 활용할 때.
  • 스테레오 영화 사운드트랙에서 대사만 분리해 팬더빙용 음원으로 교체할 때.

결과

공식 MR 음원이 없는 곡을 부르고 싶을 때, MP3 파일을 올리고 Center Width는 기본값으로 두고 Frequency Range를 200 Hz에서 8 kHz로 좁혀 인스트루멘털을 받은 뒤 노래방 앱에 불러옵니다.

자주 묻는 질문

인스트루멘털에 보컬 잔향이 살짝 남는 이유는?
위상 상쇄는 두 채널에 똑같이 들어 있는 소리만 제거합니다. 리버브 꼬리, 코러스, 애드리브 등은 살짝 가운데에서 벗어나 있기 때문에 살아남습니다. Center Width를 키우면 도움이 되지만 스네어와 킥도 함께 약해집니다.
전문 스템 분리 도구와 동일한 결과가 나오나요?
다릅니다. Spleeter, Demucs, LALAL.AI 등은 음색으로 보컬을 학습한 신경망을 사용해 드럼을 그대로 두고도 분리가 가능하며 모노도 처리합니다. 위상 상쇄는 1990년대 기법으로 빠르고 무료지만, 듣다 보면 거친 느낌이 분명합니다.
MP3를 처리했더니 무음이 나옵니다.
파일이 진짜 스테레오인지 확인하세요. 라디오 녹음이나 유튜브에서 뽑은 MP3 다수는 좌우가 완전히 동일한 「듀얼 모노」입니다. 두 채널이 똑같으면 뺄 게 없어서 결과가 무음이 됩니다.
Frequency Range는 정확히 무슨 역할인가요?
보컬이 자리한 대역(보통 200 Hz~8 kHz)에만 상쇄를 적용합니다. 이 범위 바깥은 원음 그대로 통과하므로 Center Width를 최대로 올려도 베이스의 저역과 심벌의 고역은 사라지지 않습니다.
오디오 파일이 서버로 업로드되나요?
아닙니다. Web Audio API와 FFT가 이 탭 안에서 동작하며, 페이지를 닫으면 버퍼는 메모리에서 사라집니다. 모든 처리가 로컬에서 이루어지므로 매우 긴 트랙은 장치 RAM 한도에 묶입니다.

관련 도구