보컬 제거이란?
Vocal Remover는 스테레오 음악에서 중앙 채널 위상 상쇄 기법으로 보컬을 빼내거나 제거합니다. 노래방용 인스트루멘털 트랙과 리믹스용 분리 보컬, 이렇게 두 파일이 나옵니다. 오디오는 브라우저 탭 안에서 처리되며 서버로 올라가지 않습니다.
처리 엔진은 4096 샘플 윈도, 75퍼센트 중첩으로 단시간 푸리에 변환을 수행한 다음 지정한 대역에서 스테레오 가운데 성분을 빼냅니다. Center Width가 넓을수록 보컬은 더 깔끔히 사라지지만 가운데 정위된 드럼과 베이스도 함께 깎입니다. 200 Hz~8 kHz로 대역을 좁히면 킥드럼과 심벌은 또렷이 남습니다.
사용 방법
- 스테레오 오디오 파일을 업로드하세요. 모노 파일은 좌우 채널이 독립적으로 필요하기 때문에 처리할 수 없습니다.
- 「Center Width」 슬라이더로 가운데 성분을 얼마나 지울지, 「Frequency Range」로 어느 대역에서 상쇄를 적용할지 설정합니다.
- 인스트루멘털이나 분리 보컬을 들어보고, 0.5×로 늦추거나 구간을 반복해 세밀하게 맞춘 뒤 WAV, MP3, OGG 중에서 다운로드합니다.
사용 시기
- 공식 인스트루멘털이 없는 곡의 노래방 반주를 직접 만들고 싶을 때.
- 완성된 곡에서 보컬만 뽑아 리믹스, 매시업, 커버 베드로 활용할 때.
- 스테레오 영화 사운드트랙에서 대사만 분리해 팬더빙용 음원으로 교체할 때.
결과
공식 MR 음원이 없는 곡을 부르고 싶을 때, MP3 파일을 올리고 Center Width는 기본값으로 두고 Frequency Range를 200 Hz에서 8 kHz로 좁혀 인스트루멘털을 받은 뒤 노래방 앱에 불러옵니다.
자주 묻는 질문
- 인스트루멘털에 보컬 잔향이 살짝 남는 이유는?
- 위상 상쇄는 두 채널에 똑같이 들어 있는 소리만 제거합니다. 리버브 꼬리, 코러스, 애드리브 등은 살짝 가운데에서 벗어나 있기 때문에 살아남습니다. Center Width를 키우면 도움이 되지만 스네어와 킥도 함께 약해집니다.
- 전문 스템 분리 도구와 동일한 결과가 나오나요?
- 다릅니다. Spleeter, Demucs, LALAL.AI 등은 음색으로 보컬을 학습한 신경망을 사용해 드럼을 그대로 두고도 분리가 가능하며 모노도 처리합니다. 위상 상쇄는 1990년대 기법으로 빠르고 무료지만, 듣다 보면 거친 느낌이 분명합니다.
- MP3를 처리했더니 무음이 나옵니다.
- 파일이 진짜 스테레오인지 확인하세요. 라디오 녹음이나 유튜브에서 뽑은 MP3 다수는 좌우가 완전히 동일한 「듀얼 모노」입니다. 두 채널이 똑같으면 뺄 게 없어서 결과가 무음이 됩니다.
- Frequency Range는 정확히 무슨 역할인가요?
- 보컬이 자리한 대역(보통 200 Hz~8 kHz)에만 상쇄를 적용합니다. 이 범위 바깥은 원음 그대로 통과하므로 Center Width를 최대로 올려도 베이스의 저역과 심벌의 고역은 사라지지 않습니다.
- 오디오 파일이 서버로 업로드되나요?
- 아닙니다. Web Audio API와 FFT가 이 탭 안에서 동작하며, 페이지를 닫으면 버퍼는 메모리에서 사라집니다. 모든 처리가 로컬에서 이루어지므로 매우 긴 트랙은 장치 RAM 한도에 묶입니다.