ボーカル除去とは?

Vocal Remover はステレオ楽曲から、センターチャンネルの位相打ち消しでボーカルを抜き出したり除去したりするツールです。出力はカラオケ向けインスト版と、リミックス用に分離したボーカル版の 2 ファイル。音声処理はブラウザのタブ内で完結し、サーバーには一切アップロードされません。

処理エンジンは 4096 サンプルの短時間フーリエ変換を 75% オーバーラップで適用し、指定した帯域からステレオの中央成分を差し引きます。センター幅を広げるほどボーカルがしっかり消えますが、中央に定位したドラムやベースも同時に削れます。帯域を 200 Hz〜8 kHz に絞れば、キックドラムとシンバルの存在感を残せます。

使い方

  1. ステレオの音声ファイルをアップロードします。本手法は左右独立した 2 チャンネルが必要なため、モノラルでは処理できません。
  2. 「センター幅」スライダーで打ち消し量を、「周波数範囲」で打ち消しを適用する帯域を調整します。
  3. インスト版・ボーカル版を試聴し、0.5× に落としたり一部をループして微調整したうえで、WAV・MP3・OGG のいずれかでダウンロードします。

使用するタイミング

  • 公式インスト音源のない曲のカラオケ伴奏を自分で用意したいとき。
  • 完成済みの楽曲からボーカルだけを抜いて、リミックスやマッシュアップの素材にする。
  • ステレオ映画音声からセリフを分離し、ファン制作の吹き替えと差し替える。

結果

公式のカラオケ音源が存在しない曲を歌いたいとき、MP3 を放り込み、センター幅は初期値のまま、周波数範囲を 200 Hz〜8 kHz に絞ってインスト版を書き出し、カラオケアプリに読み込ませて練習します。

よくある質問

インスト版にうっすらとボーカルが残るのはなぜですか?
位相打ち消しは左右に同量で振られた音だけを除去できます。リバーブの残響、コーラス、アドリブなどはわずかに中央から外れていることが多く、削り切れずに残ります。センター幅を広げれば改善しますが、スネアやキックも痩せていきます。
プロ向けのステム分離ツールと同じ結果になりますか?
なりません。Spleeter、Demucs、LALAL.AI などはニューラルネットで音色を学習してボーカルを抽出するため、ドラムを残したまま処理でき、モノラルにも対応します。位相打ち消しは 1990 年代由来の手法で、無料・高速ですが粗さは隠せません。
MP3 を処理したら無音になってしまいます。
ファイルが本当にステレオかご確認ください。ラジオ録音や YouTube から抽出した MP3 は、見た目はステレオでも左右が同じ「デュアルモノ」になっていることが多く、左右が完全に同じだと差し引いて 0 になり、無音になります。
「周波数範囲」は具体的に何をしていますか?
人声が存在する帯域(おおむね 200 Hz〜8 kHz)に打ち消し処理を限定します。範囲外の音はそのまま通過するため、センター幅を最大にしてもベースの低域やシンバルの煌めきは生き残ります。
音声はサーバーへ送られますか?
送られません。Web Audio API と FFT はこのタブ内だけで動作し、ページを閉じればメモリは解放されます。完全にローカル処理ですが、その分、極端に長いファイルは端末の RAM 容量に縛られます。

関連ツール