什麼是人聲消除?

Vocal Remover 利用立體聲中央通道相位抵消技術,從音樂中提取或去除人聲。產生兩個檔案:可用於卡拉OK的伴奏軌道,以及單獨的人聲軌道用於翻唱或Remix。音訊在你的瀏覽器內處理,不會上傳到任何伺服器。

處理引擎使用 4096 點短時傅立葉轉換,視窗重疊率 75%,然後從你指定的頻段中減去立體聲中央訊號。中央寬度調得越大,去除的人聲越徹底,但同時會削弱位於中間的鼓組與貝斯。把頻段限定在 200 Hz 至 8 kHz 之間,可以保留大鼓與銅鈸的存在感。

使用方法

  1. 上傳立體聲音訊。單聲道檔案無法處理,因為本技術需要左右兩個獨立的聲道。
  2. 拖動「中央寬度」滑桿控制抵消範圍,設定「頻率範圍」決定在哪個頻段執行抵消。
  3. 試聽伴奏或人聲,可降速到 0.5× 或循環某段慢慢調,再下載 WAV、MP3 或 OGG。

何時使用

  • 為沒有官方伴奏版的歌曲製作卡拉OK背景音。
  • 從成品歌曲中提取乾聲,用來做 Remix、混音或翻唱墊底。
  • 從電影立體聲音軌中分離對白,方便後續替換配音或同人配音。

結果

想跟唱一首沒有官方卡拉OK版的流行歌。把 MP3 拖進去,中央寬度保持預設,頻率範圍調到 200 Hz 至 8 kHz,下載伴奏後匯入手機卡拉OK App 就能唱。

常見問題

為什麼伴奏裡還能隱約聽到人聲?
相位抵消只能去除完全居中的聲音。殘響尾音、和聲、即興段落往往略微偏離正中央,所以會殘留。加大中央寬度可以改善,但同時也會削弱小鼓與大鼓。
效果跟專業的人聲分離軟體一樣嗎?
不一樣。Spleeter、Demucs、LALAL.AI 這類工具用神經網路識別音色,鼓組保留完好,單聲道也能處理。相位抵消是上世紀 90 年代的老方法,速度快、完全免費,但聽感會粗糙一些。
為什麼我的 MP3 處理後什麼聲音都沒有?
請檢查檔案是否為真正的立體聲。很多 MP3,尤其是電台錄音或 YouTube 抽取的版本,實際上是「雙單聲道」(左右兩聲道完全相同)。兩個聲道一模一樣時沒有差異可減,輸出就是靜音。
「頻率範圍」具體起什麼作用?
它把抵消操作限定在人聲所在的頻段,一般是 200 Hz 到 8 kHz。這個範圍之外的聲音原樣通過,所以即使把中央寬度拉滿,貝斯的低頻與銅鈸的高頻也不會掉。
音訊會上傳到伺服器嗎?
不會。Web Audio API 與 FFT 全部在這個瀏覽器分頁內執行,關閉頁面後記憶體就清空。一切在本機完成,不過檔案特別大時,會受到裝置記憶體的限制。

相關工具