什麼是音訊轉MIDI?
音訊轉MIDI工具透過音高偵測,將音訊錄音轉換為MIDI音符資料。上傳人聲旋律、吉他即興片段或任何單音音訊,即可取得可下載的MIDI檔案,匯入任何數位音訊工作站使用。
音高偵測使用 YIN 演算法,逐幀估算基頻,再把穩定的幀量化到最近的半音。單音來源效果最好:人聲、長笛、獨奏吉他、口哨旋律。和弦、鼓組等複音內容,辨識結果不可控。
使用方法
- 上傳包含單音旋律的音訊檔案(WAV、MP3或OGG格式)——每次演奏一個音符效果最佳。
- 調整最低信心閾值和最短音符時長,以過濾雜訊和短暫的瞬態訊號。
- 在鋼琴捲簾窗中預覽偵測到的音符,然後將結果下載為標準MIDI檔案。
何時使用
- 把手機錄下的哼唱靈感,轉成 MIDI 拖進 DAW 做編曲草稿。
- 將長笛或口哨旋律轉成樂譜,不用再憑耳朵扒帶。
- 把吉他樂句的旋律抓出來,用合成器音色重新觸發,變成另一種質感的版本。
結果
一位歌手用手機錄了一段即興哼唱的旋律。將MP3上傳到這裡,工具會偵測每個唱出音符的音高和時值,匯出MIDI檔案後直接拖入Ableton Live,用合成器回放。
常見問題
- 為什麼有些音漏掉,或者多出奇怪的音?
- 氣聲起音、超過半音的顫音、重疊的音都會干擾偵測。把「最低信心」拉高可以濾掉不穩定的判斷。錄音乾一點、殘響少一點會更準。一次唱一個音,不要連著唱。
- 可以扒整首帶和弦跟鼓的歌嗎?
- 不行。演算法只認單音,多個音同時響會讓它混亂,輸出會很雜。請先把人聲或貝斯獨立匯出再上傳。複音扒帶需要更重的模型,本工具不處理這件事。
- 支援哪些音訊格式?
- WAV、MP3、OGG、FLAC 都可以。解碼由 Web Audio API 直接在本裝置完成,因此本裝置能播放的檔案基本都能辨識。單聲道、立體聲都行,立體聲會合併成單聲道再分析。
- 偵測出來的音整體高了或低了一個八度,怎麼回事?
- 音高偵測器有時會鎖到泛音而不是基頻,造成八度偏移。用「八度」控制項把整段上下挪一格即可。低頻豐富的錄音(像電貝斯)最容易出現這狀況。
- 匯出的 MIDI 會保留原本的時值嗎?
- 會。每個音符的起始時間和長度都以毫秒寫入,所以 MIDI 的節奏跟原錄音對齊,不會自動對到網格。要量化的話,匯入 DAW 後再處理。