오디오를 MIDI로 변환이란?

Audio to MIDI는 음높이를 감지하여 오디오 녹음을 MIDI 노트 데이터로 변환합니다. 보컬 멜로디, 기타 리프 또는 단음 오디오를 업로드하면 어떤 DAW에서든 가져올 수 있는 MIDI 파일을 다운로드할 수 있습니다.

음높이 검출은 YIN 알고리즘으로 프레임마다 기본 주파수를 추정하고 안정된 프레임을 가장 가까운 반음으로 양자화합니다. 모노포닉 소스(한 번에 한 음)에서 가장 정확합니다: 보컬, 플루트, 솔로 기타, 휘파람. 폴리포닉 화음이나 드럼은 예측 불가능한 결과를 냅니다.

사용 방법

  1. 단음 멜로디가 포함된 오디오 파일(WAV, MP3 또는 OGG)을 업로드하세요 — 한 번에 하나의 음이 가장 잘 인식됩니다.
  2. 최소 신뢰도 임계값과 노트 지속 시간을 조정하여 노이즈와 짧은 트랜지언트를 필터링하세요.
  3. 피아노 롤에서 감지된 노트를 미리 확인한 후 표준 MIDI 파일로 다운로드하세요.

사용 시기

  • 휴대폰으로 녹음한 보컬 아이디어를 DAW에 MIDI 스케치로 옮기기.
  • 플루트나 휘파람 멜로디를 귀로 채보하지 않고 악보로 바꾸기.
  • 어쿠스틱 기타 릭을 신스 라인으로 재활용하기. MIDI를 다른 악기로 트리거하면 질감이 달라집니다.

결과

가수가 휴대폰으로 보컬 멜로디 아이디어를 녹음합니다. 여기에 MP3를 업로드하면 도구가 각 음의 음높이와 타이밍을 감지하고, Ableton Live에 드래그하여 신디사이저로 재생할 수 있는 MIDI 파일을 내보냅니다.

자주 묻는 질문

왜 음이 빠지거나 이상한 음이 잡힙니까?
거친 호흡 어택, 반음 이상의 비브라토, 겹치는 음에서는 검출이 약합니다. 최소 신뢰도 슬라이더를 올려 약한 결과를 걸러내고, 리버브가 적은 깨끗한 녹음을 쓰세요. 한 번에 한 음씩 발음하면 더 잘 잡힙니다.
코드와 드럼이 같이 있는 곡 전체를 채보할 수 있나요?
안 됩니다. 알고리즘은 한 순간에 한 음만 있다고 가정합니다. 여러 음이 동시에 울리면 혼동되어 결과가 뒤죽박죽이 됩니다. 업로드 전에 한 트랙만 분리하세요(보컬만, 베이스만). 폴리포닉 채보는 훨씬 무거운 모델이 필요합니다.
어떤 오디오 포맷을 지원하나요?
WAV, MP3, OGG, FLAC 모두 됩니다. 디코딩은 Web Audio API로 이 기기에서 바로 처리하므로, 여기서 재생되는 파일이면 받아들입니다. 모노와 스테레오 둘 다 가능하고, 스테레오는 분석 전에 모노로 합쳐집니다.
검출된 음이 전체적으로 한 옥타브 높거나 낮은 이유는?
음높이 검출기가 기본음 대신 배음에 걸리면 옥타브 오류가 생깁니다. 옥타브 컨트롤로 전체 결과를 한 칸 올리거나 내리세요. 저역이 풍부한 녹음(베이스기타)에서 자주 발생합니다.
내보낸 MIDI는 원래 타이밍을 유지하나요?
네. 노트 시작 시간과 길이는 밀리초 단위로 기록되어 MIDI가 원본 템포와 일치하고 그리드에 스냅되지 않습니다. 양자화가 필요하면 DAW에서 가져온 뒤 처리하세요.

관련 도구