오디오를 MIDI로 변환이란?
Audio to MIDI는 음높이를 감지하여 오디오 녹음을 MIDI 노트 데이터로 변환합니다. 보컬 멜로디, 기타 리프 또는 단음 오디오를 업로드하면 어떤 DAW에서든 가져올 수 있는 MIDI 파일을 다운로드할 수 있습니다.
음높이 검출은 YIN 알고리즘으로 프레임마다 기본 주파수를 추정하고 안정된 프레임을 가장 가까운 반음으로 양자화합니다. 모노포닉 소스(한 번에 한 음)에서 가장 정확합니다: 보컬, 플루트, 솔로 기타, 휘파람. 폴리포닉 화음이나 드럼은 예측 불가능한 결과를 냅니다.
사용 방법
- 단음 멜로디가 포함된 오디오 파일(WAV, MP3 또는 OGG)을 업로드하세요 — 한 번에 하나의 음이 가장 잘 인식됩니다.
- 최소 신뢰도 임계값과 노트 지속 시간을 조정하여 노이즈와 짧은 트랜지언트를 필터링하세요.
- 피아노 롤에서 감지된 노트를 미리 확인한 후 표준 MIDI 파일로 다운로드하세요.
사용 시기
- 휴대폰으로 녹음한 보컬 아이디어를 DAW에 MIDI 스케치로 옮기기.
- 플루트나 휘파람 멜로디를 귀로 채보하지 않고 악보로 바꾸기.
- 어쿠스틱 기타 릭을 신스 라인으로 재활용하기. MIDI를 다른 악기로 트리거하면 질감이 달라집니다.
결과
가수가 휴대폰으로 보컬 멜로디 아이디어를 녹음합니다. 여기에 MP3를 업로드하면 도구가 각 음의 음높이와 타이밍을 감지하고, Ableton Live에 드래그하여 신디사이저로 재생할 수 있는 MIDI 파일을 내보냅니다.
자주 묻는 질문
- 왜 음이 빠지거나 이상한 음이 잡힙니까?
- 거친 호흡 어택, 반음 이상의 비브라토, 겹치는 음에서는 검출이 약합니다. 최소 신뢰도 슬라이더를 올려 약한 결과를 걸러내고, 리버브가 적은 깨끗한 녹음을 쓰세요. 한 번에 한 음씩 발음하면 더 잘 잡힙니다.
- 코드와 드럼이 같이 있는 곡 전체를 채보할 수 있나요?
- 안 됩니다. 알고리즘은 한 순간에 한 음만 있다고 가정합니다. 여러 음이 동시에 울리면 혼동되어 결과가 뒤죽박죽이 됩니다. 업로드 전에 한 트랙만 분리하세요(보컬만, 베이스만). 폴리포닉 채보는 훨씬 무거운 모델이 필요합니다.
- 어떤 오디오 포맷을 지원하나요?
- WAV, MP3, OGG, FLAC 모두 됩니다. 디코딩은 Web Audio API로 이 기기에서 바로 처리하므로, 여기서 재생되는 파일이면 받아들입니다. 모노와 스테레오 둘 다 가능하고, 스테레오는 분석 전에 모노로 합쳐집니다.
- 검출된 음이 전체적으로 한 옥타브 높거나 낮은 이유는?
- 음높이 검출기가 기본음 대신 배음에 걸리면 옥타브 오류가 생깁니다. 옥타브 컨트롤로 전체 결과를 한 칸 올리거나 내리세요. 저역이 풍부한 녹음(베이스기타)에서 자주 발생합니다.
- 내보낸 MIDI는 원래 타이밍을 유지하나요?
- 네. 노트 시작 시간과 길이는 밀리초 단위로 기록되어 MIDI가 원본 템포와 일치하고 그리드에 스냅되지 않습니다. 양자화가 필요하면 DAW에서 가져온 뒤 처리하세요.