Что такое Аудио в MIDI?

Audio to MIDI преобразует аудиозаписи в данные MIDI-нот, определяя высоту звука. Загрузите вокальную мелодию, гитарный рифф или любое монофоническое аудио и получите MIDI-файл для импорта в любую DAW.

Распознавание высоты тона построено на алгоритме YIN: он покадрово оценивает основную частоту и привязывает каждый устойчивый кадр к ближайшему полутону. Лучше всего работает с монофоническими источниками: вокалом, флейтой, сольной гитарой, свистом. Полифонические аккорды и ударные дают непредсказуемый результат.

Как использовать

  1. Загрузите аудиофайл (WAV, MP3 или OGG) с монофонической мелодией — лучше всего работает с одной нотой за раз.
  2. Настройте минимальный порог уверенности и длительность ноты для фильтрации шума и коротких транзиентов.
  3. Просмотрите обнаруженные ноты на пиано-ролле, затем скачайте результат в виде стандартного MIDI-файла.

Когда использовать

  • Записать вокальную идею на телефон и превратить её в MIDI-набросок в DAW.
  • Расшифровать мелодию флейты или свиста в ноты, не подбирая на слух.
  • Переиграть гитарный риф синтезатором, переключив MIDI на другой тембр.

Результат

Певец записывает идею вокальной мелодии на телефон. Загружает MP3 сюда, инструмент определяет высоту и тайминг каждой спетой ноты и экспортирует MIDI-файл, который можно перетащить в Ableton Live для воспроизведения синтезатором.

Частые вопросы

Почему теряются ноты или появляются случайные?
Алгоритм плохо переносит шёпотные атаки, вибрато шире полутона и наложенные ноты. Поднимите минимальную уверенность, чтобы отфильтровать слабые детекции, и запишите дубль с минимумом реверберации. Играйте по одной ноте за раз.
Можно расшифровать целую песню с аккордами и барабанами?
Нет. Алгоритм рассчитан на одну ноту в моменте. Несколько одновременно звучащих нот сбивают его, и получается каша. Перед загрузкой выделите одну дорожку (только вокал, только бас). Полифонический транскрипт требует гораздо более тяжёлой модели.
Какие форматы аудио можно загрузить?
WAV, MP3, OGG и FLAC поддерживаются. Декодирование выполняется локально через Web Audio API, поэтому подойдёт всё, что воспроизводится на этом устройстве. Моно и стерео принимаются; стерео сводится в моно перед анализом.
Почему ноты сдвинуты на октаву вверх или вниз?
Детектор иногда цепляется за гармонику вместо основного тона — отсюда октавные ошибки. Сдвиньте весь результат через регулятор «Октава». Записи с богатыми низами (бас-гитара) подвержены этому больше всего.
Сохраняет ли экспорт MIDI исходный тайминг?
Да. Время старта и длительность записаны в миллисекундах, поэтому MIDI совпадает с темпом оригинала и не привязывается к сетке. Если нужны квантованные ноты, обработайте их в DAW после импорта.

Похожие инструменты