Was ist Audio zu MIDI?
Audio zu MIDI wandelt Audioaufnahmen in MIDI-Notendaten um, indem es die Tonhöhe erkennt. Laden Sie eine gesungene Melodie, ein Gitarrenriff oder jede andere monophone Aufnahme hoch und erhalten Sie eine herunterladbare MIDI-Datei, die Sie in jede DAW importieren können.
Die Tonhöhenerkennung nutzt den YIN-Algorithmus, der Frame für Frame die Grundfrequenz schätzt und stabile Frames auf den nächsten Halbton quantisiert. Funktioniert am besten mit monophonen Quellen: Stimme, Flöte, Solo-Gitarre, Pfeifen. Polyphone Akkorde oder Drums liefern unvorhersehbare Ergebnisse.
Anleitung
- Laden Sie eine Audiodatei hoch (WAV, MP3 oder OGG), die eine monophone Melodie enthält — einzelne Töne nacheinander funktionieren am besten.
- Passen Sie den Mindest-Konfidenzwert und die Notendauer an, um Rauschen und kurze Transienten herauszufiltern.
- Sehen Sie sich die erkannten Noten in der Pianorolle an und laden Sie das Ergebnis als Standard-MIDI-Datei herunter.
Wann verwenden
- Eine Gesangsidee am Handy aufnehmen und als MIDI-Skizze in die DAW ziehen.
- Eine Flöten- oder Pfeifmelodie in Notation übertragen, ohne sie nach Gehör herauszuhören.
- Ein Akustikgitarren-Lick als Synth-Linie wiederverwenden, indem das MIDI mit einem anderen Klang getriggert wird.
Ergebnis
Ein Sänger nimmt eine Gesangsmelodie-Idee auf dem Handy auf. Er lädt die MP3 hier hoch, das Tool erkennt Tonhöhe und Timing jeder gesungenen Note und exportiert eine MIDI-Datei, die er in Ableton Live zieht, um sie mit einem Synthesizer abzuspielen.
Häufige Fragen
- Warum fehlen Noten oder erscheinen seltsame Ausschläge?
- Die Erkennung kämpft mit hauchigen Ansätzen, Vibrato über einen Halbton hinaus und überlappenden Noten. Den Mindest-Konfidenz-Regler höher ziehen, dann fallen schwache Treffer weg. Trocken aufnehmen, eine Note nach der anderen.
- Kann ich einen kompletten Song mit Akkorden und Drums transkribieren?
- Nein. Der Algorithmus geht von einer einzelnen Tonhöhe pro Zeitpunkt aus. Gleichzeitig klingende Noten machen ihn ratlos und das Ergebnis wird unbrauchbar. Vorher die Spur isolieren (nur Gesang, nur Bass). Polyphone Transkription braucht ein deutlich größeres Modell.
- Welche Audioformate sind erlaubt?
- WAV, MP3, OGG und FLAC laufen. Das Decoding läuft lokal über die Web Audio API – alles, was auf diesem Gerät abspielbar ist, wird akzeptiert. Mono und Stereo sind erlaubt; Stereo wird vor der Analyse zu Mono gemischt.
- Warum sind die Noten um eine Oktave verschoben?
- Tonhöhen-Detektoren rasten manchmal auf eine Oberton statt auf den Grundton ein, das führt zu Oktavfehlern. Mit dem Oktav-Regler die ganze Ausgabe verschieben. Aufnahmen mit viel Tiefbass (E-Bass) sind besonders anfällig.
- Bleibt das Timing im exportierten MIDI erhalten?
- Ja. Notenanfänge und -längen werden in Millisekunden geschrieben, das MIDI folgt dem Originaltempo und rastet nicht auf ein Raster ein. Wer Quantisierung möchte, macht das nach dem Import in der DAW.
Ähnliche Tools
Spektrumanalysator
Visualisieren Sie das Audio-Frequenzspektrum in Echtzeit
Mono-zu-Stereo-Konverter
Mono-Audiodateien in Stereo konvertieren
Audio-Bitrate-Konverter
Bitrate von Audiodateien ändern
Audio-Crossfade
Überblendung zwischen zwei Audiospuren
Chorus-Effekt
Chorus-Audioeffekt hinzufügen
Wellenform-Bildgenerator
Audio-Wellenform als Bild exportieren