Question 1

Warum fehlen Noten oder erscheinen seltsame Ausschläge?

Accepted Answer

Die Erkennung kämpft mit hauchigen Ansätzen, Vibrato über einen Halbton hinaus und überlappenden Noten. Den Mindest-Konfidenz-Regler höher ziehen, dann fallen schwache Treffer weg. Trocken aufnehmen, eine Note nach der anderen.

Question 2

Kann ich einen kompletten Song mit Akkorden und Drums transkribieren?

Accepted Answer

Nein. Der Algorithmus geht von einer einzelnen Tonhöhe pro Zeitpunkt aus. Gleichzeitig klingende Noten machen ihn ratlos und das Ergebnis wird unbrauchbar. Vorher die Spur isolieren (nur Gesang, nur Bass). Polyphone Transkription braucht ein deutlich größeres Modell.

Question 3

Welche Audioformate sind erlaubt?

Accepted Answer

WAV, MP3, OGG und FLAC laufen. Das Decoding läuft lokal über die Web Audio API – alles, was auf diesem Gerät abspielbar ist, wird akzeptiert. Mono und Stereo sind erlaubt; Stereo wird vor der Analyse zu Mono gemischt.

Question 4

Warum sind die Noten um eine Oktave verschoben?

Accepted Answer

Tonhöhen-Detektoren rasten manchmal auf eine Oberton statt auf den Grundton ein, das führt zu Oktavfehlern. Mit dem Oktav-Regler die ganze Ausgabe verschieben. Aufnahmen mit viel Tiefbass (E-Bass) sind besonders anfällig.

Question 5

Bleibt das Timing im exportierten MIDI erhalten?

Accepted Answer

Ja. Notenanfänge und -längen werden in Millisekunden geschrieben, das MIDI folgt dem Originaltempo und rastet nicht auf ein Raster ein. Wer Quantisierung möchte, macht das nach dem Import in der DAW.

Audio zu MIDI

Was ist Audio zu MIDI?

Anleitung

Wann verwenden

Ergebnis

Häufige Fragen

Ähnliche Tools

Spektrumanalysator

Mono-zu-Stereo-Konverter

Audio-Bitrate-Konverter

Audio-Crossfade

Chorus-Effekt

Wellenform-Bildgenerator

Audio zu MIDI