Question 1

音が抜けたり、変な音が混ざるのはなぜ?

Accepted Answer

息混じりの発音、半音以上のビブラート、重なった音は検出が苦手です。最小信頼度を上げて弱い検出を弾き、リバーブの少ない乾いた録音を使ってください。一度に一音ずつ鳴らすのがコツです。

Question 2

コードとドラムが入った曲を丸ごと採譜できますか?

Accepted Answer

できません。アルゴリズムは同時に一つの音程しか想定しません。複数音が重なるとぐちゃぐちゃになります。アップロード前にトラックを分離してください(ボーカルのみ、ベースのみ等)。ポリフォニック採譜にはもっと重いモデルが必要です。

Question 3

対応している音声フォーマットは?

Accepted Answer

WAV、MP3、OGG、FLACが使えます。デコードはWeb Audio APIを使ってこの端末上で行うため、ここで再生できるものはほぼ通ります。モノラルもステレオもOK。ステレオは解析前にモノラルへミックスダウンされます。

Question 4

検出された音が1オクターブ上または下にずれるのはなぜ?

Accepted Answer

ピッチ検出器は基音ではなく倍音にロックすることがあり、オクターブエラーが起きます。「オクターブ」コントロールで全体を上下に動かしてください。低音が豊富な録音(エレキベース)で特に起きやすい現象です。

Question 5

書き出したMIDIは元のタイミングを保ちますか?

Accepted Answer

保ちます。ノート開始時刻と長さはミリ秒で書き込まれるので、MIDIは元のテンポと一致し、グリッドにスナップされません。クオンタイズが欲しい場合はDAW側で読み込んだ後に処理してください。

音声をMIDIに変換

音声をMIDIに変換とは？