Audio to MIDI変換を無料で!ブラウザだけで音声をMIDI化する完全ガイド
Audio to MIDI変換とは?無料でできるのか結論から答える
「弾いたギターのフレーズをMIDIにしたい」「口笛や鼻歌をピアノロールに落としたい」「録音した演奏をDAWで編集したい」——こういった悩みを持つ人がAudio to MIDI変換を検索しています。
結論から言うと、2024年現在、インストール不要・完全無料でブラウザだけからAudio to MIDI変換が可能です。Spotify社の研究チームが開発したBasic PitchをはじめとするAIモデルがブラウザ上で動作するようになり、専用ソフトなしに音声ファイルからMIDIトラックを生成できる時代になりました。
この記事では、Audio to MIDI変換の仕組みから具体的な操作手順、ギター・口笛・鼻歌など音源別のコツまで徹底的に解説します。
Audio to MIDI変換の仕組み|AIが音程を解析してMIDI化する
Audio to MIDI変換は、音声ファイルのピッチ(音程)・タイミング・音量をコンピュータが解析し、対応するMIDIノートとして出力するプロセスです。従来はMelodyneのような有料ソフトが必要でしたが、近年はディープラーニングベースのモデルが登場し、精度と速度が飛躍的に向上しました。
モノフォニックとポリフォニックの違い
Audio to MIDI変換には大きく2種類あります。
- モノフォニック変換:一度に1音しか出ない楽器(フルート・口笛・ボーカルメロディ)に向いている。精度が高く変換も速い。
- ポリフォニック変換:複数の音が同時に鳴る楽器(ギターコード・ピアノ)に対応。難易度が高く、AIモデルの性能差が出やすい。
口笛や鼻歌のような単音メロディは変換精度が非常に高く、初心者でも満足いく結果が得られます。ギターコードのようなポリフォニック音源は、変換後にピアノロールで微調整が必要なケースもあります。
代表的なAudio to MIDIエンジン
- Basic Pitch(Spotify):ブラウザ完結・無料。ONNX形式でブラウザ内推論。精度が高くポリフォニックにも対応。
- Melodyne(Celemony):業界標準の有料ソフト。最高精度だが有料(Essentialで約1.6万円〜)。
- AutoTrack(Celemony):DAWプラグイン版Melodyne。Studio One等に統合。
- MIDI-DDSP(Magenta):Googleの研究プロジェクト。楽器ごとの表情を再現しながらMIDI化。
【無料・ブラウザ完結】Basic Pitchを使ったAudio to MIDI変換の手順
最もおすすめの無料変換方法は、LA Studio(ブラウザDAW)に内蔵されたBasic Pitchエンジンを使う方法です。変換からMIDI編集まで同じ画面で完結するため、ファイルの移動が不要です。
Step 1:音声ファイルを準備する
対応フォーマットはWAV・MP3・OGG・FLACなど主要な音声形式すべて。録音済みの演奏ファイルを用意してください。
- 録音時間は短めのフレーズ(8〜32小節程度)が変換精度が高い
- バックグラウンドノイズが少ないほど精度が上がる(必要であれば先にAIノイズ除去で処理しておくと効果的)
- ボーカルや口笛の場合、伴奏と混ざっていると精度が下がる。ボーカル除去・ステム分離で単音トラックを先に抽出することを推奨
Step 2:LA StudioでAudio to MIDI変換を実行する
- ブラウザで https://la-studio.cc/editor を開く(インストール・登録不要)
- プレイリストに音声ファイルをドラッグ&ドロップしてオーディオリージョンを作成する
- リージョンを右クリック(または長押し)してコンテキストメニューを開く
- メニューから「Audio to MIDI(Basic Pitch)」を選択する
- ブラウザ内でONNXモデルが推論を実行し、数秒〜数十秒で完了する
- 変換完了後、MIDIリージョンがプレイリスト上の新しいトラックに自動配置される
- MIDIリージョンをダブルクリックしてピアノロールを開き、変換結果を確認・編集する
Step 3:ピアノロールで微調整する
AI変換は完璧ではないため、以下の点を確認しましょう。
- ノイズノート削除:本来意図していない短い音符(アーティキュレーションノイズ等)を削除する
- タイミング補正:クォンタイズ機能でノートを最近いグリッドにスナップさせる
- ベロシティ調整:強弱の再現性を確認し、必要に応じて各ノートのベロシティを修正する
- オクターブ確認:稀にオクターブがずれることがあるので試聴しながら確認する
Step 4:MIDIファイルとしてエクスポートする
- ピアノロール上で編集が完了したらウィンドウを閉じる
- MIDIリージョンを右クリックして「MIDIエクスポート」を選択する
- SMF(Standard MIDI File)形式でダウンロードされる
- ダウンロードしたMIDIファイルはCubase、Logic Pro、FL Studio、Ableton Live等どのDAWでも読み込み可能
音源別|Audio to MIDI変換のコツと注意点
ギター(単音フレーズ)の変換
ギターの単音ソロやリフはBasic Pitchで高精度に変換できます。ポイントは以下の通りです。
- 歪み(ディストーション)は少なめに録音する。クリーンやクランチトーンの方が倍音が整理されており変換精度が高い
- チョーキング・ビブラートはピッチが連続的に変動するため、変換後にノートが細かく分割されることがある。ピアノロールで手動修正が必要
- ハーモニクス音は通常ピッチより2〜3オクターブ高く検出されることがあるので注意
- 最終的なMIDIをDAWに持ち込んでシンセやピアノ音源に差し替えれば、ギターで打ち込んだような楽曲制作ができる
ギター(コード・ポリフォニック)の変換
複数弦を同時に弾くコードはAudio to MIDIの中で最も難易度が高い処理です。
- Basic Pitchはポリフォニック対応だが、複雑なコードボイシングでは音符の検出漏れや誤検出が起きやすい
- 変換後は「コードの骨格(ルート+3度+5度)」が残っているかを優先的に確認する
- ストロークのカッティングより、押さえたまま弾くアルペジオの方が変換精度が高い
口笛・鼻歌・ハミングの変換
口笛や鼻歌は単音で倍音がシンプルなため、Audio to MIDI変換との相性が抜群です。作曲アイデアをすぐにMIDIに変換したいときに最も実用的な方法です。
- 静かな環境でマイク録音するか、スマホのボイスメモアプリで録音してからブラウザに読み込む
- 一定のテンポで歌うとグリッドへのスナップが楽になる(メトロノームを流しながら録音するのがベスト)
- 「Voice to MIDI」機能を使えば、ブラウザ内でリアルタイム録音しながら直接MIDI化することも可能
- LA Studioにはブラウザ内で声を録音してMIDIトラックに変換するVoice to MIDI機能が内蔵されている
ベース・チェロなど中低音楽器の変換
- 低音域はBasic Pitchが若干苦手とするレンジ。オクターブ設定を確認すること
- サブベース(60Hz以下)の音は検出されにくいため、録音時にEQで80Hz以上を強調しておくと精度が上がる
- フレットレスベースやスライドはグライドが検出されやすく、変換後のMIDIに大量のピッチベンドイベントが発生する場合がある
Audio to MIDI変換の精度を上げる5つのコツ
- ノイズを事前に除去する:バックグラウンドのホワイトノイズや環境音はAIの判定精度を下げる。AIノイズ除去で前処理してから変換する
- 単一楽器の音源を使う:ドラムや伴奏が混ざっていると誤検出が増える。ステム分離で目的の楽器だけを抽出してから変換する
- サンプルレート44.1kHz以上で録音する:低品質な音声はAIの推論精度に影響する
- 短いフレーズに分割して変換する:長い音源より8〜16小節程度に分割した方が変換後の確認・修正が楽になる
- 変換後はピアノロールで必ず確認する:AI変換はあくまでドラフト。最終的な音楽表現は人間の手で仕上げることを前提にする
Basic Pitchとは?Spotifyが開発した無料AIエンジンの概要
Basic PitchはSpotify社の研究チームが2022年に発表したオープンソースのAudio-to-MIDI変換モデルです。論文では従来のDSPベース手法と比較して大幅に高い精度を達成したことが示されており、特にポリフォニック楽器(ギター・ピアノ)への対応を強みとしています。
モデルはONNX形式に変換されてブラウザ(WebAssembly / ONNX Runtime Web)上で動作するため、サーバーに音声データを送信することなくローカルでプライバシーを守りながら変換できます。これはセキュリティ面でも重要なメリットです。
変換後のMIDIをさらに活用する方法
Audio to MIDIで得たMIDIデータは、そのまま活用するだけでなく以下のような発展的な使い方ができます。
ソフトシンセへのアサイン
変換したMIDIトラックを、LA StudioのプラグインシンセサイザーであるVital・Surge XT・Dexedなどにアサインすることで、ギターで弾いたフレーズをシンセパッドやリードサウンドに変換できます。
コード解析とアレンジへの応用
ポリフォニック変換で得たMIDIコードを分析し、コード進行をベースにして新しいアレンジを展開することができます。既存楽曲のコード進行をMIDI化してリハーモナイズするテクニックとしても有効です。
他DAWへのエクスポート
LA StudioからSMFファイルをエクスポートして、Cubase・Logic Pro・Ableton Live・FL Studioなど任意のDAWにインポートすることで、好みの制作環境で作業を継続できます。
よくある質問
Q. Audio to MIDI変換は完全に自動でできますか?
A. AIによって変換プロセス自体は自動化されていますが、変換結果は100%完璧ではありません。特にポリフォニック音源(ギターコードなど)では変換後にピアノロールで微調整が必要なケースがほとんどです。単音のメロディ(口笛・鼻歌・フルートなど)は精度が高く、ほぼそのまま使えることも多いです。
Q. どんな音声フォーマットに対応していますか?
A. LA StudioのBasic Pitch変換はWAV・MP3・OGG・FLACなど主要な音声フォーマットに対応しています。スマホで録音したm4aファイルは、事前にMP3やWAVに変換してから読み込むことを推奨します。
Q. ドラムや打楽器の音もMIDIに変換できますか?
A. Basic Pitchはピッチ検出ベースのエンジンのため、音程が定まらないドラムや打楽器の変換には向いていません。ドラムのMIDI化には専用のオンセット検出(トランジェント検出)アルゴリズムが必要です。ドラムパターンを作成したい場合はピアノロールで直接打ち込む方が確実です。
Q. 変換したMIDIをCubaseやLogicにインポートできますか?
A. はい。LA StudioからエクスポートされるMIDIファイルはSMF(Standard MIDI File)形式のため、Cubase・Logic Pro・Ableton Live・FL Studio・Studio Oneなど、ほぼすべてのDAWでインポート可能です。
Q. 音声ファイルをアップロードするとデータはサーバーに送られますか?
A. LA StudioのBasic Pitch変換はブラウザ内のONNXランタイムで完結するため、音声データがサーバーに送信されることはありません。プライバシーを守りながら安全に変換できます。
まとめ|Audio to MIDI変換は今や無料・ブラウザだけで完結できる
かつては高額な専用ソフトが必要だったAudio to MIDI変換が、今ではSpotifyが開発したBasic PitchをはじめとするAIエンジンによってブラウザ上で無料実行できるようになりました。口笛・鼻歌のような単音メロディなら特に高精度で変換でき、ギターの単音フレーズも十分実用的な結果が得られます。
ブラウザDAWであるLA StudioではBasic Pitchを使ったAudio to MIDI変換が完全無料・インストール不要で利用でき、変換からピアノロール編集・MIDIエクスポートまでを一つの画面で完結させることができます。「まずは試してみたい」という方は、インストールや登録なしにすぐ使い始めることができます。