ファイル形式判別ツールとは?
File Type Identifierは、拡張子ではなくバイナリシグネチャ(マジックバイト)を読み取ってファイルの正体を検出するツールです。拡張子が変更されたファイルや拡張子のないファイルの特定、ファイル形式の検証に役立ちます。
名前を変えた、または拡張子のないファイルを一つでも複数でもドロップすると、ページが先頭バイト(いわゆるマジックナンバー)を読み取り、その指紋を PNG・JPEG・HEIC・AVIF・PDF・ZIP・MP3・MP4・ELF など数十種類を収めたライブラリと照合します。ZIP ベースのファイルは内部を覗いて実際の形式(DOCX・XLSX・APK・EPUB・JAR・OpenDocument)を特定し、メンバーを一覧表示します。既知のランサムウェアの拡張子やヘッダーマーカーは目に見える警告を出し、二つの形式を同時に満たすヘッダーはポリグロットとして印が付きます。各結果には本当の MIME タイプ、正規の拡張子、判定の信頼度スコア、完全な SHA-256 指紋、ヘッダーの hex+ASCII ダンプが表示され、任意で TXT または JSON のレポートも得られます。すべて端末上で計算され、何もアップロードされません。
使い方
- ステップ1 — 種類を特定したいファイルをドロップまたは選択します。
- ステップ2 — ツールがファイルのバイナリヘッダーを読み取り、既知のシグネチャと照合します。
- ステップ3 — 検出されたMIMEタイプ、ファイル拡張子、形式の説明を確認します。
使用するタイミング
- report.txt という名前のダウンロードがプレーンテキストとして開けないときの調査。
- 拡張子が怪しい、あるいは付いていないメール添付を開く前に種類を確かめる場面。
- 書き出したファイルが指定通りの形式かを確認(本物のJPEGか、リネームしただけのBMPか)。
結果
同僚から拡張子なしの「report」というファイルが届いた場合:ドロップするとapplication/pdfであることが判明し、report.pdfにリネームして通常通り開けます。
よくある質問
- 拡張子だけ見れば十分ではないですか?
- 拡張子は故意でも偶然でも簡単に変えられます。photo.jpg というファイルが実はPNG、PDF、あるいはZIPアーカイブだった、ということは珍しくありません。マジックナンバーはバイト内部に書き込まれており、ほぼ常に実体を正しく示します。
- あらゆる形式を判別できますか?
- 画像、動画、音声、アーカイブ、ドキュメント、実行ファイル、フォント、データベースなど50種類以上の一般的なフォーマットに対応しています。マイナーな独自形式は汎用の application/octet-stream にフォールバックしますが、16進ヘッダを手がかりに手動で検索できます。
- .docx と .xlsx を見分けられますか? どちらも中身はZIPですよね。
- はい。外側のシグネチャが ZIP の場合、ツールはアーカイブの中を覗き込み、word/document.xml(DOCX)、xl/workbook.xml(XLSX)、ppt/presentation.xml(PPTX)、AndroidManifest.xml(APK)、META-INF/container.xml(EPUB)、JAR マニフェストといった決定打となるメンバーを探します。結果には基本フォーマット(ZIP)と実体フォーマット(例:Word 文書)が両方表示され、主要なメンバーの一覧も添えられます。
- マジックバイトはハッシュやチェックサムと同じものですか?
- 厳密には違います。ハッシュはファイル全体を要約しますが、マジックバイトは形式を示す先頭の数バイトにすぎません。異なる二枚の PNG 画像は同じマジックナンバーを持ちますが、ハッシュはまったく別物です。本ツールはその両方を表示します。形式を示すマジックバイトと、ファイルそのものを特定する完全な SHA-256 ハッシュです。
- ファイルが端末の外に出ることはありますか?
- いいえ。種類の判定は先頭の数百バイトだけを読み取り、このページ上で照合します。SHA-256 のフィンガープリントを計算する際はファイル全体をローカルで読み込むため、非常に大きなファイルでは少し時間がかかりますが、どこかへコピーや送信が行われることはなく、すべてのバイトはお使いの端末に留まります。