什麼是檔案類型辨識器?

檔案類型辨識器透過讀取檔案的二進位簽章(魔術位元組)來偵測檔案的真實格式,而非僅依賴副檔名。適用於辨識被重新命名或無副檔名的檔案,以及驗證檔案是否與宣稱的格式一致。

拖入一個或多個被改名或無副檔名的檔案,頁面會讀取開頭位元組(即所謂的魔術數),再將這一指紋與涵蓋 PNG、JPEG、HEIC、AVIF、PDF、ZIP、MP3、MP4、ELF 等數十種格式的庫進行比對。基於 ZIP 的檔案會被深入查看,以揭示真實格式(DOCX、XLSX、APK、EPUB、JAR、OpenDocument)並列出其成員。已知的勒索軟體副檔名與檔頭標記會觸發醒目的警告,同時符合兩種格式的檔頭會被標記為多語義檔案。每筆結果都會顯示真實的 MIME 類型、規範副檔名、辨識可信度分數、完整的 SHA-256 指紋以及檔頭的十六進位+ASCII 傾印——還可選擇匯出 TXT 或 JSON 報告,全部在你的裝置上計算,不上傳任何內容。

使用方法

  1. 步驟一——拖入或選擇一個需要辨識類型的檔案。
  2. 步驟二——工具讀取檔案的二進位標頭資訊,並與已知簽章資料庫進行比對。
  3. 步驟三——查看偵測到的MIME類型、副檔名和格式說明。

何時使用

  • 下載下來名為 report.txt 的檔案打不開純文字,要釐清究竟是什麼格式。
  • 信件附件副檔名可疑或缺失,在開啟之前先做安全甄別。
  • 確認匯出的檔案真的是你要的格式(例如真正的 JPEG,而不是改名的 BMP)。

結果

同事寄來一個名為「report」但沒有副檔名的檔案:拖入後發現它實際上是application/pdf格式——重新命名為report.pdf即可正常開啟。

常見問題

為什麼不能直接看副檔名?
副檔名很容易被無意或刻意更改。叫 photo.jpg 的檔案,實際可能是 PNG、PDF,甚至是 ZIP 壓縮檔。Magic number 寫在位元組裡,幾乎總能反映檔案真正的格式。
能辨識所有檔案格式嗎?
涵蓋 50 多種常見格式——圖片、影片、音訊、壓縮檔、文件、可執行檔、字型與資料庫。冷門或私有格式會回到通用的 application/octet-stream,這時下方的十六進位檔頭仍可用於手動查詢。
可以區分 .docx 與 .xlsx 嗎?兩者底層都是 ZIP。
可以。當外層簽章是 ZIP 時,工具會進入壓縮檔,尋找像 word/document.xml(DOCX)、xl/workbook.xml(XLSX)、ppt/presentation.xml(PPTX)、AndroidManifest.xml(APK)、META-INF/container.xml(EPUB) 或 JAR manifest 這類關鍵成員。結果會同時給出外層格式(ZIP)與真實內層格式(例如 Word 文件),並附上壓縮檔主要成員的清單。
Magic bytes 跟雜湊值或校驗碼是同一件事嗎?
並不完全相同。雜湊值概括整個檔案,而魔術位元組只是充當格式識別的開頭幾個位元組。兩張不同的 PNG 圖片擁有相同的魔術數,雜湊值卻完全不同。本工具兩者都會顯示:標明格式的魔術位元組,以及為該具體檔案留下指紋的完整 SHA-256 雜湊。
檔案會離開我的裝置嗎?
不會。類型辨識只讀取開頭幾百個位元組,並直接在本頁面進行比對。計算 SHA-256 指紋時會在本機讀取整個檔案,因此超大檔案需要片刻,但任何內容都不會被複製或傳送到任何地方——每個位元組都留在你的裝置上。

相關工具