什麼是重複檔案搜尋器?

這款重複檔案尋找工具透過在裝置上私密計算SHA-256雜湊值來掃描並辨識完全相同的檔案。不會上傳任何檔案。將重複檔案分組顯示、逐一比對,選擇保留哪些副本。

SHA-256 是逐位元組比對,即使檔名或日期不一樣也認得出重複,所以同一張照片複製到三個備份資料夾只會標記一次。可以分批加檔案、看即時雜湊進度,挑出哪些副本要保留。完整報告可匯出 CSV 離線整理。

使用方法

  1. 拖放檔案或選擇一個資料夾,開始掃描其中的重複檔案。
  2. 等待工具為每個檔案計算SHA-256雜湊值,並將相同的檔案自動歸組。
  3. 檢視重複檔案分組,比對檔案詳細資訊(名稱、大小、日期),然後匯出CSV報告以便規劃清理。

何時使用

  • 把舊手機和筆電的備份合併到一顆硬碟之後,回收磁碟空間。
  • 把 Lightroom 匯入前的多機位拍攝原始檔案中重複的找出來。
  • 稽核團隊共用的 Dropbox 資料夾,看哪些 PDF 被同事重複上傳了。

結果

一位攝影師將不同備份資料夾中的500張照片拖入工具。工具在三個資料夾中找到了47組完全相同的重複檔案,可安全釋放120MB空間,同時不會遺失任何獨特照片。

常見問題

檔名相同就一定是重複嗎?
不一定,這也是這個工具用內容雜湊的原因。兩台相機各自的 IMG_001.jpg 內容完全不同;反過來,兩個檔名毫無關係但位元組一樣的檔案才是真正的重複,會被分到同一組。
可以掃整個資料夾包括子資料夾嗎?
可以。把資料夾拉到上傳區,工具會遞迴讀取裡面的每一個檔案。系統隱藏檔以及 macOS 的 .DS_Store 雜物也會被雜湊,你可以根據報告決定要不要忽略或清掉。
一次能處理多少檔案?
雜湊是一個一個檔案進行,所以即使幾千個檔案,記憶體也不會吃緊。瓶頸在讀取速度,現代筆電大約每秒 100 MB。20 GB 的混合相片大約三分鐘可以跑完。
可以找出近似重複嗎?像同一張照片的兩個解析度。
不行。SHA-256 是密碼學雜湊,只要差一個像素,雜湊就完全不同。本工具只能抓出完全一樣的副本。要比對視覺相似的圖片需要 perceptual hashing,那是另一套演算法。
工具會自動幫我刪除重複的檔案嗎?
不會,這是刻意的設計。它只負責報告找到了什麼,並提供 CSV 匯出。實際刪除你在 Finder、檔案總管或命令列裡進行,這樣保留哪一份永遠由你自己決定。

相關工具