重複ファイル検索ツールとは?

この重複ファイル検索ツールは、選択したファイルをスキャンし、デバイス上でSHA-256ハッシュをプライベートに計算して完全一致する重複を特定します。ファイルがアップロードされることはありません。重複をグループ化して並べて確認し、どのコピーを残すか決定できます。

SHA-256 はファイル名や更新日時が違ってもバイト単位で完全一致を検出するので、3 つのバックアップフォルダにコピーされた同じ写真を一度にまとめてくれます。ファイルをバッチで追加し、ハッシュ計算の進捗をリアルタイムに見ながら、グループごとに残すコピーを選べます。レポート全体は CSV で書き出せます。

使い方

  1. 重複をスキャンしたいファイルをドラッグ&ドロップするか、フォルダを選択してください。
  2. ツールが各ファイルのSHA-256ハッシュを計算し、同一のファイルをグループ化するのを待ちます。
  3. 重複グループを確認し、ファイルの詳細(名前、サイズ、日付)を比較して、整理計画のためにレポートをCSVとしてエクスポートします。

使用するタイミング

  • 古いスマホとノートのバックアップを 1 台のドライブにまとめたあと、ディスク容量を取り戻したいとき。
  • 複数台のカメラで撮影した RAW を Lightroom に読み込む前に、重複を見つけたいとき。
  • チームで共有している Dropbox フォルダで、同じ PDF が何度も再アップロードされていないか監査したいとき。

結果

写真家が異なるバックアップフォルダから500枚の写真をドロップします。ツールは3つのフォルダにまたがる47個の完全な重複を見つけ、ユニークな写真を失うことなく安全に120MBを回収できることを示します。

よくある質問

ファイル名が同じなら必ず重複ファイルなの?
いいえ、だからこそ本ツールは中身でハッシュを取ります。違うカメラの IMG_001.jpg は同じ名前でもバイトが違います。逆に、まったく違う名前でもバイトが同じファイルは本物の重複で、同じグループにまとめられます。
サブフォルダ込みでフォルダ全体をスキャンできる?
できます。ドロップ領域にフォルダをドラッグすれば、中の全ファイルを再帰的に読み込みます。システム隠しファイルや macOS の .DS_Store もハッシュされるので、レポートを見ながら無視するか削除するか決められます。
どのくらいの規模まで扱えるの?
ハッシュは 1 ファイルずつ計算するので、何千ファイルあってもメモリ消費は低いままです。実質的な上限は読み込み速度で、最近のノート PC でおよそ 100MB/秒。20GB の写真混在でも 3 分ほどで終わります。
同じ写真の解像度違いのような、ほぼ重複も見つけられる?
いいえ。SHA-256 は暗号学的ハッシュなので、1 ピクセル違うだけでハッシュは完全に変わります。本ツールは完全一致のみを検出します。見た目の類似を判定するには別種のアルゴリズム、知覚ハッシュが必要です。
重複ファイルは自動で削除してくれるの?
いいえ、これは意図的な設計です。本ツールは見つけた内容を報告し、CSV で書き出すまでしかしません。削除は Finder、エクスプローラー、コマンドラインなど、あなたが選んだ手段で行うので、グループごとにどのコピーを残すかは常にあなたの判断です。

関連ツール