Что такое Поиск дубликатов файлов?

Этот инструмент поиска дубликатов сканирует выбранные файлы и находит точные копии, вычисляя хеши SHA-256 приватно на вашем устройстве. Файлы не загружаются на сервер. Группируйте дубликаты, сравнивайте их и решайте, какие копии оставить.

SHA-256 ловит дубликаты побайтово, даже если имена файлов и даты разные, поэтому одна и та же фотография в трёх папках резервных копий помечается один раз. Добавляйте файлы пачками, следите за прогрессом хеша в реальном времени и сравнивайте группы, прежде чем что-то удалять. Полный отчёт можно выгрузить в CSV.

Как использовать

  1. Перетащите файлы или выберите папку с файлами, которые хотите проверить на дубликаты.
  2. Дождитесь, пока инструмент вычислит SHA-256 хеши для каждого файла и сгруппирует идентичные файлы.
  3. Просмотрите группы дубликатов, сравните детали файлов (имя, размер, дата) и экспортируйте отчёт в формате CSV для планирования очистки.

Когда использовать

  • Возврат места на диске после объединения старых бэкапов телефона и ноутбука на один накопитель.
  • Поиск дублей RAW-снимков с многокамерной съёмки до импорта в Lightroom.
  • Аудит общей папки Dropbox, в которую коллеги перезаливали одни и те же PDF.

Результат

Фотограф загружает 500 фотографий из разных папок резервных копий. Инструмент находит 47 точных дубликатов в трёх папках и показывает, что 120 МБ можно безопасно освободить без потери уникальных фотографий.

Частые вопросы

Файлы с одинаковыми именами — всегда дубликаты?
Нет, и именно поэтому инструмент считает хеш по содержимому. Две фотографии IMG_001.jpg с разных камер имеют разные байты. Зато два файла с совсем разными именами, но одинаковым содержимым — настоящие дубликаты и попадут в одну группу.
Сканирует ли он целую папку с подпапками?
Да. Перетащите папку в зону загрузки, и инструмент рекурсивно прочтёт каждый файл внутри. Системные скрытые файлы и .DS_Store от macOS тоже попадут в отчёт — потом можно решить, удалять их или игнорировать.
Какой объём пачки он выдержит?
Хеш считается по одному файлу, поэтому память остаётся низкой даже при тысячах файлов. Реальный потолок — скорость чтения: около 100 МБ в секунду на современном ноутбуке. Двадцать гигабайт смешанных фотографий обрабатываются примерно за три минуты.
Найдёт ли он почти-дубликаты, например одну и ту же фотографию в двух разрешениях?
Нет. SHA-256 — криптографический хеш: меняется один пиксель — меняется весь хеш. Инструмент находит только идентичные копии. Для визуально похожих файлов нужно перцептивное хеширование, а это другой тип алгоритма.
Удаляет ли инструмент дубликаты сам?
Нет, и это сделано специально. Он только показывает, что нашёл, и даёт выгрузить CSV. Удаление вы выполняете сами в Finder, Проводнике или командной строке, чтобы окончательное решение по каждой группе оставалось за вами.

Похожие инструменты