Что такое Удаление дублирующихся строк?
Удаление дублирующихся строк убирает повторяющиеся строки из любого текста. Вставьте список, лог-файл или набор данных и получите только уникальные строки в исходном порядке или отсортированными по алфавиту в обе стороны, по длине или в случайном порядке.
Строки сравниваются после необязательной обрезки пробелов и приведения регистра, поэтому 'Apple', 'apple ' и ' apple' сливаются в одну запись, если включить соответствующие переключатели. Панель «До» подсвечивает каждую группу дубликатов со счётчиком, чтобы было видно, что именно объединилось. Поставьте «Оставить» в режим «Убрать все повторы», чтобы остались только строки, встречающиеся ровно один раз. Лимита на число строк нет, можно вставить текст или загрузить файл .txt либо .csv прямо с устройства — ничего никуда не отправляется.
Как использовать
- Вставьте или введите текст с повторяющимися строками в поле ввода.
- Настройте параметры: учёт регистра, обрезка пробелов, сохранение первой или последней копии и выбор порядка сортировки вывода.
- Очищенный текст обновляется на лету по мере ввода — никаких кнопок. Следите за панелями «До», «После» и «Удалённые» рядом, сверьтесь с таблицей частоты, а затем скопируйте или скачайте результат.
Когда использовать
- Чистка столбца в CSV, где один клиент повторяется в нескольких почти одинаковых строках.
- Свести лог из десяти тысяч строк к уникальным сообщениям перед разбором инцидента.
- Объединить почтовые списки с разных мероприятий, чтобы не отправить одному адресату два раза одно письмо.
Результат
Разработчик вставляет 500 записей лога с повторяющимися сообщениями об ошибках и сокращает их до 47 уникальных строк, мгновенно выявляя реальные проблемы.
Частые вопросы
- Сохраняется ли порядок строк после вставки?
- Оставьте «Сортировку вывода» на «Исходном порядке» — и первая копия каждой строки останется там, куда вы её вставили. Переключите на А → Я, Я → А, по длине или случайный, чтобы переупорядочить уникальные строки; алфавитный порядок удобен перед diff или коммитом. Хотите сохранить последнюю копию? Включите «Оставлять последнее».
- Как работает учёт регистра?
- Если опция включена, 'Apple' и 'apple' считаются разными строками. Выключите её, и они слипаются в одну; инструмент сохранит написание первого вхождения, поэтому ваш исходный стиль не пострадает.
- Что делает «Обрезать пробелы»?
- Перед сравнением удаляет пробелы и табы в начале и конце каждой строки. ' hello ' и 'hello' становятся равны. Пробелы внутри строки не трогаются, поэтому 'hello world' (два пробела) остаётся отличной от 'hello world' (один).
- Можно оставить только те строки, которые повторяются?
- Не как основной результат, но панель «Удалённые» справа показывает каждую отброшенную строку с её исходным номером, так что дубликаты можно читать или копировать напрямую, не выискивая их в панели «До». Для обратной задачи — оставить только строки, встречающиеся один раз, — переключите «Оставить» на «Убрать все повторы».
- Есть ли ограничение на длину вставленного текста?
- Жёсткого предела нет. Проверяли на файлах больше миллиона строк, скорость зависит от устройства. Текст не покидает браузер, поэтому конфиденциальные списки можно обрабатывать прямо здесь.
Похожие инструменты
Поиск рифм
Находите точные и приблизительные рифмы к любому слову
Решатель анаграмм
Найдите все допустимые анаграммы для любого слова
Поиск Unicode
Поиск символов Unicode по имени или коду
Кодировщик/Декодировщик URL
Кодирование и декодирование URL мгновенно
Фонетический алфавит НАТО
Преобразуйте текст в фонетический алфавит НАТО
Счётчик абзацев
Подсчитайте абзацы в тексте