Что такое Визуализатор пробельных символов?
Whitespace Visualizer делает невидимые символы в тексте видимыми. Пробелы, табуляции, переводы строк, возвраты каретки, неразрывные пробелы и символы нулевой ширины получают собственные цветные маркеры, чтобы вы могли быстро найти ошибки форматирования, несовпадения отступов или лишние символы в файлах данных.
Каждый тип пробельного символа имеет свой цвет: пробелы — оранжевые точки, табуляции — стрелки, переводы строки — знак абзаца, символы нулевой ширины — перечёркнутые круги. Инструмент считает каждый тип отдельно, и вы сразу видите, использует ли файл табы или пробелы, смешаны ли они, и не затесались ли невидимые символы, ломающие парсеры. Он также отмечает расширенные невидимые символы — мягкие переносы, соединители слов, знаки направления слева направо и справа налево, а также широкие пробелы, — которые обычные редакторы скрывают полностью.
Как использовать
- Шаг 1 — Вставьте или введите текст в поле ввода. Пробельные символы мгновенно подсвечиваются цветовыми маркерами.
- Шаг 2 — Выберите, какие типы пробельных символов подсвечивать: пробелы, табуляции, переводы строк, возвраты каретки, неразрывные пробелы и символы нулевой ширины, а также расширенные невидимые символы — мягкие переносы, соединители слов, знаки направления и широкие пробелы. Задайте ширину табуляции 2, 4 или 8 столбцов и включите либо отключите нумерацию строк под свой редактор.
- Шаг 3 — Просмотрите статистику символов с количеством каждого типа пробельных символов и при необходимости скопируйте аннотированный текст.
Когда использовать
- Понять, почему CSV или TSV не парсится в pandas или Excel.
- Проверить вставленный код на смесь табов и пробелов перед коммитом в strict-lint репо.
- Найти соединители нулевой ширины или BOM, попавшие в переведённые строки интерфейса.
Результат
CSV-файл не поддаётся парсингу. Вставьте несколько строк в визуализатор и обнаружьте, что в качестве разделителей смешаны табуляции и пробелы, а в строке заголовка скрыт символ нулевой ширины, из-за которого имя первого столбца не совпадает.
Частые вопросы
- Что такое символ нулевой ширины и почему он ломает вещи?
- Такие символы, как U+200B (пробел нулевой ширины) и U+FEFF (BOM), не занимают видимого места, но считаются как байты. Часто проникают из Word, скопированных PDF или экспорта терминала, и заставляют сравнение строк падать так, что без этого инструмента это выглядит мистикой.
- Как понять, какой отступ в файле — табы или пробелы?
- Вставьте файл и посмотрите на счётчики. Если Tabs ноль, а Spaces много — отступы пробелами. Наоборот — табами. Оба ненулевые обычно означают проблему, особенно в Python или Makefile, где смешивать запрещено.
- Работает ли с нелатинским текстом, скажем арабским или китайским?
- Да. Визуализатор идёт по кодовым точкам Unicode, поэтому корректно обрабатывает арабский, CJK и эмодзи. Нелатинские символы отображаются обычным образом; маркерами заменяются только пробелы, независимо от письменности.
- В чём разница между обычным пробелом и неразрывным?
- Обычный пробел (U+0020) позволяет браузеру переносить строку в этом месте. Неразрывный (U+00A0) не даёт перенести, удерживая два слова вместе. При копировании из Word или PDF часто попадают NBSP, которые выглядят одинаково, но ломают поиск, split и trim.
- Можно ли экспортировать или скопировать аннотированный текст?
- Можно. Кнопка копирования помещает текст с маркерами в буфер обмена, удобно вставить в код-ревью или баг-репорт, когда надо показать, какой именно пробельный символ виноват.
Похожие инструменты
Поиск рифм
Находите точные и приблизительные рифмы к любому слову
Решатель анаграмм
Найдите все допустимые анаграммы для любого слова
Поиск Unicode
Поиск символов Unicode по имени или коду
Кодировщик/Декодировщик URL
Кодирование и декодирование URL мгновенно
Фонетический алфавит НАТО
Преобразуйте текст в фонетический алфавит НАТО
Счётчик абзацев
Подсчитайте абзацы в тексте