Что такое Конвертер Unicode-последовательностей?
Unicode Escape Converter превращает escape-последовательности (например, \u0041) в читаемые символы и обратно. Поддерживает JavaScript \uXXXX, HTML-сущности, Python и URL-кодирование процентами для отладки i18n-строк, декодирования ответов API или подготовки текста для кода.
Конвертер поддерживает шесть форматов экранирования. JavaScript-стиль \uXXXX покрывает основную многоязычную плоскость и использует суррогатные пары для эмодзи и редких CJK-символов. JavaScript ES6 \u{X} записывает любую кодовую точку одной последовательностью, поэтому современному коду суррогатные пары не нужны. HTML-сущности &#xHHHH; работают напрямую в разметке и письмах. CSS-стиль \HHHH ставится в свойство content в таблицах стилей. Python применяет \uXXXX для основной плоскости и \UXXXXXXXX для всего выше неё, поэтому вывод вставляется прямо в строковые литералы Python. URL-кодирование процентами (%XX) экранирует каждый байт UTF-8 для строк запроса и сегментов пути. Переключатель меняет регистр шестнадцатеричных цифр, а режим экранирования только не-ASCII оставляет печатные ASCII как есть, чтобы JSON и файлы локализации читались легко. Панель сопоставления показывает кодовую точку, официальное имя Unicode, сырые байты UTF-8, блок и категорию каждого глифа, а по клику на любую карточку копируется экранирование только этого символа.
Как использовать
- Шаг 1 — Вставьте escape-последовательности Unicode (например, \u0048\u0065\u006C\u006C\u006F) в поле ввода, чтобы декодировать их в читаемые символы.
- Шаг 2 — Или введите обычный текст (например, Hello), чтобы закодировать его в escape-последовательности Unicode в выбранном формате.
- Шаг 3 — Выберите формат экранирования (JavaScript \uXXXX, HTML &#xHHHH;, CSS \HHHH, Python \U или URL %XX) и скопируйте результат. Панель сопоставления называет каждый символ и разбирает его байты UTF-8, блок и категорию; нажмите карточку, чтобы скопировать одно экранирование.
Когда использовать
- Когда нужно расшифровать ответ API, в котором приходит \u00E9 вместо реального символа.
- При кодировании русского или другого не-ASCII текста в JSON или JavaScript, чтобы он не сломался, проходя через ASCII-only системы.
- При поиске невидимых юникод-символов (нулевой ширины, BOM), которые скрылись внутри скопированной строки.
Результат
API возвращает \u0041\u006E\u0064\u0072\u00E9, и вам нужно узнать настоящее имя. Вставьте последовательность и увидите «André» — затем сконвертируйте текст ответа обратно в escape-последовательности для тела запроса API.
Частые вопросы
- Почему некоторые символы в JavaScript кодируются двумя последовательностями \uXXXX?
- Кодовые точки выше U+FFFF (эмодзи, древние письменности, редкие CJK) находятся за пределами основной многоязычной плоскости. JavaScript представляет их парами UTF-16-суррогатов, поэтому эмодзи ракеты записывается как \uD83D\uDE80. С поддержкой ES2015 можно использовать \u{1F680}.
- Какой формат экранирования использовать в моём коде?
- Внутри строк JavaScript и JSON — \uXXXX, в чистой HTML-разметке — &#xHHHH;, в свойстве content в CSS — \HHHH, а для строк запроса и сегментов пути — URL-кодирование процентами %XX. JSON не понимает запись \u{...}, поэтому там всегда придерживайтесь \uXXXX и суррогатных пар.
- В чём разница между экранированием и HTML-сущностью?
- Оба указывают на одну и ту же кодовую точку Unicode. Экранирование (\u00E9) обрабатывает движок языка — JavaScript, CSS, Python. HTML-сущности (é или é) обрабатывает браузер при разборе разметки. Между контекстами они не взаимозаменяемы.
- Как найти невидимые юникод-символы в строке?
- Вставьте текст и переключитесь в режим кодирования. Таблица маппинга перечислит каждую кодовую точку по порядку — пробелы нулевой ширины (U+200B), метки порядка байтов (U+FEFF), неразрывные пробелы (U+00A0) появятся рядом со своими экранирующими последовательностями.
- Можно ли расшифровать \u-экранирование из исходников Python?
- Да. Последовательности \u0041 и \U0001F680 в Python имеют тот же синтаксис, что \uXXXX и \u{1F680} в JavaScript. Вставьте содержимое строки (без внешних кавычек и без префикса r), и декодер вернёт читаемый текст.
Похожие инструменты
Поиск рифм
Находите точные и приблизительные рифмы к любому слову
Решатель анаграмм
Найдите все допустимые анаграммы для любого слова
Поиск Unicode
Поиск символов Unicode по имени или коду
Кодировщик/Декодировщик URL
Кодирование и декодирование URL мгновенно
Фонетический алфавит НАТО
Преобразуйте текст в фонетический алфавит НАТО
Счётчик абзацев
Подсчитайте абзацы в тексте