Question 1

Почему некоторые символы в JavaScript кодируются двумя последовательностями \uXXXX?

Accepted Answer

Кодовые точки выше U+FFFF (эмодзи, древние письменности, редкие CJK) находятся за пределами основной многоязычной плоскости. JavaScript представляет их парами UTF-16-суррогатов, поэтому эмодзи ракеты записывается как \uD83D\uDE80. С поддержкой ES2015 можно использовать \u{1F680}.

Question 2

Какой формат экранирования использовать в моём коде?

Accepted Answer

Внутри строк JavaScript и JSON — \uXXXX, в чистой HTML-разметке — &#xHHHH;, в свойстве content в CSS — \HHHH, а для строк запроса и сегментов пути — URL-кодирование процентами %XX. JSON не понимает запись \u{...}, поэтому там всегда придерживайтесь \uXXXX и суррогатных пар.

Question 3

В чём разница между экранированием и HTML-сущностью?

Accepted Answer

Оба указывают на одну и ту же кодовую точку Unicode. Экранирование (\u00E9) обрабатывает движок языка — JavaScript, CSS, Python. HTML-сущности (&#xE9; или &eacute;) обрабатывает браузер при разборе разметки. Между контекстами они не взаимозаменяемы.

Question 4

Как найти невидимые юникод-символы в строке?

Accepted Answer

Вставьте текст и переключитесь в режим кодирования. Таблица маппинга перечислит каждую кодовую точку по порядку — пробелы нулевой ширины (U+200B), метки порядка байтов (U+FEFF), неразрывные пробелы (U+00A0) появятся рядом со своими экранирующими последовательностями.

Question 5

Можно ли расшифровать \u-экранирование из исходников Python?

Accepted Answer

Да. Последовательности \u0041 и \U0001F680 в Python имеют тот же синтаксис, что \uXXXX и \u{1F680} в JavaScript. Вставьте содержимое строки (без внешних кавычек и без префикса r), и декодер вернёт читаемый текст.

Конвертер Unicode-последовательностей

Конвертировать

Соответствие символов

Что такое Конвертер Unicode-последовательностей?

Как использовать

Когда использовать

Результат

Частые вопросы

Похожие инструменты

Поиск рифм

Решатель анаграмм

Поиск Unicode

Кодировщик/Декодировщик URL

Фонетический алфавит НАТО

Счётчик абзацев

Конвертер Unicode-последовательностей

Конвертировать

Соответствие символов