유니코드 이스케이프 변환기이란?

Unicode Escape Converter는 이스케이프 시퀀스(예: \u0041)를 읽을 수 있는 문자로 변환하거나 반대로 변환합니다. JavaScript \uXXXX, HTML 엔터티, Python 표기법, URL 퍼센트 인코딩을 지원하여 i18n 문자열 디버깅, API 응답 디코딩, 코드용 텍스트 준비에 활용할 수 있습니다.

변환기는 여섯 가지 이스케이프 형식을 지원합니다. JavaScript 스타일의 \uXXXX는 기본 다국어 평면을 다루고, 이모지나 잘 쓰지 않는 CJK 문자는 서러게이트 페어로 표시합니다. JavaScript ES6의 \u{X}는 어떤 코드 포인트라도 한 시퀀스로 표기하므로 최신 코드에서는 서러게이트 페어가 필요 없습니다. HTML 숫자 엔티티 &#xHHHH;는 HTML 마크업과 메일에 그대로 쓸 수 있습니다. CSS 스타일 \HHHH는 스타일시트의 content 속성에 넣습니다. Python은 기본 평면에 \uXXXX, 그 이상에는 \UXXXXXXXX를 써서 결과를 Python 문자열 리터럴에 바로 붙여넣을 수 있습니다. URL 퍼센트 인코딩 %XX는 UTF-8 바이트마다 이스케이프하여 쿼리 문자열과 경로 세그먼트에 적합합니다. 16진수의 대소문자를 토글로 바꿀 수 있고, 비 ASCII만 이스케이프하는 모드는 출력 가능한 ASCII를 그대로 두어 JSON과 i18n 파일을 읽기 쉬운 상태로 유지합니다. 매핑 패널에 글리프마다 코드포인트, 공식 Unicode 이름, 원시 UTF-8 바이트, 블록, 카테고리가 표시되며, 카드를 클릭하면 그 문자의 이스케이프만 복사됩니다.

사용 방법

  1. 1단계 — 유니코드 이스케이프 시퀀스(예: \u0048\u0065\u006C\u006C\u006F)를 입력 필드에 붙여넣어 읽을 수 있는 문자로 디코딩합니다.
  2. 2단계 — 또는 일반 텍스트(예: Hello)를 입력하여 선택한 형식의 유니코드 이스케이프 시퀀스로 인코딩합니다.
  3. 3단계 — 이스케이프 형식(JavaScript \uXXXX, HTML &#xHHHH;, CSS \HHHH, Python \U 또는 URL %XX)을 선택하고 결과를 복사합니다. 매핑 패널이 각 문자의 이름을 알려 주고 UTF-8 바이트, 블록, 카테고리를 분해해 보여 줍니다. 카드를 클릭하면 이스케이프 하나를 복사할 수 있습니다.

사용 시기

  • API 응답이 é 대신 \u00E9로 들어왔을 때 실제 문자를 확인하고 싶을 때.
  • 한글처럼 비 ASCII 텍스트를 JSON이나 JavaScript 소스로 인코딩해서 ASCII만 통과시키는 시스템을 무사히 지나가게 하고 싶을 때.
  • 복사해 온 문자열 안에 숨어 있는 제로 폭 공백, BOM 같은 보이지 않는 유니코드 문자를 점검할 때.

결과

API가 \u0041\u006E\u0064\u0072\u00E9를 반환하고 실제 이름이 필요합니다. 붙여넣으면 'André'를 확인할 수 있고, 응답 텍스트를 다시 이스케이프 시퀀스로 변환하여 API 페이로드에 사용할 수 있습니다.

자주 묻는 질문

JavaScript에서 어떤 문자는 왜 \uXXXX 두 개로 표현되나요?
U+FFFF를 넘는 코드포인트(이모지, 고대 문자, 드문 CJK 문자)는 기본 다국어 평면 밖에 있습니다. JavaScript는 이를 UTF-16 서러게이트 페어로 표현하므로 로켓 이모지가 \uD83D\uDE80이 됩니다. ES2015를 지원하면 \u{1F680}로도 쓸 수 있습니다.
코드에 어떤 이스케이프 형식을 써야 하나요?
JavaScript나 JSON 문자열에서는 \uXXXX, 순수 HTML 마크업에서는 &#xHHHH;, CSS의 content 속성에서는 \HHHH, 쿼리 문자열과 경로 세그먼트에서는 URL %XX 퍼센트 인코딩을 사용합니다. JSON은 \u{...} 표기를 지원하지 않으므로 JSON에서는 \uXXXX와 서러게이트 페어를 그대로 사용하세요.
이스케이프 시퀀스와 HTML 엔티티는 어떻게 다른가요?
둘 다 동일한 유니코드 코드포인트를 가리킵니다. 이스케이프(\u00E9)는 언어 런타임(JavaScript, CSS, Python)이 처리하고, HTML 엔티티(é나 é)는 브라우저가 마크업을 파싱할 때 처리합니다. 문맥을 바꿔서 그대로 쓸 수는 없습니다.
문자열 안에 숨은 보이지 않는 유니코드 문자를 찾으려면?
텍스트를 붙여 넣고 인코딩 모드로 바꾸면 매핑 표가 각 코드포인트를 순서대로 보여 줍니다. 제로 폭 공백(U+200B), 바이트 순서 표시(U+FEFF), 줄바꿈 방지 공백(U+00A0) 같은 문자가 해당 이스케이프와 함께 표시되어 한눈에 보입니다.
Python 소스의 \u 이스케이프도 해독할 수 있나요?
가능합니다. Python의 \u0041과 \U0001F680은 JavaScript의 \uXXXX, \u{1F680}와 같은 문법입니다. 문자열 내용(바깥 따옴표와 r 접두어를 떼어낸 부분)을 붙여 넣으면 디코더가 읽을 수 있는 텍스트를 돌려줍니다.

관련 도구