什麼是Unicode 跳脫轉換器?

Unicode 跳脫字元轉換工具可將跳脫序列(如 \u0041)轉換為可讀字元,也可反向操作。支援 JavaScript \uXXXX、HTML 實體、Python 和 URL 百分比編碼,方便除錯國際化字串、解碼 API 回應或為程式碼準備文字。

工具支援六種跳脫格式。JavaScript 形式的 \uXXXX 涵蓋基本多語文字面,表情符號與罕用漢字會以代理對呈現。JavaScript ES6 的 \u{X} 一段就能寫出任意碼位,現代原始碼因此不必再用代理對。HTML 數值實體 &#xHHHH; 可直接寫在 HTML 標記或郵件中。CSS 形式 \HHHH 寫在樣式表的 content 屬性裡。Python 對基本平面用 \uXXXX,超出部分用 \UXXXXXXXX,結果可直接貼進 Python 字串。URL 百分比編碼 %XX 會逐一跳脫 UTF-8 位元組,適合查詢字串與路徑片段。開關可切換十六進位大小寫,僅跳脫非 ASCII 的模式會保留可列印字元原樣,讓 JSON 與 i18n 檔保持易讀。對照面板列出每個字元的碼位、官方 Unicode 名稱、原始 UTF-8 位元組、區塊與類別,點擊任一卡片即可只複製該字元的跳脫。

使用方法

  1. 步驟一 — 將 Unicode 跳脫序列(例如 \u0048\u0065\u006C\u006C\u006F)貼到輸入框中,將其解碼為可讀字元。
  2. 步驟二 — 或輸入純文字(例如 Hello)將其編碼為指定格式的 Unicode 跳脫序列。
  3. 步驟三 — 選擇跳脫格式(JavaScript \uXXXX、HTML &#xHHHH;、CSS \HHHH、Python \U 或 URL %XX)並複製結果。對照面板會列出每個字元的名稱,並拆解其 UTF-8 位元組、區塊與類別;點擊卡片即可複製單個跳脫。

何時使用

  • 把 API 回傳的 \u00E9 之類字串解碼回原本字元,確認資料是否正確。
  • 把中文等非 ASCII 文字編碼成 JSON 或 JavaScript 原始碼,避免在純 ASCII 系統中傳輸時失真。
  • 排查複製到的字串裡是否混入零寬度空白、BOM 等看不見的 Unicode 字元。

結果

API 回傳了 \u0041\u006E\u0064\u0072\u00E9,您需要取得實際姓名。貼上後即可看到「André」,然後將回覆文字轉換回跳脫序列用於 API 請求主體。

常見問題

為什麼某些字元在 JavaScript 中要用兩段 \uXXXX 表示?
碼位超過 U+FFFF 的字元(表情、古文、罕用漢字)位於基本多語文字面之外。JavaScript 以 UTF-16 代理對表示,例如火箭表情會寫成 \uD83D\uDE80。支援 ES2015 的環境可改用 \u{1F680}。
程式碼中應該選哪一種跳脫格式?
JavaScript 或 JSON 字串裡用 \uXXXX;HTML 原始碼裡用 &#xHHHH;;CSS content 屬性中用 \HHHH;查詢字串與路徑片段則用 URL %XX 百分比編碼。JSON 不支援 \u{...} 寫法,因此 JSON 一律用 \uXXXX 並搭配代理對。
跳脫序列和 HTML 實體到底差在哪?
兩者指向相同的 Unicode 碼位。跳脫(\u00E9)由語言執行時處理,例如 JavaScript、CSS、Python;HTML 實體(é 或 é)則由瀏覽器解析 HTML 時處理。兩種寫法不能跨情境互換。
如何找出字串中看不見的 Unicode 字元?
貼上文字後切到編碼模式,字元對照表會依序列出每個碼位。零寬度空白(U+200B)、位元組順序記號(U+FEFF)、不換行空白(U+00A0)等隱藏字元會連同跳脫序列一起顯示出來。
工具能解碼 Python 程式碼中的 \u 跳脫嗎?
可以。Python 的 \u0041、\U0001F680 與 JavaScript 的 \uXXXX、\u{1F680} 用法相通。把字串內容(不含外層引號與 r 前綴)貼進來,解碼後就會還原成可讀文字。

相關工具