什麼是空白字元視覺化工具?
空白字元視覺化工具讓文字中不可見的字元無所遁形。空格、定位字元、換行符號、歸位字元、不斷行空格和零寬字元各有不同顏色的標記,方便你快速找出格式錯誤、縮排不一致或資料檔案中的異常字元。
每種空白字元都有自己的顏色:空格顯示為橘色圓點,定位字元顯示為箭頭,換行符顯示為段落符號,零寬字元顯示為斜線圓圈。工具會分別統計每種類型的數量,你可以一眼看出檔案用的是 tab 還是空格,有沒有混用,或者藏著會讓解析器出錯的隱形字元。 它還能標出編輯器通常完全隱藏的擴充隱形字元——軟連字號、單字連接符、左到右與右到左方向標記,以及全形/半形空格。
使用方法
- 步驟一 — 將文字貼上或輸入至輸入區域。空白字元會立即以色彩編碼的標記醒目標示。
- 步驟二 — 切換要醒目標示的空白字元類型:空格、定位字元、換行符號、歸位字元、不斷行空格和零寬字元,還有軟連字號、單字連接符、方向標記、全形/半形空格等擴充隱形字元。可將定位點寬度設為 2、4 或 8 欄,並依需要開關行號欄,與你的編輯器一致。
- 步驟三 — 檢視字元統計資訊(各類空白字元的數量),如有需要可複製標註後的文字。
何時使用
- 排查 CSV 或 TSV 檔案在 pandas 或 Excel 中無法正常解析的原因。
- 在嚴格 lint 倉庫提交前,檢查貼上代碼有沒有混用 tab 和空格。
- 找出翻譯界面字串裡混入的零寬連接符或 BOM 字元。
結果
一個 CSV 檔案剖析失敗。將幾行內容貼到視覺化工具中,發現分隔符號混用了定位字元和空格,而且標頭列中有一個隱藏的零寬空格導致第一欄名稱無法比對。
常見問題
- 什麼是零寬字元,為什麼會出問題?
- 像 U+200B(零寬空格)和 U+FEFF(BOM)這樣的字元不佔視覺空間,但仍然算位元組。從 Word、複製的 PDF 或命令列導出很容易混入,會讓字串比較莫名失敗,不用這個工具幾乎看不出問題。
- 怎麼判斷檔案用的是 tab 還是空格縮排?
- 把檔案貼進來看統計面板。如果 Tabs 是 0、Spaces 很多,就是空格縮排;反過來就是 tab 縮排。兩個都不是 0 一般意味著出了問題,尤其在 Python 或 Makefile 中禁止混用。
- 支援阿拉伯文、中文等非拉丁文字嗎?
- 支援。視覺化按 Unicode 碼點走訪,所以阿拉伯文、CJK 和 emoji 都能正確處理。非拉丁字元正常顯示,只有空白會被替換成標記,跟用什麼文字無關。
- 一般空格和不換行空格有什麼差別?
- 一般空格(U+0020)允許瀏覽器在那裡換行。不換行空格(U+00A0)拒絕換行,讓兩個詞留在一起。從 Word 或 PDF 複製經常混入 NBSP,看起來一模一樣,但會讓搜尋、分詞和 trim 失效。
- 可以匯出或複製標註後的內容嗎?
- 可以。點擊複製按鈕就能把帶標記的文字放到剪貼簿,適合在代碼評審或 bug 報告中展示哪個空白字元出錯,讓別人一眼看到問題在哪裡。