名前付きエンティティと数値エンティティはどう違いますか?

名前付きは読める省略形(© が ©)、数値はUnicodeコードポイント(© や ©)を使います。数値は任意のUnicode文字に対応、名前付きはHTML5仕様の約250文字に限られます。

特殊文字はすべて変換すべきですか、それとも一部だけですか?

HTML本文では & と属性値で使った引用符だけをエンコードすればよく、JavaScript やURLコンテキストではルールが変わります。範囲セレクタには3つの選択肢があります：予約文字のみはXSSに関わる5文字だけ、特殊文字すべては予約文字に加えてタイポグラフィも、非ASCIIすべてが最も広いカバレッジです。

エンコードするとコピペやスクリーンリーダーに影響しますか?

影響しません。ブラウザは表示前にエンティティを復号するので、ユーザーは元の文字を見てコピーします。スクリーンリーダーも復号後の文字を受け取ります。エンティティはマークアップの伝送形式で、表示そのものではありません。

HTMLエンティティ変換だけでXSSを防げますか?

本文に置く文字列ならそれで足ります。属性に入れる場合は値を引用符で囲み、その引用符自体もエンコードします。JavaScript、CSS、URLにはそれぞれ別のエスケープ規則があり、エンコードは最初の一層に過ぎません。

なぜ &#x で始まるエンティティと &# で始まるものがあるのですか?

&#x の後ろは16進数、&# の後ろは10進数のコードポイントです。どちらも同じ文字を指し、© と © はどちらも © になります。16進はUnicode表の U+ 表記と一致し、高位コードでは表記が短くなります。

HTML エンティティエンコーダー/デコーダー

HTML エンティティをエンコード・デコード

モード

種類

コンテキスト

範囲

入力

出力

<div class="hero"> <h1>こんにちは & ようこそ</h1> <p>"引用符" & <括弧> を自由に使う</p> </div>

文字: 288モード: エンコード種類: 名前付きエンティティ変換数: 40

入力

出力

288

差分

+210

文字ごとの内訳

(40)▾

文字	エンティティ	コードポイント
<	<	U+003C
"	"	U+0022
"	"	U+0022
>	>	U+003E
<	<	U+003C
>	>	U+003E
こ	こ	U+3053
ん	ん	U+3093
に	に	U+306B
ち	ち	U+3061
は	は	U+306F
&	&	U+0026
よ	よ	U+3088
う	う	U+3046
こ	こ	U+3053
そ	そ	U+305D
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E
"	"	U+0022
引	引	U+5F15
用	用	U+7528
符	符	U+7B26
"	"	U+0022
&	&	U+0026
<	<	U+003C
括	括	U+62EC
弧	弧	U+5F27
>	>	U+003E
を	を	U+3092
自	自	U+81EA
由	由	U+7531
に	に	U+306B
使	使	U+4F7F
う	う	U+3046
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E

よく使うHTMLエンティティ

(62)▾

文字	名前付きエンティティ	10進	16進	説明
&	&	&	&	Ampersand
<	<	<	<	Less than
>	>	>	>	Greater than
"	"	"	"	Double quote
'	'	'	'	Apostrophe
·				Non-breaking space
—	—	—	—	Em dash
–	–	–	–	En dash
…	…	…	…	Ellipsis
“	“	“	“	Left double quote
”	”	”	”	Right double quote
‘	‘	‘	‘	Left single quote
’	’	’	’	Right single quote
«	«	«	«	Left angle quote
»	»	»	»	Right angle quote
•	•	•	•	Bullet
†	&dagger;	†	†	Dagger
‡	&Dagger;	‡	‡	Double dagger
§	§	§	§	Section sign
¶	¶	¶	¶	Pilcrow
€	€	€	€	Euro
£	£	£	£	Pound sterling
¥	¥	¥	¥	Yen
¢	¢	¢	¢	Cent
¤	¤	¤	¤	Generic currency
©	©	©	©	Copyright
®	®	®	®	Registered
™	™	™	™	Trademark
°	°	°	°	Degree
¡	¡	¡	¡	Inverted exclamation
¿	¿	¿	¿	Inverted question mark
×	×	×	×	Multiplication
÷	÷	÷	÷	Division
±	±	±	±	Plus-minus
≠	≠	≠	≠	Not equal
≤	≤	≤	≤	Less than or equal
≥	≥	≥	≥	Greater than or equal
≈	≈	≈	≈	Approximately equal
∞	∞	∞	∞	Infinity
√	√	√	√	Square root
∑	∑	∑	∑	Summation
∏	∏	∏	∏	Product
∫	∫	∫	∫	Integral
∂	∂	∂	∂	Partial derivative
∇	∇	∇	∇	Nabla / del
α	α	α	α	Greek small alpha
β	β	β	β	Greek small beta
γ	γ	γ	γ	Greek small gamma
δ	δ	δ	δ	Greek small delta
μ	μ	μ	μ	Greek small mu
π	π	π	π	Greek small pi
σ	σ	σ	σ	Greek small sigma
Ω	Ω	Ω	Ω	Greek capital omega
Δ	Δ	Δ	Δ	Greek capital delta
←	←	←	←	Leftwards arrow
→	→	→	→	Rightwards arrow
↑	↑	↑	↑	Upwards arrow
↓	↓	↓	↓	Downwards arrow
↔	↔	↔	↔	Left right arrow
⇒	⇒	⇒	⇒	Rightwards double arrow
⇐	⇐	⇐	⇐	Leftwards double arrow
⇔	⇔	⇔	⇔	Left right double arrow