Quelle est la différence entre entités nommées et numériques ?

Les nommées sont des raccourcis lisibles (© pour ©). Les numériques utilisent le point Unicode (© ou ©). Les numériques marchent pour tout Unicode ; les nommées ne couvrent qu'environ 250 caractères définis dans HTML5.

Faut-il encoder tous les caractères spéciaux ou seulement certains ?

Dans le corps HTML, vous devez seulement coder & et le guillemet utilisé pour les attributs. En contexte JavaScript ou URL, les règles changent. Le sélecteur de Portée propose : Réservés uniquement pour les cinq caractères critiques XSS, Tous les spéciaux pour la typographie en plus des réservés, ou Tout non-ASCII pour la couverture la plus large.

L'encodage casse-t-il le copier-coller ou les lecteurs d'écran ?

Non. Le navigateur décode les entités avant l'affichage, l'utilisateur voit et copie le caractère d'origine. Les lecteurs d'écran reçoivent aussi la forme décodée. Les entités sont un format de transport du balisage, pas la sortie finale.

Encoder les entités HTML suffit-il à arrêter le XSS ?

Pour du texte dans le corps HTML, oui. Dans les attributs il faut citer la valeur et encoder le guillemet utilisé. JavaScript, CSS et URLs ont leurs propres règles d'échappement. L'encodage est une première couche, pas la défense complète.

Pourquoi certaines entités commencent par &#x et d'autres par &# ?

&#x est suivi d'un point hexadécimal, &# d'un point décimal. Les deux désignent le même caractère : © et © affichent ©. L'hexa colle à la notation U+ des tables Unicode et est plus court pour les points hauts.

Encodeur/Décodeur d'Entités HTML

Encode et décode les entités HTML

Mode

Type

Contexte

Portée

Entrée

Sortie

<div class="hero"> <h1>Bonjour & Bienvenue</h1> <p>Utilisez "guillemets" & <crochets> librement</p> </div>

caractères: 180Mode: EncoderType: Entités nomméesConvertis: 20

Entrée

110

Sortie

180

Différence

+70

Détail par caractère

(20)▾

Caractère	Entité	Point de code
<	<	U+003C
"	"	U+0022
"	"	U+0022
>	>	U+003E
<	<	U+003C
>	>	U+003E
&	&	U+0026
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E
"	"	U+0022
"	"	U+0022
&	&	U+0026
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E

Entités HTML courantes

(62)▾

Caract.	Entités nommées	Décimal	Hex	Description
&	&	&	&	Ampersand
<	<	<	<	Less than
>	>	>	>	Greater than
"	"	"	"	Double quote
'	'	'	'	Apostrophe
·				Non-breaking space
—	—	—	—	Em dash
–	–	–	–	En dash
…	…	…	…	Ellipsis
“	“	“	“	Left double quote
”	”	”	”	Right double quote
‘	‘	‘	‘	Left single quote
’	’	’	’	Right single quote
«	«	«	«	Left angle quote
»	»	»	»	Right angle quote
•	•	•	•	Bullet
†	&dagger;	†	†	Dagger
‡	&Dagger;	‡	‡	Double dagger
§	§	§	§	Section sign
¶	¶	¶	¶	Pilcrow
€	€	€	€	Euro
£	£	£	£	Pound sterling
¥	¥	¥	¥	Yen
¢	¢	¢	¢	Cent
¤	¤	¤	¤	Generic currency
©	©	©	©	Copyright
®	®	®	®	Registered
™	™	™	™	Trademark
°	°	°	°	Degree
¡	¡	¡	¡	Inverted exclamation
¿	¿	¿	¿	Inverted question mark
×	×	×	×	Multiplication
÷	÷	÷	÷	Division
±	±	±	±	Plus-minus
≠	≠	≠	≠	Not equal
≤	≤	≤	≤	Less than or equal
≥	≥	≥	≥	Greater than or equal
≈	≈	≈	≈	Approximately equal
∞	∞	∞	∞	Infinity
√	√	√	√	Square root
∑	∑	∑	∑	Summation
∏	∏	∏	∏	Product
∫	∫	∫	∫	Integral
∂	∂	∂	∂	Partial derivative
∇	∇	∇	∇	Nabla / del
α	α	α	α	Greek small alpha
β	β	β	β	Greek small beta
γ	γ	γ	γ	Greek small gamma
δ	δ	δ	δ	Greek small delta
μ	μ	μ	μ	Greek small mu
π	π	π	π	Greek small pi
σ	σ	σ	σ	Greek small sigma
Ω	Ω	Ω	Ω	Greek capital omega
Δ	Δ	Δ	Δ	Greek capital delta
←	←	←	←	Leftwards arrow
→	→	→	→	Rightwards arrow
↑	↑	↑	↑	Upwards arrow
↓	↓	↓	↓	Downwards arrow
↔	↔	↔	↔	Left right arrow
⇒	⇒	⇒	⇒	Rightwards double arrow
⇐	⇐	⇐	⇐	Leftwards double arrow
⇔	⇔	⇔	⇔	Left right double arrow

Qu'est-ce que Encodeur/Décodeur d'Entités HTML ?

Un encodeur/décodeur d'entités HTML convertit les caractères spéciaux tels que <, >, & et les guillemets en leurs équivalents d'entités HTML (et inversement). Cela prévient les vulnérabilités XSS lors de l'intégration de contenu utilisateur dans du HTML et corrige les problèmes d'affichage des caractères spéciaux.

L'encodeur transforme les caractères comme <, >, &, ", ' et tout point de code Unicode en entités nommées (&, <), références décimales (&) ou références hexadécimales (&). Un sélecteur de portée permet de coder seulement les cinq caractères réservés, tous les caractères spéciaux ou chaque caractère non-ASCII. Le décodage inverse l'un des trois formats. Pratique pour assainir les entrées utilisateur ou récupérer du texte issu d'exports d'e-mails HTML.

Comment utiliser

Étape 1 — Collez du texte contenant des caractères spéciaux ou des entités HTML.
Étape 2 — Choisissez Encoder pour convertir les caractères en entités, ou Décoder pour convertir les entités en caractères.
Étape 3 — Choisissez un format (Nommé, Décimal ou Hex) et une portée pour contrôler l'agressivité de l'encodage.

Quand l'utiliser

Coller des exemples de code dans un CMS sans que < et > soient avalés comme balises.
Nettoyer du texte issu d'e-mails HTML ou de scraping qui contient encore — et  .
Échapper la saisie utilisateur avant injection dans un gabarit côté serveur pour bloquer le XSS.

Résultat

Vous devez afficher l'extrait de code <div class="hero"> dans un paragraphe HTML. Encodez-le en <div class="hero"> pour que le appareil affiche le texte au lieu de l'interpréter comme du balisage.

FAQ

Quelle est la différence entre entités nommées et numériques ?: Les nommées sont des raccourcis lisibles (© pour ©). Les numériques utilisent le point Unicode (© ou ©). Les numériques marchent pour tout Unicode ; les nommées ne couvrent qu'environ 250 caractères définis dans HTML5.
Faut-il encoder tous les caractères spéciaux ou seulement certains ?: Dans le corps HTML, vous devez seulement coder & < > et le guillemet utilisé pour les attributs. En contexte JavaScript ou URL, les règles changent. Le sélecteur de Portée propose : Réservés uniquement pour les cinq caractères critiques XSS, Tous les spéciaux pour la typographie en plus des réservés, ou Tout non-ASCII pour la couverture la plus large.
L'encodage casse-t-il le copier-coller ou les lecteurs d'écran ?: Non. Le navigateur décode les entités avant l'affichage, l'utilisateur voit et copie le caractère d'origine. Les lecteurs d'écran reçoivent aussi la forme décodée. Les entités sont un format de transport du balisage, pas la sortie finale.
Encoder les entités HTML suffit-il à arrêter le XSS ?: Pour du texte dans le corps HTML, oui. Dans les attributs il faut citer la valeur et encoder le guillemet utilisé. JavaScript, CSS et URLs ont leurs propres règles d'échappement. L'encodage est une première couche, pas la défense complète.
Pourquoi certaines entités commencent par &#x et d'autres par &# ?: &#x est suivi d'un point hexadécimal, &# d'un point décimal. Les deux désignent le même caractère : © et © affichent ©. L'hexa colle à la notation U+ des tables Unicode et est plus court pour les points hauts.

Encodeur/Décodeur d'Entités HTML

Entrée

Sortie

Détail par caractère

Entités HTML courantes

Qu'est-ce que Encodeur/Décodeur d'Entités HTML ?

Comment utiliser

Quand l'utiliser

Résultat

FAQ

Outils similaires

Chercheur de rimes

Solveur d'Anagrammes

Recherche Unicode

Encodeur/Décodeur d'URL

Alphabet phonétique OTAN

Compteur de paragraphes

Encodeur/Décodeur d'Entités HTML

Entrée

Sortie

Détail par caractère

Entités HTML courantes