Qual a diferença entre entidades nomeadas e numéricas?

Nomeadas usam atalhos legíveis (© para ©). Numéricas usam o ponto Unicode (© ou ©). As numéricas funcionam para qualquer Unicode; as nomeadas cobrem cerca de 250 caracteres definidos pelo HTML5.

Preciso codificar todos os caracteres especiais ou só alguns?

No corpo HTML, basta codificar & e a aspa usada em atributos. Em contextos JavaScript ou URL as regras mudam. O seletor de Escopo oferece: Apenas reservados para os cinco caracteres críticos contra XSS, Todos especiais para tipografia além dos reservados, ou Tudo não-ASCII para a cobertura mais abrangente.

Codificar quebra o copiar-colar ou leitores de tela?

Não. O navegador decodifica as entidades antes de pintar o texto, então o usuário vê e copia o caractere original. Leitores de tela recebem também o conteúdo decodificado. Entidades são formato de transporte, não a saída final exibida.

Codificar entidades HTML é suficiente para travar XSS?

Para texto no corpo HTML, sim. Em atributos é preciso entre aspas e codificar a própria aspa. JavaScript, CSS e URLs têm regras de escape próprias. A codificação é a primeira camada, não a defesa inteira.

Por que algumas entidades começam com &#x e outras só &#?

&#x leva um ponto em hexadecimal e &# em decimal. Ambos apontam para o mesmo caractere; © e © imprimem ©. Hex bate com a notação U+ do Unicode e fica mais curto para pontos altos.

Codificador/Decodificador de Entidades HTML

Codifica e decodifica entidades HTML

Modo

Tipo

Contexto

Escopo

Entrada

Saída

<div class="hero"> <h1>Olá & Bem-vindo</h1> <p>Use "aspas" & <colchetes> livremente</p> </div>

caracteres: 173Modo: CodificarTipo: Entidades nomeadasConvertidos: 21

Entrada

Saída

173

Diferença

+75

Detalhamento por caractere

(21)▾

Caractere	Entidade	Ponto de código
<	<	U+003C
"	"	U+0022
"	"	U+0022
>	>	U+003E
<	<	U+003C
>	>	U+003E
á	á	U+00E1
&	&	U+0026
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E
"	"	U+0022
"	"	U+0022
&	&	U+0026
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E
<	<	U+003C
>	>	U+003E

Entidades HTML comuns

(62)▾

Caractere	Entidades nomeadas	Decimal	Hex	Descrição
&	&	&	&	Ampersand
<	<	<	<	Less than
>	>	>	>	Greater than
"	"	"	"	Double quote
'	'	'	'	Apostrophe
·				Non-breaking space
—	—	—	—	Em dash
–	–	–	–	En dash
…	…	…	…	Ellipsis
“	“	“	“	Left double quote
”	”	”	”	Right double quote
‘	‘	‘	‘	Left single quote
’	’	’	’	Right single quote
«	«	«	«	Left angle quote
»	»	»	»	Right angle quote
•	•	•	•	Bullet
†	&dagger;	†	†	Dagger
‡	&Dagger;	‡	‡	Double dagger
§	§	§	§	Section sign
¶	¶	¶	¶	Pilcrow
€	€	€	€	Euro
£	£	£	£	Pound sterling
¥	¥	¥	¥	Yen
¢	¢	¢	¢	Cent
¤	¤	¤	¤	Generic currency
©	©	©	©	Copyright
®	®	®	®	Registered
™	™	™	™	Trademark
°	°	°	°	Degree
¡	¡	¡	¡	Inverted exclamation
¿	¿	¿	¿	Inverted question mark
×	×	×	×	Multiplication
÷	÷	÷	÷	Division
±	±	±	±	Plus-minus
≠	≠	≠	≠	Not equal
≤	≤	≤	≤	Less than or equal
≥	≥	≥	≥	Greater than or equal
≈	≈	≈	≈	Approximately equal
∞	∞	∞	∞	Infinity
√	√	√	√	Square root
∑	∑	∑	∑	Summation
∏	∏	∏	∏	Product
∫	∫	∫	∫	Integral
∂	∂	∂	∂	Partial derivative
∇	∇	∇	∇	Nabla / del
α	α	α	α	Greek small alpha
β	β	β	β	Greek small beta
γ	γ	γ	γ	Greek small gamma
δ	δ	δ	δ	Greek small delta
μ	μ	μ	μ	Greek small mu
π	π	π	π	Greek small pi
σ	σ	σ	σ	Greek small sigma
Ω	Ω	Ω	Ω	Greek capital omega
Δ	Δ	Δ	Δ	Greek capital delta
←	←	←	←	Leftwards arrow
→	→	→	→	Rightwards arrow
↑	↑	↑	↑	Upwards arrow
↓	↓	↓	↓	Downwards arrow
↔	↔	↔	↔	Left right arrow
⇒	⇒	⇒	⇒	Rightwards double arrow
⇐	⇐	⇐	⇐	Leftwards double arrow
⇔	⇔	⇔	⇔	Left right double arrow

O que é Codificador/Decodificador de Entidades HTML?

Um codificador/decodificador de entidades HTML converte caracteres especiais como <, >, & e aspas para os seus equivalentes em entidades HTML (e vice-versa). Isso previne vulnerabilidades XSS ao incorporar conteúdo do usuário em HTML e corrige problemas de exibição de caracteres especiais.

O codificador converte caracteres como <, >, &, ", ' e qualquer ponto de código Unicode em entidades nomeadas (&, <), referências decimais (&) ou hexadecimais (&). Um seletor de escopo permite codificar apenas os cinco caracteres reservados, todos os caracteres especiais ou cada caractere não-ASCII. A decodificação reverte qualquer um dos três formatos. Útil para sanitizar entradas de usuário em HTML ou recuperar texto de exportações de e-mail HTML.

Como usar

Passo 1 — Cole o texto contendo caracteres especiais ou entidades HTML.
Passo 2 — Escolha Codificar para converter caracteres em entidades, ou Decodificar para converter entidades de volta em caracteres.
Passo 3 — Escolha um formato (Nomeado, Decimal ou Hex) e um escopo para controlar a intensidade da codificação.

Quando usar

Colar exemplos de código num CMS sem que < e > sumam interpretados como tags.
Limpar texto vindo de e-mails HTML ou scraping que ainda traz — e  .
Escapar a entrada do usuário antes de injetar em template no servidor para barrar XSS.

Resultado

Você precisa exibir o trecho de código <div class="hero"> dentro de um parágrafo HTML. Codifique-o para <div class="hero"> para que o dispositivo renderize o texto em vez de interpretá-lo como marcação.

Perguntas frequentes

Qual a diferença entre entidades nomeadas e numéricas?: Nomeadas usam atalhos legíveis (© para ©). Numéricas usam o ponto Unicode (© ou ©). As numéricas funcionam para qualquer Unicode; as nomeadas cobrem cerca de 250 caracteres definidos pelo HTML5.
Preciso codificar todos os caracteres especiais ou só alguns?: No corpo HTML, basta codificar & < > e a aspa usada em atributos. Em contextos JavaScript ou URL as regras mudam. O seletor de Escopo oferece: Apenas reservados para os cinco caracteres críticos contra XSS, Todos especiais para tipografia além dos reservados, ou Tudo não-ASCII para a cobertura mais abrangente.
Codificar quebra o copiar-colar ou leitores de tela?: Não. O navegador decodifica as entidades antes de pintar o texto, então o usuário vê e copia o caractere original. Leitores de tela recebem também o conteúdo decodificado. Entidades são formato de transporte, não a saída final exibida.
Codificar entidades HTML é suficiente para travar XSS?: Para texto no corpo HTML, sim. Em atributos é preciso entre aspas e codificar a própria aspa. JavaScript, CSS e URLs têm regras de escape próprias. A codificação é a primeira camada, não a defesa inteira.
Por que algumas entidades começam com &#x e outras só &#?: &#x leva um ponto em hexadecimal e &# em decimal. Ambos apontam para o mesmo caractere; © e © imprimem ©. Hex bate com a notação U+ do Unicode e fica mais curto para pontos altos.

Codificador/Decodificador de Entidades HTML

Entrada

Saída

Detalhamento por caractere

Entidades HTML comuns

O que é Codificador/Decodificador de Entidades HTML?

Como usar

Quando usar

Resultado

Perguntas frequentes

Ferramentas relacionadas

Buscador de Rimas

Solucionador de Anagramas

Pesquisa de Unicode

Codificador/Decodificador de URL

Alfabeto fonético NATO

Contador de parágrafos

Codificador/Decodificador de Entidades HTML

Entrada

Saída

Detalhamento por caractere

Entidades HTML comuns