텍스트를 이진수로 변환이란?
텍스트-바이너리 변환기는 모든 텍스트 문자열을 이진(2진법) 표현으로 변환하여 각 문자의 8비트 이진 코드를 보여줍니다. 출력을 16진·10진·8진으로 전환할 수 있고 이진을 텍스트로 역변환하는 기능도 있어 인코딩 학습이나 데이터 디버깅에 유용합니다.
이 변환기는 UTF-8, UTF-16, 순수 ASCII를 지원하므로 강세, 이모지, CJK 문자도 모두 올바르게 인코딩됩니다. 4비트 니블, 8비트 바이트, 16비트, 32비트 묶음 중에서 고르고 출력 진법을 2진·16진·10진·8진으로 전환하며 공백·하이픈·쉼표·없음·사용자 정의 구분자 가운데 선택하세요. 바이트별 분석은 각 묶음 뒤의 값과 문자를 보여 주고, 내장 참조표는 흔한 문자를 해당 코드에 연결합니다. .txt 파일을 끌어다 놓거나 클립보드에서 붙여넣어도 되며, 디코딩 쪽은 어떤 형식이든 받아들이고 불필요한 공백은 무시합니다. 마지막 입력과 설정이 기억되어 멈춘 자리에서 바로 이어집니다.
사용 방법
- 입력 필드에 텍스트를 입력하거나 붙여넣으세요. 각 문자가 공백으로 구분된 8비트 이진 시퀀스로 즉시 표시됩니다.
- 디코딩 모드로 전환하여 이진 문자열을 붙여넣고 읽을 수 있는 텍스트로 변환할 수 있습니다. 양방향 모두 실시간으로 작동합니다.
- 텍스트를 붙여 넣거나 .txt 파일을 업로드하고, 붙여넣기 버튼으로 클립보드 내용을 바로 가져올 수 있습니다. 이진 출력은 복사하거나 파일로 내려받고, 교체 버튼으로 인코드와 디코드를 빠르게 전환하세요.
사용 시기
- 프로그래밍 입문에서 문자 하나가 바이트로 어떻게 매핑되는지 보여줄 때.
- 깨진 텍스트를 추적해 원본 파일에 실제로 어떤 바이트가 들었는지 확인할 때.
- 방탈출 단서, ARG 미스터리, 또는 0과 1로 메시지를 숨긴 개발자 친구용 생일 카드 만들기.
결과
'Hi'를 입력하면 '01001000 01101001'이 표시됩니다 — 각 ASCII 문자의 8비트 이진 표현입니다.
자주 묻는 질문
- 왜 문자 하나가 8비트인가요?
- ASCII는 원래 7비트인데 1바이트에 맞추려고 8비트로 채워졌고, 바이트가 대부분 컴퓨터의 기본 단위가 됐습니다. 일반 ASCII에서는 최상위 비트가 0입니다. UTF-8은 바이트 단위를 유지하면서 비라틴 문자에는 2~4바이트를 씁니다.
- 이모지와 한자는 어떻게 인코딩되나요?
- 둘 다 UTF-8을 쓰며 문자당 여러 바이트를 차지합니다. 웃는 얼굴 이모지는 4바이트(32비트), 대부분의 한자는 3바이트(24비트)입니다. 8비트 그룹으로 보면 이 문자들은 여러 그룹에 걸쳐 나타납니다.
- 쉼표가 섞이거나 구분자가 전혀 없는 이진을 붙여넣어도 디코딩되나요?
- 됩니다. 디코더는 0과 1만 골라내고 나머지는 무시하므로 01001000,01101001처럼 쉼표가 있어도, 0100100001101001처럼 한 줄로 붙어 있어도 같은 결과가 나옵니다.
- 같은 텍스트를 16진, 10진, 8진으로도 볼 수 있나요?
- 네, 출력 진법을 16진·10진·8진으로 바꾸면 같은 문자가 그 진법으로 표시됩니다. 2진은 2진법으로 컴퓨터가 실제로 저장하는 비트를 그대로 보여 주고, 16진은 16진법으로 4비트를 한 글자로 묶으며, 8진은 8진법으로 Unix 파일 권한에 쓰는 표기입니다. 글자 A는 2진으로 01000001, 16진으로 41, 10진으로 65, 8진으로 101 — 같은 값, 네 가지 표기입니다.
- 디코딩할 때 대소문자가 구분되나요?
- 출력 텍스트에서는 구분되고, 입력 이진에서는 구분이 의미 없습니다. ASCII는 대문자와 소문자에 서로 다른 코드를 주므로(A는 65, a는 97), 01000001은 A로, 01100001은 a로 풀립니다.