바이트 수 계산, 인코딩을 알아야 정확하다
같은 글자라도 바이트 수는 사용하는 인코딩에 따라 달라집니다. 문자메시지 한도, 데이터베이스 칼럼 길이, 파일 크기, API 요청 길이 제한 등은 글자 수가 아니라 바이트 수로 정해지는 경우가 많습니다. 그래서 한글이 섞인 텍스트를 다룰 때는 정확한 바이트 계산이 필수입니다. 이 도구는 텍스트를 입력하는 즉시 EUC-KR(CP949)과 UTF-8 두 기준의 바이트 수를 동시에 보여주고, 글자수·줄수·단어수와 SMS 분량까지 한 화면에서 점검하게 해줍니다.
EUC-KR과 UTF-8, 무엇이 다른가
EUC-KR(윈도우 확장인 CP949)은 한글 한 글자를 2바이트, 영문·숫자·기본 기호를 1바이트로 표현합니다. 국내 문자메시지(SMS/LMS)와 일부 구형 시스템이 이 방식을 씁니다. 반면 UTF-8은 전 세계 문자를 담는 표준으로, 한글 한 글자가 3바이트, 영문·숫자가 1바이트, 이모지는 4바이트를 차지하는 경우가 많습니다. 웹 페이지와 대부분의 데이터베이스(utf8mb4)가 UTF-8을 사용합니다. 같은 문장이라도 EUC-KR과 UTF-8의 바이트가 다르게 나오는 이유가 바로 이 규칙 차이입니다.
SMS·LMS 분량 점검
국내 이동통신 표준 단문(SMS)은 한 건에 90바이트까지 보낼 수 있습니다. EUC-KR 기준 한글 약 45자, 영문 약 90자에 해당합니다. 90바이트를 넘으면 장문(LMS, 약 2,000바이트)이나 멀티미디어 메시지(MMS)로 전환되어 과금 단위가 달라질 수 있습니다. 마케팅 문자나 인증 안내를 작성할 때 이 도구의 EUC-KR 바이트와 SMS 사용량 막대를 보면, 단문 한 건에 들어가는지 미리 확인할 수 있습니다. 실제 발송 한도는 통신사·발송 솔루션마다 약간씩 다를 수 있으니 이 수치는 참고용으로 활용하세요.
개발·DB에서의 활용
- MySQL utf8mb4 환경에서 VARCHAR 칼럼 길이를 정할 때 UTF-8 바이트를 기준으로 여유를 두세요.
- 고정 길이 바이트 제한이 있는 외부 연동(EDI, 펌뱅킹 등)에서는 EUC-KR 바이트로 자릿수를 맞추세요.
- API 요청 본문이나 URL 파라미터 길이 제한을 점검할 때 UTF-8 바이트 값을 활용하세요.
- 모든 계산은 브라우저 안에서만 처리되며 입력 텍스트는 서버로 전송되지 않습니다.
자주 묻는 질문 (FAQ)
Q. 한글 한 글자는 몇 바이트인가요?
A. EUC-KR에서는 2바이트, UTF-8에서는 3바이트입니다. 이 도구가 두 값을 동시에 보여줍니다.
Q. SMS는 몇 바이트까지 보낼 수 있나요?
A. 표준 단문은 90바이트(EUC-KR 기준 한글 약 45자)까지이며, 넘으면 LMS(약 2,000바이트)로 전환됩니다.
Q. UTF-8과 EUC-KR 바이트는 왜 다른가요?
A. 문자를 바이트로 바꾸는 인코딩 규칙이 달라서입니다. 한글을 EUC-KR은 2바이트, UTF-8은 3바이트로 표현합니다.
Q. 데이터베이스 VARCHAR 길이는 어떤 바이트로 맞추나요?
A. utf8mb4 환경에서는 한글 3바이트·이모지 4바이트를 고려해 UTF-8 바이트 기준으로 여유 있게 설정하세요.