본문 바로가기

프로그래밍/doodle

인코딩이란?

(해당 포스트에서는 "문자 인코딩"에 국한하여 설명한다.)

 

문자, 동영상, 음악과 같은 사람이 현실에서 사용하는 데이터를 컴퓨터에 저장하기 위해서는 컴퓨터가 이해할 수 있는 데이터로 변환해야하는데 이 작업을 인코딩이라고 한다. 

이런 인코딩을 위해서 탄생한 ASCII가 그 시초라고 할 수 있다. ASCII는 라틴 알파벳과 숫자, 특수 문자를 7비트 이진수로 대응한 인코딩 기법을 사용했는데, 이름에서도 알 수 있듯 ASCII는 미국 표준 문자코드 였기 때문에 라틴 알파벳을 제외한, 한중일 언어와 그 밖에 수많은 언어들에는 전혀 사용할 수 없는 명확한 한계가 있었다. 그래서 ASCII를 사용할 수 없는 산업이나 국가에서는 저마다의 고유한 인코딩 기법을 사용했으며 결국 다른 인코딩 기법을 사용하는 곳에서는 정보를 교류할 수 없는 문제가 생겨났다.

다른 인코딩 기법으로 문자를 표현하면 정보를 공유할 수 없다.

이 문제를 해결하기 위해서 표준 문자 전송 처리방식인 유니코드가 개발되었다. 유니코드는 이 세상의 모든 문자 인코딩을 통일하기 위한 목적으로 개발되었는데 이런 원대한 꿈을 위해 대부분의 나라의 문자 뿐아니라, 기호, 이모티콘 심지어는 마작 기호들 가지도 포함하고 있다.

이런 유니코드 기법으로 개발된 인코딩도 여러가지가 있지만 그 중에서도 UTF-8 이 가장 널리 사용되고 있으며, 오늘날 유니코드에 대한 인코딩을 말한다면 거진 UTF-8로 인식해도 큰 문제가 없다.

 

'프로그래밍 > doodle' 카테고리의 다른 글

Bastion Host 란?  (0) 2021.02.12
Mysql character set 과 collation  (0) 2020.05.17
shell 의 개념  (0) 2019.08.26
Test Fixture  (0) 2019.07.30