티스토리 뷰

IT 용어 정리

인코딩(Encoding)

ljy98 2021. 8. 30. 21:18

1. 인코딩 (Encoding)

 - 인코딩이란 정보의 형태나 형식을 변환하는 처리방식을 말하며, '부호화'라고도 한다.

 - 사람이 인지할 수 있는 형태의 데이터를 약속된 규칙에 의하여 컴퓨터가 사용하는 0과 1로 변환하는 과정을 통틀어 말하며 파일 압축이나 암호화 등의 목적으로 인코딩을 한다. 반대말은 디코딩(decoding)이다.

 - 데이터의 길이를 줄이는 용도로 사용되고 기본인증에도 사용되며, 암호화로는 사용이 불가능하다.

 - 종류

문자열 인코딩 EBCDIC, ASCII, Unicode, ...
오디오형 인코딩 MP3, WAV, ...

 

2. 문자열 인코딩 (Character Encoding)

2-1. 유니코드 (Unicode)

유니코드는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 

[그림 1] 유니코드 표

 

2-2. 아스키 (ASCII, American Standard Code for Information Interchange)

아스키는 영문 알파벳을 사용하는 대표적인 문자 인코딩이다. 아스키는 컴퓨터와 통신 장비를 비롯한 문자를 사용하는 많은 장치에서 사용되며, 대부분의 문자 인코딩이 아스키에 기초를 두고 있다. 

[그림 2] 아스키 표

 

2-3. 퍼센트 인코딩 (Percent Encoding)

퍼센트 인코딩은 URL에 문자를 표현하는 문자 인코딩 방법으로, URL 인코딩이라고도 한다. 이 방법에 따르면 알파벳이나 숫자 등 몇몇 문자를 제외한 값은 옥텟 단위로 묶어서, 16진수 값으로 인코딩한다.

[그림 3] 네이버 도메인 주소 인코딩 전

 

[그림 4] 네이버 도메인 주소 인코딩 후

 

2-4. 베이스64 인코딩 (Base64 Encoding)

베이스64 인코딩은 8비트 이진 데이터(실행 파일, ZIP파일 등)를 문자 코드에 영향을 받지 않는 공통 ASCII 영역의 문자들로만 이루어진 일련의 문자열로 바꾸는 인코딩 방식을 가리키는 개념이다. Base64를 글자 그대로 번역하면 64진법이란 뜻이다. 64는 2의 6승으로, 2의 제곱수들에 기반한 진법들 중에서 화면에 표시되는 ASCII 문자들을 써서 표현할 수 있는 가장 큰 진법이다. 이 인코딩은 전자 메일을 통한 이진 데이터 전송 등에 많이 쓰이고 있다.

[그림 5] Base64 색인표

'IT 용어 정리' 카테고리의 다른 글

라이브러리(Library)  (0) 2021.08.27
[21.07.08] IT 용어 정리  (0) 2021.07.08
[21.07.07] IT 용어 정리  (0) 2021.07.07
[21.07.06] IT 용어 정리  (0) 2021.07.06
[21.07.05] IT 용어 정리  (0) 2021.07.05
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/09   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함