02-1) 0과 1로 숫자를 표현하는 방법
- 정보 단위
- 컴퓨터는 0과 1밖에 이해하지 못하는데, 0과 1을 나타내는 가장 작은 정보 단위를 비트(bit)라고 한다.
- n개의 비트로 표현할 수 있는 상태는 2^n가지이다.
1바이트 (1byte) |
8비트(8bit) |
1 킬로바이트 (1kB) |
1,000 바이트 (1,000byte) |
1 메가바이트 (1MB) |
1,000 킬로바이트 (1,000kB) |
1 기가바이트 (1GB) |
1,000 메가바이트 (1,000MB) |
1 테라바이트 (1TB) |
1,000 기가바이트 (1,000GB) |
- 이진법 (binary)
- 0과 1만으로 모든 숫자를 표현하는 방법
- 이진법으로 표현할 수를 이진수라고 함
- 이진수로 음수를 표현하기 위해서는 2의 보수를 구해 음수로 간주하는 법이다.
- 컴퓨터 내부에서 양수인지 음수인지를 구분하기 위해 플래그를 사용한다.
02-2) 0과 1로 문자를 표현하는 방법
- 문자 집합 (character set)
- 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
- 인코딩 (encoding)
- 문자 집합에 속한 문자를 0과 1로 변환하는 과정
- 0과 1로 이루어진 문자 코드를 문자로 변환하는 과정은 문자 디코딩(decoding)
- 문자 집합 종류
- ASCII (아스키코드) : 영어 알파벳과 아라비아 숫자, 일부 특수 문자를 포함
- EUC-KR : 한글 인코딩용 문자 집합(완성형 인코딩 방식)
- 유니코드, UTF-8 : 유니코드 문자집합은 EUC-KR 보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘도 표현 가능함UTF-8은 통상 1바이트부터 4바이트까지의 인코딩 결과를 만들어 낸다.
- 유니코드의 인코딩 방식에 따라 UTF-8, UTF-16, UTF-32등으로 나뉨