유니코드(Unicode)

CODEDRAGON Development/Python

반응형



 

 

유니코드(Unicode)

·       다국어 문자를 제대로 표현하기 위해 유니코드 타입을 지원합니다.

·       모든 문자열(String) 기본적으로 유니코드입니다.

·       유니코드 이외의 인코딩이 있는 문자열은 bytes 표현됩니다.

 

 

>>> type('파이션')

<class 'str'>

>>> '파이션'.encode('UTF-8') #인코딩이 있는 문자열로 인코딩함수를 통해 가공하면 bytes 결과가 나옴

b'\xed\x8c\x8c\xec\x9d\xb4\xec\x85\x98'

>>> type(''.encode('UTF-8'))

<class 'bytes'>

 

 

 

 

 

 

명시적 유니코드 지정

·       문자앞에 u문자를 붙여서 명시적으로 유니코드로 지정할 있습니다.

·       2.x에서는 type()확인시 <type 'unicode'>라고 표시되었지만 3.x에서는 <class 'str'> 표시됩니다.

·       3.x부터 모든 문자를 유니코드로 처리하므로 명시적으로 유니코드로 지정할 필요가 없습니다.

 

print(u"안녕하세요")

print(u'Hello')

 

print(type(u"안녕하세요"))

print(type(u'Hello'))

<class 'str'>

<class 'str'>