CODEDRAGON ㆍDevelopment/Python
유니코드(Unicode)
· 다국어 문자를 제대로 표현하기 위해 유니코드 타입을 지원합니다.
· 모든 문자열(String)은 기본적으로 유니코드입니다.
· 유니코드 이외의 인코딩이 있는 문자열은 bytes로 표현됩니다.
>>> type('파이션') <class 'str'> >>> '파이션'.encode('UTF-8') #인코딩이 있는 문자열로 인코딩함수를 통해 가공하면 bytes로 결과가 나옴 b'\xed\x8c\x8c\xec\x9d\xb4\xec\x85\x98' >>> type('파'.encode('UTF-8')) <class 'bytes'> |
명시적 유니코드 지정
· 문자앞에 u문자를 붙여서 명시적으로 유니코드로 지정할 수 있습니다.
· 2.x에서는 type()확인시 <type 'unicode'>라고 표시되었지만 3.x에서는 <class 'str'>로 표시됩니다.
· 3.x부터 모든 문자를 유니코드로 처리하므로 명시적으로 유니코드로 지정할 필요가 없습니다.
print(u"안녕하세요") |
print(u'Hello') |
print(type(u"안녕하세요")) print(type(u'Hello')) |
<class 'str'> <class 'str'> |
'Development > Python' 카테고리의 다른 글
파이 차트(pie chart) (0) | 2020.01.17 |
---|---|
문자열 포멧팅 - 정렬 (0) | 2020.01.16 |
문자열 내장함수, 문자열 내장함수들 (0) | 2020.01.16 |
고급 문자열 포매팅, 고급 문자열 포매팅 방법 (0) | 2020.01.16 |
변환 지시어(Conversion Specifier) (0) | 2020.01.16 |