python

[python] 집합형 - 문자열 함수 모음

전감자(◔◡◔) 2022. 9. 22. 22:08
'''

집합형
1. 문자열
-표현: '홍길동',"홍길동",triple 형식
-타입: type("홍길동") ==> <class 'str'>
                    ==> 문자열은 클래스로 만들어짐
                    ==>클래스 구성요소()
-특징: 값 변경 불가(immutable)
-함수 정리 dir(str)

2. 문자열 종류 2가지
    가. bytes 타입의 문자열
    ==> b"hello"
    ==> b"홍길동"

    나. 유니코드 문자열
    예> "hello"
        "홍길동"

    =====> 크롤링 데이터(크롤링이란 인터넷에 돌아다니는 임의의 자료를 수집하는 것을 의미)를
    수집했을 때 포맷이 bytes 타입이다.

    encode(암호화): 유니코드 문자열을 binary문자열로 바꾸는 작업
    decode(복호화): 바이트 타입으로 받은 문자열을 유니코드 문자열로 바꿔줌
'''

# 1. (유니코드) 문자열
s="hello홍길동"
s2=s.encode()
print(s,s2,type(s2)) #hello홍길동 b'hello\xed\x99\x8d\xea\xb8\xb8\xeb\x8f\x99' <class 'bytes'>

# 복호화
print(s2.decode())