전체 글 (774) 썸네일형 리스트형 [파이썬] 텍스트 인코딩 및 디코딩 [1. 개요]특정 charset 으로 인코딩 된 byte stream 을 적절히 인코딩 및 디코딩 하는 방식 정리 [2. 배경지식]인코딩평문(문자) 을 정해진 규칙에 따라 값 으로 표현'A' => 0x41디코딩값을 정해진 규칙에 따라 평문(문자) 로 표현0x41 => 'A'인코딩 / 암호화디코딩 / 복호화[3. 예제]data = b'\xbc\xbc\xc1\xbe\xb4\xeb\xb7\xce'#data = bytes([0xbc, 0xbc, 0xc1, 0xbe, 0xb4, 0xeb, 0xb7, 0xce])# 혹은 위와 같이 작성 가능.try: print("decoding result", data.decode('utf-8'))except Exception as e: print("error", e)p.. multibyte string to widechar string [1. 개요]멀티바이트 형태의 문자열(UTF-8) 을 wide char 형태의 문자열(유니코드) 로 변환하는 방법 정리.[2. 오해]std::string 을 std::wstring 으로 변환하는 방법을 단순히 아래와 같은 방법으로 알고 있었는데, 아래 방법은 틀린 방법이다.std::wstring wstr(str.begin(), str.end());위 코드는 단순히 멀티바이트 형태의 string 의 내부 버퍼를 복사할 뿐이다.#include #include #include int main(){ const char * buf = "안녕하세요"; std::string str = buf; std::wstring wstr(str.begin(), str.end()); .. iconv 함수 (인코딩 변환) [1. 개요]리눅스 C++ 코드 작성 시, 영어 외 문자열을 다루기 위해서 경우에 따라 인코딩 변환이 필요함.윈도우 OS 의 경우, 디폴트 인코딩이 EUC-KR리눅스 OS 의 경우, 디폴트 인코딩은 UTF-8가령 윈도우 에서 작성된 파일(한글로 작성된) 을 리눅스에서 읽어서 출력해야 하는 경우,,또, 윈도우에서 컴파일 할 경우 기본적으로 문자열을 EUC-KR 로 처리하고,리눅스에서 컴파일 할 경우는 문자열을 UTF-8 로 처리함.[2. 상황]리눅스 에서 아래 파일의 인코딩이 UTF-8 이 아닌 것을 확인.euc.cpp: text/x-c; charset=iso-8859-1이 파일의 작성된 한글 문자열은 출력 시 깨져서 나옴.## 반대로 아래와 같은 파일은 윈도우에서 컴파일 후 출력하면 한글 문자열이 깨져서.. 이전 1 ··· 25 26 27 28 29 30 31 ··· 258 다음