일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Malware Sample
- 로맨스스캠
- Sequoia
- ue4dumper
- 많다..
- CryptoJS
- self-signed
- MongoDB #NoSQL #CreateUser #DropUser #mongod #mognod.conf
- 거래사기
- CJ대한통운 #쿠팡 #통관번호오류 #통관고유번호오류 #안주원팀장 #모건인베스트
- 채팅환전사기
- 보이스피싱 #대검찰청 #명의도용 #비밀번호 #계좌번호 #공공기관 #가짜검찰청
- speed-measure-webpack-plugin
- react
- Frida
- 안전결제
- 네이버카페
- shell_gpt
- 모의해킹
- XSS
- intelmac
- esbuild
- open redirect
- ssrf
- 변태는
- 허리디스크
- NUGU
- 중고나라
- 척추관협착증
- 취약점
- Today
- Total
annyoung
python 윈도우 한글문제 본문
문제점_____________________________________
1. 윈도우 cmd 쉘에서는 한글이 자꾸 깨진다.
2. raw_input으로 입력받아서 urllib.quote()로 url encoding해주면 윈도우와 리눅스는 다른 결과값이 나온다.
주절주절___________________________________
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
print u'한글' # 고정으로 변수에 한글을 넣을 경우 맨앞에 u를 붙인다.
print repr(raw_input('input korean : ')) # 윈도우 cmd 쉘에서 "한글" 단어를 입력할시 '\xc7\xd1\xb1\xdb'로 보여진다.
#print repr(raw_input('input korean : ')) # 리눅스 bash 쉘에서 "한글" 단어를 입력할시 '\xed\x95\x9c\xea\xb8\x80'로 보여진다.
삽질하다가 알게된건 다음과 같다.
윈도우 cmd 쉘에서 입력 받은 한글(\xc7\xd1\xb1\xdb)은 euc-kr로 되어 있는 것이고,
리눅스 bash 쉘에서 입력 받은 한글( \xed\x95\x9c\xea\xb8\x80)은 utf-8로 되어 있는 것이다.
해결방법___________________________________
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
print repr(raw_input('input korean : ').decode('euc-kr').encode('utf-8')) # '\xed\x95\x9c\xea\xb8\x80' 결과는 결국 utf-8로 나오고 잘 출력된다.
'프로그래밍' 카테고리의 다른 글
[javascript] get ip only using javascript (5) | 2018.04.19 |
---|---|
python ctypes GetFileVersion (0) | 2016.11.09 |
python unicode unescape (html unescape) (0) | 2015.11.07 |
django standard install.. (0) | 2015.10.13 |
Convert Facebook username to id (0) | 2015.04.12 |