일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 오늘의뉴스
- 파이썬
- 뉴스
- 기사
- 크롤링
- 백준
- 20201015뉴스
- 기사헤드라인
- 헤드라인뉴스
- 백준2225
- 알고리즘
- 경제뉴스
- 20201017뉴스
- 20201011뉴스
- 20200615뉴스
- 코테
- encoding
- json
- 20201018뉴스
- C++
- LeetCode #Python #알고리즘 #코딩테스트 #interview
- MySQL
- 헤드라인기사
- Python
- 헤드라인
- 뉴스헤드라인
- 20201016뉴스
- 20201013뉴스
- 헤드라인모음
- 20200816뉴스
- Today
- Total
목록encoding (4)
HelloCho
utf-8로 되어있는 문자를 euckr로 변환하는 코드입니다. euc-kr에서는 지원하지 않는 문자를 넣고 변환을 하는 경우에는 '?'로 대체 하여 출력하게 됩니다. 다음은 예시 코드입니다. 지원하지 않는 유니코드 문자를 넣고 코드를 실행하면 ?? 로 찍혀서 나오게 됩니다. using System; using System.Text; namespace ConsoleApp1 { class Program { static void Main(string[] args) { int euckrCodePage = 51949; // euc-kr 코드 번호 Encoding.RegisterProvider(System.Text.CodePagesEncodingProvider.Instance); Encoding euckr = En..
utf8로 인코딩 하는 예시 코드를 작성해 보았습니다. 한글로 프로그래밍이라는 키워드를 입력후 utf8로 인코딩 하는 코드입니다. string keyword = "프로그래밍"; var bytes = Encoding.UTF8.GetBytes(keyword); var data = Encoding.UTF8.GetString(bytes); Console.WriteLine(data);
html 코드를 읽을 일이 생겨서 html 코드에서 "UTF-8" charset 이길래 "UTF-8"로 인코딩을 했는데 아무리해도 한글만 깨져서 나오는것이였다. 아무리 encoding을 해도 한글이 깨질때 확인해야 하는 것이 있다. reponse로 오는 CharacterSet 값으로 인코딩이 어떻게 되어서 오는지 확인해보자. var httpWebResponse = (HttpWebResponse)response; string characterSet = httpWebResponse.CharacterSet; CharacterSet 값을 확인해보니 "UTF-8"이 아닌 "EUC-KR" 로 인코딩이 되어있는 것을 확인하였다. 다음 예시는 참고 코드입니다. using (WebResponse response = re..
euc-kr 로 되어있는 string 인코딩 하다가 만난 error utf-8은 이런식으로 작성하면 되었는데 Encoding UTF8 = Encoding.GetEncoding("utf-8"); euc-kr은 System.NotSupportedException error가 발생하였다. int euckrCodePage = 51949;// euc-kr 코드 번호 System.Text.Encoding euckr = System.Text.Encoding.GetEncoding(euckrCodePage); 알고보니, 추가 문자 인코딩이기 때문에 인코딩 등록자를 지정 해야한다는 것이였다. RegisterProvider를 사용하여 error 해결. int euckrCodePage = 51949;// euc-kr 코드 번..