일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 헤드라인
- 20201015뉴스
- 헤드라인모음
- 20201018뉴스
- 기사헤드라인
- 헤드라인뉴스
- 파이썬
- 알고리즘
- 크롤링
- 뉴스
- 20200615뉴스
- 20201013뉴스
- LeetCode #Python #알고리즘 #코딩테스트 #interview
- json
- 백준
- 20201016뉴스
- Python
- 코테
- encoding
- C++
- 20201017뉴스
- 20200816뉴스
- 헤드라인기사
- 20201011뉴스
- 백준2225
- 기사
- 오늘의뉴스
- MySQL
- 뉴스헤드라인
- 경제뉴스
Archives
- Today
- Total
HelloCho
[C#] Encoding 한글 깨질때 본문
html 코드를 읽을 일이 생겨서
<meta charset="utf-8">
html 코드에서 "UTF-8" charset 이길래 "UTF-8"로 인코딩을 했는데 아무리해도 한글만 깨져서 나오는것이였다.
아무리 encoding을 해도 한글이 깨질때 확인해야 하는 것이 있다.
reponse로 오는 CharacterSet 값으로 인코딩이 어떻게 되어서 오는지 확인해보자.
var httpWebResponse = (HttpWebResponse)response;
string characterSet = httpWebResponse.CharacterSet;
CharacterSet 값을 확인해보니 "UTF-8"이 아닌 "EUC-KR" 로 인코딩이 되어있는 것을 확인하였다.
다음 예시는 참고 코드입니다.
using (WebResponse response = request.GetResponse())
{
var httpWebResponse = (HttpWebResponse)response;
string characterSet = httpWebResponse.CharacterSet;
using (Stream stream = response.GetResponseStream())
{
using (StreamReader streamreader = new StreamReader(stream, EUCKR, true))
{
html = streamreader.ReadToEnd();
}
}
}
https://docs.microsoft.com/ko-kr/dotnet/api/system.net.httpwebresponse.characterset?view=netcore-3.1
'C#' 카테고리의 다른 글
[C#]utf-8에서 euckr로 인코딩하기 (0) | 2021.06.02 |
---|---|
[C#] 2021 C# 코딩 가이드 (0) | 2021.05.04 |
[C#] UTF8 인코딩 하기 (0) | 2021.03.25 |
[C#] http post 방식으로 json Data Parameter 보내기 (0) | 2021.03.22 |
[C#] euc-kr 인코딩 하기 (0) | 2020.05.22 |
Comments