개발

잡담: 이미지가 안 나오는데 alt 까지 깨졌다. 왜였을까?

add_text 2021. 9. 8. 13:27

결론: 왜인지는 아직 모르겠다. 아마 okky 가 몇 번 바뀌다보니 생긴 일 정도 아닐까.. 그래도 alt 깨진 건 잘 모르겠다.

 

시작: 오늘 아침~점심까지 크롤링 관련 검색을 하다 이 글을 읽고 대가리 한 번 깨졌다. 그치만 글이 재미있어서 다른 글도 찾아다니다, 코딩 학원 광고와 비전공 개발자 를 읽게 되었다. 글의 마무리에는 참고한 글 목록이 있는데, 그 중 하나가 비전공 6개월 학원 과정을 비판하는 글이었다. 

 

본문: 글을 읽는데 밑의 내용이 쪼까 거슬렸다. 내 눈에만 이렇게 보이는 건가 싶어 개발자모드 열고 확인해보니 alt 가 똑같은 문구로 되어 있었다. 그렇다면 alt가 문제가 아니라, 변환 과정에서 뭔가 꼬였다는 건데... 라는 생각이 들었다. 어차피 웹사이트는 utf-8 아니면 utf-16 정도일텐데 문자가 깨진다? 이건 ascii 였겠구나 확신하고 검색을 해서 이 사이트에 들어갔다.

 

원본 alt="이거 ë­ì•¼ ë¬´ì„œì›Œì— ëŒ€í•œ ì´ë¯¸ì§€ ê²€ìƒ‰ê²°ê³¼"

 

결론: "이거 뭐야 무서워에 대한 이미지 검색결과" 였다. 흔한 인코딩 오류다 이말이야.

ascii는 한글을 16bit(2byte)에 저장하는데, utf-8은 24bite(3byte)에 저장해서 생긴 오류였다.