Daum 유니코드(UTF-8)에 도전하다

지난 주 목요일에 Daum의 커뮤니티 섹션(카페, 블로그, 플래닛)의 개편이 있었습니다. 그냥 보기엔 일상적인 디자인과 콘텐츠 개편으로 보입니다만 실제 중요한 이슈 한 가지가 숨겨져 있습니다. 그것은 다름 아닌 모든 페이지가 유니코드(UTF-8) 인코딩 지원으로 변경된 것입니다. 국내 웹 페이지들과 데이터 대부분은 지금까지 한글 완성형 코드(KSC5601)를 표현하는 EUC-KR 인코딩 방식을 주로 사용해 왔습니다. 따라서 UTF-8 지원이 대규모 웹 서비스에서 이루어진 것은 꽤 고무적이라고 볼 수 있습니다.

물론 Daum에서 UTF-8을 사용한 첫 서비스는 아닙니다. 협력 사진 공유 서비스인 Daum Pie가 신규 서비스로 개발될 작년 처음 UTF-8을 도입했습니다. 이번 커뮤니티 섹션 전체 적용에서는 이 사례와 경험을 기초로 작업해서 얻은 성과 입니다. 물론 개별 카페, 블로그, 플래닛과 데이터 전체가 전환된 것은 아니고 탑 섹션만 바뀌었지만 향후 UTF-8으로 가기 위한 초석을 쌓았다고 생각합니다.

UTF-8과 EUC-KR에 대한 장단점 문제는 오랫동안 논란이 되어 온 문제입니다. UTF-8 인코딩이한국어만 주로 표시하는 국내 웹 사이트에는 부적절하다는 이유도 있기도 합니다. 그러나, EUC-KR을 사용하면 ‘아햏햏’, ‘붺’ 같은 단어나 ‘다’ 같은 조선 시대 고어(古語) 등 우리말인데도 표시할 수 없다는 문제점이 있습니다. 이런 이유로 네이버 국어 사전은 UTF-8을 인코딩을 사용하고 있습니다. 뿐만 아니라 세계화 시대에 다른 외국어를 섞어 써야 하거나 다른 언어 운영체제(OS)에서 폰트 없이도 한글을 볼 수 있게 하려면 UTF-8이 꼭 필요하다고 하겠습니다.

해외 웹2.0 기업과 서비스들에서 공통적으로 나타나는 열 가지 기술 요소에 UTF-8이 들어가 있습니다. 글로벌 서비스를 지향하고 모든 나라와 문자를 표현 하게 하기 위한 수단으로 UTF-8은 매우 기본적인 요소입니다. 블로그 검색 서비스인 Technorati의 경우 비영어 콘텐츠가 60%가 넘고 있습니다. 만약 Technorati가 ISO-8859-1 인코딩 서비스를 썼다면 그런 컨텐츠를 수집하지 못했겠죠.

DB 용량이나 데이터 전환 비용과 같은 기타 문제를 떠나서 개발자들이 UTF-8으로 전향하기 가장 힘든 것이 바로 손에 익지 않은 개발 환경 때문입니다. 그건 마치 웹 표준 개발 방식으로 전향하는 문제랑 비슷합니다. 한번 익히고 세팅 한번만 하면 쉬운 문제이지요. IT산업이 글로벌 무한 경쟁으로 나가는 요즘 어렵지만 기본에 좀 더 충실해 지는 것은 우리가 향후 경쟁에서 싸워 이기는 데 큰 도움이 될 것입니다.

p.s. 이 프로젝트를 위해 고생한 mtgear에게 심심한 사의를…
p.s. 네이버 메일 UTF-8 전환도 이루어 지고 있다는 소식. 변화의 모습이 보기 좋습니다. 간발의 차네요.

- ;

Disclaimer- 본 글은 개인적인 의견일 뿐 제가 재직했거나 하고 있는 기업의 공식 입장을 대변하거나 그 의견을 반영하는 것이 아닙니다. 사실 확인 및 개인 투자의 판단에 대해서는 독자 개인의 책임에 있으며, 상업적 활용 및 뉴스 매체의 인용 역시 금지함을 양해해 주시기 바랍니다. 본 채널은 광고를 비롯 어떠한 수익도 창출하지 않습니다. (The opinions expressed here are my own and do not necessarily represent those of current or past employers. Please note that you are solely responsible for your judgment on checking facts for your investments and prohibit your citations as commercial content or news sources. This channel does not monetize via any advertising.)

여러분의 생각 (8개)

  1. UltraSsaZzang 댓글:

    오… 큰 변화네요.
    컨텐츠 싸움에서 앞서 갈 수 있는 발판이 되지 않을까 살짝 상상해봅니다.

  2. 신현석 댓글:

    우와! 역시 Daum이군요!

  3. 들불 댓글:

    획기적이군요. 짝짝짝~~~^^
    포털사이트 중…웹표준W3C를 지키려 노력하는 DAUM….응원합니다…특히…다음 블로그(전 설치형 블로그를 쓰고 있긴 하지만-_-;;).

    전…리눅스 기반에…불여우를 쓰다보니….다음이 그리 고마울 수 없습니다…

    데스크탑을 리눅스로 쓰는 사람은 지극히 적은 비율에 불과하지만….점점 높아져 갈 것이고…불여우가 마소 익스와 쌍벽을 이뤄 맞짱 뜰 날도 곡 올 것이라 봅니다.

    꼭…

  4. yser 댓글:

    반가운 소식이군요.
    2000년에 그토록 바라마지 않았던 웹 환경의 변화가.. 이제서야 조금씩 보이기 시작합니다. 정확히는 작년부터 그런 움직임이 드러나기 시작했지만.. 역시 포털에서 지원하는 건 큰 바람을 일으킬 수 있는 계기죠. UTF-8 환경이 자연스럽게 기본으로 자리잡기를 바랍니다. EUC-KR 이라는 망령은 이제 사라질 때가 되었죠. ^^

  5. 정태영 댓글:

    멋지군요!

  6. nullism 댓글:

    DB 부터 middleware webserver 까지 다 바꿨으려나요?
    흐…. 개발자 분들 제대로 고생하셨겠군요.
    첫단추가 중요한데 거참.. 생각만큼 쉽잖죠..

  7. […] Feeling 국내에 이런 컨퍼런스가 개최된다는 소식을 듣고는 매우 기뻤다. 국내 IT 기업이 컨퍼런스를 주최하는 경우가 드물었었는데 너무 멋진 소식이다. (다음은 기술, 철학적으로 매우 올바른 방향으로 나가고 있다.) 더 많은 사람을 만나고 더 많은 것을 느끼고 싶고 컨퍼런스 진행에 대한 노하우도 보고 싶다. 오리엔테이션에서 사람들이 질문을 안해서 뭔가 질문을 해야겠다는 생각이 들었는데 생각만큼 질문은 못하였다. 먹었던 피자는 맛있었는데 뭔가 길죽한 야채와 호박이 보였다. 피자의 이름을 알아볼 걸이라는 아쉬움이 든다. 화면이 제대로 안보여서 조금 괴로웠다. […]

  8. […] Daum 커뮤니티 섹션이 UTF-8에 도전한 소식에 덧붙여 소스를 열어보면 또 하나의 재미있는 점을 발견할 수 있다. 테이블(table) 태그를 하나도 찾을 수 없다는 점이다. 모든 태그는 웹 표준에 입각해 작성되었으며 웹 표준의 의미를 살리기위해 노력한 흔적을 엿볼 수 있다. 예를 들어 검색버튼에 대한 태그가 으로 되어있고 class 에 스타일을 적용해 “검색”이란 글자가 버튼이미지로 교체되도록 하는등. 이는 곧 이미지가 나오지 않을때도 시각장애인을 위한 스크린리더도 검색버튼을 “검색”으로 인지할 수 있음을 의미한다. […]