NFT 대체재? 인터넷 아카이브 (Internet Archive) 25주년

요즘 대체 불가능한 토큰(NFT, Non-Fungible Token)이 대세입니다. 블록체인을 활용해 복제 가능한 디지털 콘텐츠에 고유값을 붙여서 경매 가능한 희소성 높은 예술품과 비슷한 가치를 부여하는 것인데요. NFT로 제작한 디지털 컨텐츠가 암호화폐처럼 과도한 가치가 매겨지거나, 위작이면 이를 감별할 수단이 없다는 측면에서 거품이라는 반론도 만만치 않습니다. 기존 고가품 경매 시장이라는게 그들만의 리그였고, 위작 시장도 있는 만큼 NFT 자체는 새로운 시도로 의미는 있다고 생각합니다.

제가 왜 NFT이야기를 꺼냈느냐 하면… 디지털 콘텐츠는 누군가 소유하는 게 아니라 공유하는 것이 더 중요하기 때문입니다. NFT와 정반대의 위치에 있는 대체제라고 부를 수 있는 활동 중 하나인 인터넷 아카이브'(Internet Archive)가 올해로 25주년을 맞이 했습니다.

■ 인터넷 아카이브란?

인터넷 아카이브는 현실 박물관처럼 디지털 콘텐츠를 언제나 방문하거나 이용할 수 있는 공공재의 성격을 가지고 있습니다. 과거 웹 사이트 뿐만 아니라 오디오, 비디오 등 다양한 콘텐츠들을 저장하고 있습니다.

인터넷 아카이브 25주년 기념 페이지

2021년 11월 기준으로 인터넷 아카이브는 3천 3백만 개 이상의 책과 텍스트, 740만 개 이상의 영화, 비디오 및 TV 프로그램, 78만개의 소프트웨어 프로그램, 14백만개의 오디오 파일, 4백만 개의 이미지 및 6천2백억 개의 웹 페이지를 보유하고 있습니다. 여러분이 과거의 웹 사이트를 보고 싶다면, 언제든지 인터넷 아카이브에서 검색하면 보실 수 있습니다.

인터넷 아카이브는 1996년 10월 웹 페이지의 스냅샷을 찍는 최초의 웹 크롤러를 출시했습니다. 당시 월드 와이드 웹의 크기는 약 2.5테라바이트였는데요. 웹 페이지가 사라지기 전에 보관하는 시스템을 만들었는데, 기본적으로 메인 페이지의 링크를 따라가서 전체 웹사이트를 캡처하도록 제작된 PC 애플리케이션이었습니다.

덕분에 제가 학교 다니던 시절 만들었던 비공식 학교 웹사이트를 1996년 12월 버전으로 볼 수가 있습니다. (무려 25년전입니다. ㅎㅎ)

1996년 12월에 수집된 부산대 비공식 홈페이지

웹 사이트를 재미로 만들던 시절에 미래를 위해 웹 사이트를 보존하자는 아이디어는 지금의 NFT 만큼이나 파격적이었던 것 같습니다. 인터넷 아카이브 개발자들도 웹 문서의 잠재적 가치를 증명하려고, 1996년 미국 대통령 후보 웹사이트의 스냅샷을 수집했습니다. 스미소니언 박물관이랑 협력하여 이를 공식 대통령 아카이브에 제공하기도 했습니다. 우리가 과거 웹 사이트의 스냅샷을 볼 수 있는 ‘웨이백 머신(Wayback Machine)‘은 20년전인 2001년 10월에 본격적으로 시작되었습니다.

인터넷 아카이브는 대부분 자동으로 콘텐츠를 수집하지만, 구글 검색처럼 직접 수집 요청을 할 수 있습니다. 특정 웹 페이지 방문할 때, 나중에도 볼 수 있게 남겨야 하겠다고 생각하면, 웹 브라우저 확장 기능을 통해 언제든지 손쉽게 수집 요청이 가능합니다.

가끔 이런 생각도 합니다. 제가 죽으면, 이 블로그는 어떻게 될까? 저희 애들이 블로그 서버 관리를 해 줄 것도 아닐거 같고… 후세대에 뭔가 전달할 방법은 인터넷 아카이브 밖에 없지 않을까 싶습니다. 모든 웹 사이트는 언젠가는 문을 닫고 없어질 겁니다. 과거에 열심히 사용하던 웹 사이트는 없어지고 우리가 지금 사용하는 것들도 마찬가지입니다.

■ 인터넷 아카이브의 현재와 미래

인터넷 아카이브를 시작한 분은 브루스터 칼(Brewster Kahle)입니다. 우리가 익히 아는 인터넷 랭킹 사이트인 알렉사(Alexa)를 처음 만든 분이기도 하고, 아마존에 매각한 후에 비영리 재단을 계속 운영하고 있습니다.

2006년 초에 시작된 아카이브 잇(Archive It)은 디지털 아카이브를 만들 수 있도록 하는 웹 보관 서비스로서 800개 이상의 도서관이 자체 장서 시스템을 구축하도록 지원하고 있습니다. 2020년 9월 부터는 인터넷 아카이브 스칼라(Internet Archive Scholar)를 통해 2500만개 이상의 18세기 연구 논문 사본 부터 최신 학술 문서 등을 수집하고 있습니다.

2021년 현재 25백만건의 영어 자료, 15만건의 일본어 자료가 있는데 대비 한국어 자료는 2만8천건에 불과 합니다. 신기한 것인 한국어 자료 중에 북한에서 사용하고 있는 C++ 컴퓨터 프로그램 수업용 도서도 볼 수 있다는 점입니다.

북한의 프로그람 수업 교재 ‘ANSI C++ 객체지향 쏘프트웨어’

과거 종이책을 스캔하여 올리는 작업은 2006년 시작된 오픈 라이브러리(Open Library)라는 오픈 소스 프로젝트를 통해서 진행되고 있습니다. 인터넷 아카이브가 지원한 이 프로젝트는 2013년 유명을 달리한 애런 스워츠(Aaron Swartz)가 첫 개발자이기도 합니다. 저도 그 이후에 제가 저술한 모든 오프라인 자료는 #pdftribute로 헌정하기도 했습니다.

인터넷 아카이브 25주년을 맞았지만 여전히 지나치게 광범위한 저작권법, 라이선스 제약, 국가별 차단으로 인해 공공재로서 인터넷 자료는 여전히 제한되는 상황입니다. 25년 뒤인 2046년의 웹 사이트가 어떻게 보일지 만들어진 Wayforward Machine 사이트는 이러한 미래를 재미있게 풍자하고 있습니다.

저는 NFT 같은 기술 보다는 누구나 데이터를 공유하고 쉽게 접근할 수 있도록 하는 기술에 관심이 더 많습니다. 그렇기 때문에 오픈 소스 뿐만 아니라 위키 백과, 크레이티브 커먼즈, 인터넷 아카이브 같은 오픈 프로젝트가 중요합니다. 여러분이 가치있다고 생각하는 웹 페이지를 수집하도록 버튼을 누르는 작은 일 부터 시작해서 아주 작은 금액을 기부하는 행동으로도 충분히 도움이 될 수 있습니다.

- ;

Disclaimer- 본 글은 개인적인 의견일 뿐 제가 재직했거나 하고 있는 기업의 공식 입장을 대변하거나 그 의견을 반영하는 것이 아닙니다. 사실 확인 및 개인 투자의 판단에 대해서는 독자 개인의 책임에 있으며, 상업적 활용 및 뉴스 매체의 인용 역시 금지함을 양해해 주시기 바랍니다. (The opinions expressed here are my own and do not necessarily represent those of current or past employers. Please note that you are solely responsible for your judgment on checking facts for your investments and prohibit your citations as commercial content or news sources.)

ZH-CN EN JA KO