구글 노트북 쓰시는 분들은 잘 아시겠습니다만 구글 노트북엔 태그 기능이 없습니다. 그저 "Add note"가 있을 뿐. 이제는 거의 안쓰는 사이트를 찾아 보기 힘들 정도로 유행이 된 태그 기능을 구글은 왜 구글 노트북에 집어넣지 않았을까요? 태그가 쓸모 없는 기능이라고 보고 있는 걸까요? 아니면 사용자에 의한 분류 자체가 의미 없다고 보고 있는 걸까요? 그것도 아니면, 설명(note)만 써 주더라도 다 알 수 있다는 구글의 자연어 추출 인덱싱 능력에 대한 자신감일까요?
태그, 즉 폭소노미는(위키에 따르면 태그=폭소노미 입니다) 집단 지성(Collective Intelligence)을 구현하기 위한 효율적인 수단이라고 이미 인정 받았습니다. (집단 지성이 집단 지성이 아닌 건 다 아시죠?) 그걸 쓰지 않겠다는 것은 구글 노트북을 딜리셔스 처럼 집단 지성을 구현하는 방향으로 발전시키지 않고 그저 개인적인 스크랩 북으로 쓰고 사용자 끼리 내용만 공유하라는 것이거나, 아니면 앞으로 구글이 사람들이 저장한 구글 노트북의 데이터를 이용한다고 하더라도 동일 페이지가 스크랩 된 횟수에 대한 정보 정도만 페이지랭크에 반영하겠다는 뜻 일까요?
일단 지메일에는 레이블 기능이 있습니다. 뭐 굳이 이름을 태그라고 부르지 않겠다는 고집은 이해하겠습니다. UCC도 굳이 UGC(User Generated Content)로 부르는 사람들이니까. 하지만, 구글 노트북 같이 자료를 모으고 분류하는 애플리케이션에 왜 애시당초 태그기능을 넣지 않았을까요? 정말 궁금해 죽겠습니다. 누구 아시는 분 좀 알려주세요.
생각해보면 구글의 마케팅 능력은 참 뛰어납니다.
새로 발표하는 서비스명을 대부분 보통 명사로 정하는 것도 평범한 듯 하지만 정말 기발한 마케팅 방법입니다. 노트북, 베이스, 맵스, 어스, 로컬, 캘린더, 트랜즈, 비디오, 채트, 토크 등등을 그냥 그대로 문장안에 써 넣으면 헷갈리게 됩니다. 그래서 반드시 구글 노트북, 구글 베이스, 구글 맵스, 구글 어스, 구글 로컬, 구글 캘리너, 구글 트랜즈, 구글 비디오, 구글 채트, 구글 토크 등등 이라고 매번 "구글"을 쓰게 됩니다. 머릿 속에 구글이라고 새겨진 도장을 쾅쾅 찍는 것 같습니다. 게다가, 새로운 브랜드를 만들어 내느라 크게 고민하지 않아도 됩니다. (아. 구글 스토어나 구글 옥션이 나오는 날엔 정말 아마존과 이베이는 긴장 될 겁니다. 하긴 구글 스토어는 벌써 있군요. 구글 기념품 판매하는.)
구글은 자신을 검색 기술 회사로 포지션 하고 있지만, 그들을 오늘날의 위치에 올려 놓은 데는 그들의 뛰어난 마케팅 능력도 큰 몫을 했습니다. 초창기에 "구글"을 "인터넷에서 검색한다"와 동의어로 만들어 일상 대화에서 사용하기 시작하고 그걸 퍼뜨린 것이나, 로고는 회사를 상징하는 것이므로 변하지 않는다는 고정관념을 깨뜨리고 재미있는 로고를 때때로 내거는 것이나, Gmail과 orkut에서 시도했던 성공적인 초대 마케팅이나, 만우절마다 재미있는 농담을 발표해서 돈 한 푼 안들이고 홍보하는 것이나, 무얼 하나 하더라도 다른 사람 하는 대로 하지 않고 기발한 방법을 써서 홍보효과를 가져갑니다. 그리고 그것이 충격적이라거나, 선정적이지도 않습니다. 하지만 사람들의 이목을 끕니다. 어디선가 본 글에 구글은 신규 서비스를 내놓으며 매뉴얼을 자세히 쓰지 않아도 사람들이 알아서 매뉴얼을 쓰고, 팁을 찾아내고, 버그리포트까지 만들어 주니, 그저 그걸 검색엔진에서 인덱싱하면 된다는 요지의 내용이 있었습니다. MS가 오피스 사면 끼워주던 그 두툼한 매뉴얼을 만들고 유지하느라 얼마나 많은 인력과 비용을 들였을까요? 구글 참 볼수록 대단하고 영리합니다.
심지어 과거에 주방장 채용 공고마저 "세상에서 최초로 스톡옵션을 부여 받을 주방장을 모집합니다" 라고 내걸었던 적이 있습니다. 그 사진이 블로고스피어에 화제가 되어 한 동안 돌아 다녔지요. (지금 그 사진을 찾아 보려니 못 찾겠네요. 구글에서 검색했는데...ㅎㅎ)
[간략히 태그에 관해]
이전의 포스트에서도 썼듯이 사용자에 의한 분류, 즉 포크 택사노미(folk taxanomy)의 가능성에 관해 처음 사람들에게 아이디어를 제공한 것은 냅스터 같은 P2P였습니다. 오래 전에 만들어진 CD의 포맷의 기술적 한계 때문에 사람들이 CD에서 MP3를 추출하면 (초기엔 CDDB같은 서비스가 없었으므로) "Track 1"과 같이 저장 되었습니다. 따라서 사람들은 파일 이름을 자신이 알 수 있는 텍스트로 바꾸게 되는데, 이 과정에서 CD 속지에 써 있는 대로 적지 않고, 자기 편한대로 고치는 경향이 있었습니다. 그러다 보니 "Track 3 오! 필승 코리아 - 윤도현"이 아니라 "월드컵 응원가"로 하거나, "Track 8 You are beautiful - James Blunt" 대신에 "대우자동차CF주제가" 로 붙이기도 하고, 아니면 단순히 노래의 후렴구로 파일 제목을 붙이는 사람들이 많이 생겨났습니다. 그런데 오히려 이게 원하는 파일을 찾는 데 더 도움이 되는 경우가 많다는 사실을 알게 된 것 입니다. 딱히 그렇게 의도하진 않았지만 P2P가 폭크 택사노미의 길을 열어 준 것입니다.
이후 플릭커와 딜리셔스가 태그(폭소노미)를 잘 활용하여, 분류와 검색에 유용한 도구로 사용할 수 있게 했습니다. 사실 태그는 키워드 검색이 안되는 데이터 포맷에 적절합니다. 예를 들면, MP3, 사진, 동영상, URL 같은, 그 내용이 텍스트가 아니라서 키워드 검색이 안되는 데이터에 메타태그로 키워드를 적어 넣는 것이 태그를 붙이는 것입니다. 따라서 블로그의 포스트나 평판같은 텍스트 자료에서는 태그를 적으려고 해도 이미 본문에 다 있는 것 같아 몇가지 적고 나면 더이상 무얼 적어야 할 지 막막한 경우가 많고, 태그의 효용도 앞에 언급한 것들보다 떨어지는 게 됩니다. 물론, 키워드 안에 정보가 다 포함되어 있더라도, 어떤 태그를 붙이느냐에 따라 어떤 것이 더 중요하다는 가중치를 검색엔진에 전달 할 수 있고(검색엔진이 테크노라티 처럼 태그를 알 수 있게 디자인되어 있다면), 태그를 붙인 사람에게 그 데이터가 가지는 의미의 앵글을 파악하여 개인화 서비스에 기초 데이터로 사용할 수 있다는 장점이 있긴 합니다.
태그에 대해 PRAK가 요새 고민 중인 것은 스페이스나 콤마 같은 구분자의 포함 여부의 문제 입니다. 딜리셔스와 플릭커는 스페이스 없이 다 붙여 쓰도록 되어 있습니다. 반면 태터툴즈나 야후 허브는 스페이스나 콤마를 허용합니다. 예를 들면, 플릭커나 딜리셔스 같은 사이트는 "웹2.0" 이라고 써야만 합니다. "웹 2.0"이라고 쓰면 받아들이지 않거나 "웹"과 "2.0"이 태그가 됩니다. 이렇게 하면 명확한 장점이 있습니다. 사람들을 같은 용어에 대해 한가지 표기법을 쓰도록 유도할 수 있고, 그러므로 추후에 운영자가 같은 의미의 단어끼리 묶어 주는 공용 태그 작업이 많이 줄어든다는. 하지만 가독성이 떨어지게 됩니다. 반면 야후 허브처럼 띄어 쓴 것을 태그 구름에 보여주면 한 무리의 단어로 보이지 않게 될 수가 있습니다. 물론 마우스 오버되면 반전시켜 보여주는 방법을 쓰지만 직관적으로는 다른 두개의 단어로 인식할 확률이 높습니다. 경우에 따라 어떤 태그 원칙을 가져갈 지 구분해서 생각해 보는 중에 있습니다. 누군가 명확한 원칙을 아시는 분은 저에게도 좀 알려 주십시오.
마지막으로 한가지 더, CDDB도 참 흥미로운 모델입니다. RealJukeBox, WinAmp, MusicMatch 등의 플레이어가 CD를 재생할 때 자동으로 앨범 제목과 노래 제목들을 보여주는 것은 CDDB의 DB를 이용한 것입니다. (지금은 오픈 소스 사람들을 배신하고 www.gracenote.com으로 바뀌었습니다.) 다들 CDDB가 각 음반의 타이틀과 노래 제목/순서 DB를 음반사에서 구매하여 모아 놓고 서비스하는 거라고 생각하기 쉽지만, 사실 CDDB는 사람들의 참여를 통해 DB를 구축했습니다. 사람들이 자신의 CD를 넣었는데 노래 제목이 안뜨면 자발적으로 처넣어서 CDDB의 DB에 저장해 주었습니다. 어떤 CD건 한 번만 넣어 주면 되므로 많은 열정적인 CD 콜렉터들이 참여한 결과 결국에는 거대한 DB를 소유하게 되었고 이걸로 돈방석에 앉았습니다.
CDDB가 창조적이었던건 각 CD의 프라이머리 키를 정한 방식입니다. 앞서 말한 바와 같이 CD의 포맷이 처음 정해질 때는 저장용량을 절약하기 위하여 - Y2K 문제를 일으킨 YY/MM/DD처럼 - 데이터를 최대한 줄여서 넣어야 했기에, 대부분의 CD에는 노래 이외의 정보라곤 트랙 넘버와 노래의 길이(시간) 밖에는 없습니다. (그래서 CD 플레이어에서는 노래 제목을 표시할 수 없었습니다.) 정작 어떤 CD를 다른 CD와 구분하기 위한 키 데이터가 없게 디자인 된 것입니다. 그래서 CDDB는 이렇게 생각했습니다. "만약 한 CD에 평균 10개의 노래가 있고, 각 노래가 1분에서 3분 정도 사이라고 가정하면 - 대충 100초 - 한 CD에 있는 각 노래의 재생시간의 조합은 100x100x...x100=100^10=10^11=100,000,000,000 즉 100억개. 세상에 있는 CD의 총 수가 100억개는 넘지 않으니까 일치할 확률은 매우 작다."
세상엔 똑똑한 사람이 참 많습니다.
트랙백 이란?
이 글의 트랙백 주소 ::
http://www.fortytwo.co.kr/tt/trackback/64
.
2006/05/21 23:18
.
나 자신도 구글 노트북(Google Notebook)의 서비스를 접하면서 “아.. 왜 이제서야..”라는 생각을 하였다. 가끔씩, 이러한 기능을 상상하곤 하였지만 역시나 구글이었다. 우선 그건 그렇고,....
.
2006/07/01 14:23
.
PRAK님 포스트의 제목인데, 노트북을 스크랩의 용도로 한정하지 않는다면 그리고 그런 경우가 더 많다고 가정한다면 태그를 지원하지 않는 것이 더 좋다는 생각입니다. 대신, 섹션이라는 것....