PRAK's Blog: Versioning Up the Web!
 

구글 노트북 쓰시는 분들은 잘 아시겠습니다만 구글 노트북엔 태그 기능이 없습니다. 그저 "Add note"가 있을 뿐. 이제는 거의 안쓰는 사이트를 찾아 보기 힘들 정도로 유행이 된 태그 기능을 구글은 왜 구글 노트북에 집어넣지 않았을까요? 태그가 쓸모 없는 기능이라고 보고 있는 걸까요? 아니면 사용자에 의한 분류 자체가 의미 없다고 보고 있는 걸까요? 그것도 아니면, 설명(note)만 써 주더라도 다 알 수 있다는 구글의 자연어 추출 인덱싱 능력에 대한 자신감일까요?

태그, 즉 폭소노미는(위키에 따르면 태그=폭소노미 입니다) 집단 지성(Collective Intelligence)을 구현하기 위한 효율적인 수단이라고 이미 인정 받았습니다. (집단 지성이 집단 지성이 아닌 건 다 아시죠?) 그걸 쓰지 않겠다는 것은 구글 노트북을 딜리셔스 처럼 집단 지성을 구현하는 방향으로 발전시키지 않고 그저 개인적인 스크랩 북으로 쓰고 사용자 끼리 내용만 공유하라는 것이거나, 아니면 앞으로 구글이 사람들이 저장한 구글 노트북의 데이터를 이용한다고 하더라도 동일 페이지가 스크랩 된 횟수에 대한 정보 정도만 페이지랭크에 반영하겠다는 뜻 일까요?

일단 지메일에는 레이블 기능이 있습니다. 뭐 굳이 이름을 태그라고 부르지 않겠다는 고집은 이해하겠습니다. UCC도 굳이 UGC(User Generated Content)로 부르는 사람들이니까. 하지만, 구글 노트북 같이 자료를 모으고 분류하는 애플리케이션에 왜 애시당초 태그기능을 넣지 않았을까요? 정말 궁금해 죽겠습니다. 누구 아시는 분 좀 알려주세요.


생각해보면 구글의 마케팅 능력은 참 뛰어납니다.

새로 발표하는 서비스명을 대부분 보통 명사로 정하는 것도 평범한 듯 하지만 정말 기발한 마케팅 방법입니다. 노트북, 베이스, 맵스, 어스, 로컬, 캘린더, 트랜즈, 비디오, 채트, 토크 등등을 그냥 그대로 문장안에 써 넣으면 헷갈리게 됩니다. 그래서 반드시 구글 노트북, 구글 베이스, 구글 맵스, 구글 어스, 구글 로컬, 구글 캘리너, 구글 트랜즈, 구글 비디오, 구글 채트, 구글 토크 등등 이라고 매번 "구글"을 쓰게 됩니다. 머릿 속에 구글이라고 새겨진 도장을 쾅쾅 찍는 것 같습니다. 게다가, 새로운 브랜드를 만들어 내느라 크게 고민하지 않아도 됩니다. (아. 구글 스토어나 구글 옥션이 나오는 날엔 정말 아마존과 이베이는 긴장 될 겁니다. 하긴 구글 스토어는 벌써 있군요. 구글 기념품 판매하는.)

구글은 자신을 검색 기술 회사로 포지션 하고 있지만, 그들을 오늘날의 위치에 올려 놓은 데는 그들의 뛰어난 마케팅 능력도 큰 몫을 했습니다. 초창기에 "구글"을 "인터넷에서 검색한다"와 동의어로 만들어 일상 대화에서 사용하기 시작하고 그걸 퍼뜨린 것이나, 로고는 회사를 상징하는 것이므로 변하지 않는다는 고정관념을 깨뜨리고 재미있는 로고를 때때로 내거는 것이나, Gmail과 orkut에서 시도했던 성공적인 초대 마케팅이나, 만우절마다 재미있는 농담을 발표해서 돈 한 푼 안들이고 홍보하는 것이나, 무얼 하나 하더라도 다른 사람 하는 대로 하지 않고 기발한 방법을 써서 홍보효과를 가져갑니다. 그리고 그것이 충격적이라거나, 선정적이지도 않습니다. 하지만 사람들의 이목을 끕니다. 어디선가 본 글에 구글은 신규 서비스를 내놓으며 매뉴얼을 자세히 쓰지 않아도 사람들이 알아서 매뉴얼을 쓰고, 팁을 찾아내고, 버그리포트까지 만들어 주니, 그저 그걸 검색엔진에서 인덱싱하면 된다는 요지의 내용이 있었습니다. MS가 오피스 사면 끼워주던 그 두툼한 매뉴얼을 만들고 유지하느라 얼마나 많은 인력과 비용을 들였을까요? 구글 참 볼수록 대단하고 영리합니다.

심지어 과거에 주방장 채용 공고마저 "세상에서 최초로 스톡옵션을 부여 받을 주방장을 모집합니다" 라고 내걸었던 적이 있습니다. 그 사진이 블로고스피어에 화제가 되어 한 동안 돌아 다녔지요. (지금 그 사진을 찾아 보려니 못 찾겠네요. 구글에서 검색했는데...ㅎㅎ)


[간략히 태그에 관해]
이전의 포스트에서도 썼듯이 사용자에 의한 분류, 즉 포크 택사노미(folk taxanomy)의 가능성에 관해 처음 사람들에게 아이디어를 제공한 것은 냅스터 같은 P2P였습니다. 오래 전에 만들어진 CD의 포맷의 기술적 한계 때문에 사람들이 CD에서 MP3를 추출하면 (초기엔 CDDB같은 서비스가 없었으므로) "Track 1"과 같이 저장 되었습니다. 따라서 사람들은 파일 이름을 자신이 알 수 있는 텍스트로 바꾸게 되는데, 이 과정에서 CD 속지에 써 있는 대로 적지 않고, 자기 편한대로 고치는 경향이 있었습니다. 그러다 보니 "Track 3 오! 필승 코리아 - 윤도현"이 아니라 "월드컵 응원가"로 하거나, "Track 8 You are beautiful - James Blunt" 대신에 "대우자동차CF주제가" 로 붙이기도 하고, 아니면 단순히 노래의 후렴구로 파일 제목을 붙이는 사람들이 많이 생겨났습니다. 그런데 오히려 이게 원하는 파일을 찾는 데 더 도움이 되는 경우가 많다는 사실을 알게 된 것 입니다. 딱히 그렇게 의도하진 않았지만 P2P가 폭크 택사노미의 길을 열어 준 것입니다.

이후 플릭커와 딜리셔스가 태그(폭소노미)를 잘 활용하여, 분류와 검색에 유용한 도구로 사용할 수 있게 했습니다. 사실 태그는 키워드 검색이 안되는 데이터 포맷에 적절합니다. 예를 들면, MP3, 사진, 동영상, URL 같은, 그 내용이 텍스트가 아니라서 키워드 검색이 안되는 데이터에 메타태그로 키워드를 적어 넣는 것이 태그를 붙이는 것입니다. 따라서 블로그의 포스트나 평판같은 텍스트 자료에서는 태그를 적으려고 해도 이미 본문에 다 있는 것 같아 몇가지 적고 나면 더이상 무얼 적어야 할 지 막막한 경우가 많고, 태그의 효용도 앞에 언급한 것들보다 떨어지는 게 됩니다. 물론, 키워드 안에 정보가 다 포함되어 있더라도, 어떤 태그를 붙이느냐에 따라 어떤 것이 더 중요하다는 가중치를 검색엔진에 전달 할 수 있고(검색엔진이 테크노라티 처럼 태그를 알 수 있게 디자인되어 있다면), 태그를 붙인 사람에게 그 데이터가 가지는 의미의 앵글을 파악하여 개인화 서비스에 기초 데이터로 사용할 수 있다는 장점이 있긴 합니다.

태그에 대해 PRAK가 요새 고민 중인 것은 스페이스나 콤마 같은 구분자의 포함 여부의 문제 입니다. 딜리셔스와 플릭커는 스페이스 없이 다 붙여 쓰도록 되어 있습니다. 반면 태터툴즈나 야후 허브는 스페이스나 콤마를 허용합니다. 예를 들면, 플릭커나 딜리셔스 같은 사이트는 "웹2.0" 이라고 써야만 합니다. "웹 2.0"이라고 쓰면 받아들이지 않거나 "웹"과 "2.0"이 태그가 됩니다. 이렇게 하면 명확한 장점이 있습니다. 사람들을 같은 용어에 대해 한가지 표기법을 쓰도록 유도할 수 있고, 그러므로 추후에 운영자가 같은 의미의 단어끼리 묶어 주는 공용 태그 작업이 많이 줄어든다는. 하지만 가독성이 떨어지게 됩니다. 반면 야후 허브처럼  띄어 쓴 것을 태그 구름에 보여주면 한 무리의 단어로 보이지 않게 될 수가 있습니다. 물론 마우스 오버되면 반전시켜 보여주는 방법을 쓰지만 직관적으로는 다른 두개의 단어로 인식할 확률이 높습니다. 경우에 따라 어떤 태그 원칙을 가져갈 지 구분해서 생각해 보는 중에 있습니다. 누군가 명확한 원칙을 아시는 분은 저에게도 좀 알려 주십시오.

마지막으로 한가지 더, CDDB도 참 흥미로운 모델입니다. RealJukeBox, WinAmp, MusicMatch 등의 플레이어가 CD를 재생할 때 자동으로 앨범 제목과 노래 제목들을 보여주는 것은 CDDB의 DB를 이용한 것입니다. (지금은 오픈 소스 사람들을 배신하고 www.gracenote.com으로 바뀌었습니다.) 다들 CDDB가 각 음반의 타이틀과 노래 제목/순서 DB를 음반사에서 구매하여 모아 놓고 서비스하는 거라고 생각하기 쉽지만, 사실 CDDB는 사람들의 참여를 통해 DB를 구축했습니다. 사람들이 자신의 CD를 넣었는데 노래 제목이 안뜨면 자발적으로 처넣어서 CDDB의 DB에 저장해 주었습니다. 어떤 CD건 한 번만 넣어 주면 되므로 많은 열정적인 CD 콜렉터들이 참여한 결과 결국에는 거대한 DB를 소유하게 되었고 이걸로 돈방석에 앉았습니다.

CDDB가 창조적이었던건 각 CD의 프라이머리 키를 정한 방식입니다. 앞서 말한 바와 같이 CD의 포맷이 처음 정해질 때는 저장용량을 절약하기 위하여 - Y2K 문제를 일으킨 YY/MM/DD처럼 - 데이터를 최대한 줄여서 넣어야 했기에, 대부분의 CD에는 노래 이외의 정보라곤 트랙 넘버와 노래의 길이(시간) 밖에는 없습니다. (그래서 CD 플레이어에서는 노래 제목을 표시할 수 없었습니다.) 정작 어떤 CD를 다른 CD와 구분하기 위한 키 데이터가 없게 디자인 된 것입니다. 그래서 CDDB는 이렇게 생각했습니다. "만약 한 CD에 평균 10개의 노래가 있고, 각 노래가 1분에서 3분 정도 사이라고 가정하면 - 대충 100초 - 한 CD에 있는 각 노래의 재생시간의 조합은 100x100x...x100=100^10=10^11=100,000,000,000 즉 100억개. 세상에 있는 CD의 총 수가 100억개는 넘지 않으니까 일치할 확률은 매우 작다."

세상엔 똑똑한 사람이 참 많습니다.
구글 기글(giggle)  |  2006/05/21 20:03
트랙백 이란?    이 글의 트랙백 주소 :: http://www.fortytwo.co.kr/tt/trackback/64
.
나 자신도 구글 노트북(Google Notebook)의 서비스를 접하면서 “아.. 왜 이제서야..”라는 생각을 하였다. 가끔씩, 이러한 기능을 상상하곤 하였지만 역시나 구글이었다. 우선 그건 그렇고,....
.
PRAK님 포스트의 제목인데, 노트북을 스크랩의 용도로 한정하지 않는다면 그리고 그런 경우가 더 많다고 가정한다면 태그를 지원하지 않는 것이 더 좋다는 생각입니다. 대신, 섹션이라는 것....
2006/05/21 22:16 댓글에 댓글수정/삭제
태깅이 완벽하고 유일한 방법이 아니며, 구글은 굳이 태깅을 하지 않더라도 검색엔진의 힘으로 이를 해결할 수 있다고 생각한거 같습니다.

말씀하신대로, 그리고 다른 사람들도 알고 계시겠지만 태그도 문제가 많습니다. 모든 사람이 모두 같은 생각으로 태깅을 하는 것도 아니고,
web 2.0, web2.0, 웹2.0", "태터, 태터툴즈. tatter, tattertools, tt" 간의 의미 유사성 검출에 대한 문제도 있죠...
2006/05/22 08:21 수정/삭제
맞습니다.
영어와 한국어가 공존하는 우리의 온라인 세상의 현실과 한글의 특수성에 맞는 태깅 시스템을 개발한다면 좋겠습니다. "아버지가방에"라고 해도 알 수 있게 말이죠.

누군가는 지금 벌게진 눈을 비비며 고민하고 있을 지도 모릅니다. 다들 힘내세요.
2006/05/24 07:58 수정/삭제
머 수천만가지의 해결 방법 중 하나로써, 올블로그에 있는 대표 태그 방식으로도 어느 정도 해결되고 있지 않을까요? :)

http://www.allblog.net/Tags/View.html?Tag=%ec%9b%b9+2.0
2006/06/15 23:09 수정/삭제
하늘이님 // (너무 오래된 글이라 확인하실지 모르겠지만)

대표 태그 방식은 수작업 아닌가요? 물론, 올블의 대표태그 방식은 편리합니다. 하지만, 수작업은 지양되어야 한다고 생각합니다. 모든 단어와 태그를 수작업으로 해결할 수는 없으니까요.

일종의 마약같아요. 수작업은 ;)
.
2006/05/21 22:46 댓글에 댓글수정/삭제
전 delicious에서 _를 사용하고 있습니다.. 만약 folk taxanomy의 경우 folk_taxanomy로요..(이단어 오늘첨봄) 그런데 tag로 찾는것도 일종의 검색인데 좀 and연산자좀 지원했으면 좋겟어요.
2006/05/22 08:21 수정/삭제
그러게 말입니다. 결국은 키워드인데 말이죠.
.
2006/05/21 22:51 댓글에 댓글수정/삭제
재가 볼대는 PRAK님도 똑똑한 사람들 중 하나인 것 같습니다. 세상에는 정말 똑똑한 사람 많죠. 저같은 평범에 지극히 평범한 사람은 그냥 평범하게 살아야할 정도로 말이죠. ㅎㅎㅎ
2006/05/22 08:28 수정/삭제
감사합니다. (우선 겸손 모드로) 아닙니다. 저는 듣고 보는 걸 정리하고 이해할 줄 아는 것 밖에는 없는 것 같습니다. 정말 똑똑한 사람이면 미래를 내다 보고 이미 구글이나 오라클 같은 회사를 만들었겠죠.^^

(이젠 격려모드로) 하지만, 좌절하지 않고 노력하고 노력하면 진짜 하늘이 내린 천재가 아닌 다음엔 어느 정도 맞먹을 수 있다고 믿고 있습니다. 오르고 또 오르면..
누군가 그러더군요. 삶의 목표는 완전연소!
.
2006/05/22 00:52 댓글에 댓글수정/삭제
솔직이 저도 궁금했--다기보다는 좀 태깅이 가능했으면 좋겠다는 생각은 했었습니다. 그런데, 뭐 쓰다 보니 큰 불편함은 느끼지 못하겠더라구요. 일단, 노트를 여러개 만들 수 있고, 노트의 제목을 바꿀 수 있고, 노트에 여러 개의 섹션을 더할 수 있고, 섹션별로 이름을 다르게 붙일 수 있으니... 유일하게 레이블로 할 수 있는데 못하는 것이라고는 그러니까 태깅과 다른 점은 아마 하나의 글에 여러개의 레이블을 붙이는 것 아닐까요? 어쨌든 저로서는 가장 유용한 기능이 노트를 이곳저곳으로 옮겨보는 기능 같습니다. 마치 글을 쓸 때 여러 요소를 조합해 보는 것처럼요...

그런데, "(집단 지성이 집단 지성이 아닌 건 다 아시죠?) " <-- 이건 무슨 말씀이신지...
2006/05/22 08:48 수정/삭제
일단 레이블은 설명에 스페이스로 구분해서 여러 개를 그냥 입력해 놓으면 나중에 검색에서는 잡히지 않을 까 싶습니다. 여전히 태그보다 나이스하진 않은 것 같습니다.

만약 구글이 태그를 쓰지 않는 것이 MS가 가졌던 것과 같은 오만함의 이유라면 (자신들 내부에서 나오지 않은 것은 이류로 치는) 걱정스럽습니다. 하지만 제가 아는 구글은 무언가 또 다른 이유가 있어서 태그를 적극 쓰지 않는 게 아닐까 아직은 믿고 싶습니다. 예를 들면, 사용자에게 또 다른 입력을 하도록 요구하고 태그를 이해하도록 귀찮게 하지 말고 그냥 설명에 다 쓰면 우리가 알아서 알아먹자 라는 식으로.

지금은 노트북과 노트의 1단계로만 분류가 가능하지만, 어차피 노트북 메타포를 썼으니까, 추후 버전에선 챕터를 나누고 인덱스를 만들 수 있는 기능이 추가되지 않을까요? 예를 들면 "여행" 노트북에 "준비" 챕터와 "일정"챕터와..뭐 그렇게...


그리고, ^^ "집단 지성이 집단 지성이 아니다"는 말은 제가 집단 지성에 대한 포스트의 제목으로 쓰려고 준비하는 말입니다.

간략히 말하면 (말이 쉬운 탓에) 집단 지성(collective intelligence)를 위키나 네이버 지식인같은 백과사전식 지식의 모음으로 생각하는 사람들이 있는데, 사실 웹2.0에서 집단 지성은 집단 지능과 비슷한 개념일 겁니다. 즉, 집단 지성을 이용하여 정보를 공유하고, 분류하고, 교류하고, 습득하고, 정제하는 것 만이 아니라, 집단지성이라는 것이 정보를 검색하고 판단하는데에 새로운 접근방식을 제공한다는 겁니다. 딜리셔스, 구글 코압, snap.com, 등이 그 예가 되겠습니다.

그런데 그렇다면 "집단 지성은 집단 지성만이 아니다"가 더 나은 제목인가요?
2006/05/25 11:58 수정/삭제
PRAK님/ (논외입니다만) 자신들 내부에서 나오지 않은 것은 이류로 치는 오만함의 근거가 어떤 것이 있을까요? 반박을 하고자하는 것이 아니라 어떤 문제점들이 있는가를 서베이하고 싶다고나 할까요^^ 내부에서도 "이유가 타당하면 고쳐라! 근거없는 비난은 근거없는 이유 자체를 찾아서 해결하라." 분위기로 전환한지 꽤 되었거든요.
2006/05/25 13:43 수정/삭제
//chalz님

안녕하세요. 우선 제가 말이 많이 거칠었던점 사과드립니다.^^

"자신들에게서 나오지 않은 것은 이류로 치는 오만함"이란 제가 팀 오라일리의 아티클에서 인용한 것입니다. 팀은 오픈소스 커뮤니티의 열린 문화와 대조하기 위해 Java와 JBoss의 관계를 예로 들며 그렇게 썼습니다. (http://www.oreillynet.com/lpt/wlg/3017)

MS의 경우는 넷스케이프와 (실패했지만) 리얼네트웍스에 대한 고사전략을 떠올리며, 제가 그렇게 언급한 것 같습니다. 물론 그 부분은 비즈니스 전략 측면인 것을 제가 MS 내부의 태도에 대해 가정하고 쓴 것이 맞습니다. 제가 MS 내부에 있지도 않았는데 그랬는지 안그랬는지 알 턱이 없지요. 이점은 제가 도가 지나쳤던 것 같습니다. 사과드립니다. 그리고, 지적해 주셔서 감사합니다.
2006/05/25 16:30 수정/삭제
PRAK님/ 지나쳤다는 의미는 (진짜 지나친 경우는 따로 있죠^^) 아니었는데 아무래도 역시나 어느회사가 대상이냐에 따라 해석도 다를지도 모르겠네요. 사실 NIH(http://en.wikipedia.org/wiki/Not_invented_here, 이걸 말씀하시는 것 같습니다만)는 어느 회사랄 것도 없이 IT쪽에는 많은 사람들이 가지는 성향이잖아요.
.
2006/05/22 03:42 댓글에 댓글수정/삭제
게다가 구글노트의 경우는 아직 베타버전도 아닙니다.
엄연히 아직 'lab' 이라는 명찰을 달고 있죠. 굳이 s/w 개발 단계로 보자면 알파정도? 앞으로 얼마든지 변할 여지가 많이 있는거죠.
2006/05/22 08:12 수정/삭제
맞습니다. 그것도 빨리 업데이트 해 가겠지요. 추후에 태그 기능이 들어가는 지 안 들어가는 지 보면 태그에 대한 구글의 접근방식을 알 수 있을 것 같습니다. 계속 지켜보지요.

그나저나, 엊그제 플릭커에 가보니 이젠 베타가 아니고 감마라고 붙여놓았더군요.^^ 센스쟁이들
.
2006/05/25 12:13 댓글에 댓글수정/삭제
저도 집단 지성이 아니라 그냥 집단적 사고라는 표현이 맞다고 생각합니다^^
앞으로 label을 붙이는 기능이 사용자의 요구에 의해서 생겨날 수 있을 것 같네요. 만일 labeling이 기획서 기능 목록에 들어있었다면, 발표기일을 맞추기 위해서 Priority를 낮춘것 뿐이지 않을까요.ㅎㅎㅎ
태그에 스페이스를 허용하느냐는 태그가 다른 곳에서도 쓰인다는(연동되는 기능을 추가할 수도 있다는) 가정을 하면, 허용하지 않는 것이 훨씬 이득일겁니다. 허용하지 않는 시스템과의 연동이 별 수정없이 될테니까요.
2006/05/25 13:45 수정/삭제
역시 스페이스는 허용하지 않는 것이 낫겠지요? 그런면에서 이미 스페이스를 허용해 둔 국내의 다수 사이트는 어떻게 대처할 지 궁금해 집니다.
.
1234
2006/07/03 11:39 댓글에 댓글수정/삭제
wow web 2.0
.
2007/04/01 11:01 댓글에 댓글수정/삭제
일상생활에서 볼 때 노트필기에서 원하는 내용을 찾을 때 해당 제목이나 내용을 보듯이, 구글 노트에서도 내용을 검색할 수 있기 때문에 굳이 태그가 필요없는 것이 아닐까 싶네요 ^^ 저는 개인적으로 태그없이 구글 노트북을 잘 사용하고 있습니다~
2007/04/02 10:23 수정/삭제
아시다시피 태그는 사진, 음성, 동영상, URL등 키워드 검색이 어려운 데이터포맷을 키워드 검색이 가능하게 해주는 큰 장점이 있습니다. 말씀하셨듯 텍스트 컨텐트는 상대적으로 태그의 효용이 작을 수 있습니다.
구글 노트북도 레이블이란 이름으로 태그를 쓸 수 있긴 하지요. 다만 그것의 "소셜" 기능에 초점이 맞추어지지 않은 형태로..
감사합니다.
.
이름 ::   비밀번호 :: 홈페이지 :: 비밀글
등록