오늘
Digg.com의 개편 소식과 연이은 시스템 다운 소식이 있기도 했습니다만, 지난 며칠 Digg의 스팸과 스큐(skew)된 기사 문제로 인해 '집단지성'의 신뢰도에 의문을 제기하는 글을 블로고스피어 여기저기에서 볼 수 있었습니다.
역시 '집단지성'(사실 제임스 서로위키가 쓴 '대중의 지혜'란 말이 의미상 더 정확합니다만, 이미 대중적 인지도를 확보한 번역인 '집단지성'을 편의상 당분간 사용하려 합니다.)이 매우 중요한 의미를 지닌 것이긴 합니다만, 그것을 구현하는 매커니즘을 만들고 운영하기는 쉽지 않은 일인 듯 합니다.
사실 정작 더 중요한 것은 '집단지성'의 개념에 대한 이해라고 생각합니다.
마가린 FAQ에도 썼듯 집단지성의 대명사인 듯 일컬어지는 '위키피디어'와 '네이버 지식인'은 '집단지성'이라기 보다 인터넷상에서 이루어진 '협업(collaboration)'으로 보는 것이 더 어울릴 겁니다. 그저 일면식도 없던 사람들이 웹이 가능케한 플랫폼에서 그런 일을 함께 만들어 낸다는 것, 그리고 그 스케일이 이전과 비교할 수 없이 크다는 사실이 '위키피디어'와 '네이버 지식인'이 이전과 다른 점이며 놀라운 점이었죠. 만약 그런 공동작업이 아는 사람사이에, 더 소규모 그룹에서 일어난다면 그것은 우리가 '팀워크'라고 부르는 것일 겁니다. 그리고, '팀워크'는 우리에게 전혀 새로운 것이 아닙니다.
게다가, '위키피디어'나 '네이버 지식인'도 스팸이나 오남용 시도에 노출되어 있으며, 그것을 막기 위해 누군가 중앙에서 통제하고 있다는 사실은 과연 '위키피디어'와 '네이버 지식인'을 진짜 '집단지성'이라고 부를 수 있는가에 의문을 가지게 합니다. 왜냐하면 모름지기 집단지성이라면, 분산화(decentralization 또는 탈중앙집중화)와 맥을 같이해야 하는 것이기 때문입니다. 마치 구글의 스팸필터처럼 사람들이 스스로 걸러내는 프로세스를 설계하고 거기에서 집단지성을 이끌어내는 매커니즘을 만들어 스팸이나 오남용 시도에 대응하지 않고, 누군가 개입하여 편집하려 하는 순간 집단지성은 그 존재 근거를 잃게 됩니다. 왜냐하면 편집자란 존재는 또 다시 엘리트주의 산물이기 때문입니다. 같은 맥락에서 집단지성이 우리가 익히 아는 팀워크와 구별되는 것은 우리가 통상적으로 아는 팀리더 라는 존재의 유무 때문일 겁니다.
(아직 완전히 정리되진 않았지만,) 집단지성에는 '집단의 판단이 그 집단에서 가장 똑똑한 개인의 판단보다 객관적으로 옳은 결과를 도출한다' 그리고 '한두 번은 전문가가 더 옳은 판단을 내릴 수 있겠지만, 그것이 매번 지속되기는 어렵다. 반면 집단은 지속적으로 옿은 판단을 내릴 수 있다' 라는 식견(perspective)이 들어 있습니다. 동시에 '반대의견이나 소수의견은 그것이 옳고 그르고를 떠나서 존재 자체만으로 집단에 다양성을 부여하여 집단지성을 향상시킨다' 라는 식견도 있습니다.
사실 사람이 개입하여 손대기 시작하면 일단 빠르고 효과적입니다. 하지만, 그것이 얼마나 오래갈 것이며 얼마나 정확할 수 있을까요? 예를 들어, 네이버나 기타 포털의 통합검색 편집자들이 '이준기'나 '문근영'에 대한 통합검색 결과에 대해서는 (일반적인 상식과 관심사에 근거하여) 좋은 자료를 잘 선별해 보여줄 수 있을 것이나, 전문성과 식견을 요하는 검색어의 결과에는 얼마나 신뢰할 만한 통합검색 결과를 보여줄 수 있을까요? 하다못해 웹2.0 의 경우만 해도 최근
iendev님께서도 잘 써 주셨듯이 문제가 있지 않습니까?
그리고, 집단지성이 결정하게 하지 않고 내부 편집인력으로 대응한다면 점점 가속도가 붙어 나날이 커지는 웹에 앞으로 제대로 대응할 수 없을 겁니다. 또한, 사용자들은 누구나 같은 정보를 보게 된다는 커다란 문제가 있습니다. 누가 검색결과의 음...42번째 페이지에 있는 링크를 누르겠습니까? 대부분 첫 번째 페이지만 훑고 끝나게 되지요. halfmoon님이 일전에 보여주셨듯 구글에서도 80%의 클릭이 검색결과 첫페이지의 상단 1/3에 집중되어 있지 않습니까? 결국 사용자가 검색어를 조합하여 내가 원하는 내용을 찾아가는 스킬을 길러낼 환경을 만들어 주지 않으면, 사람들은 개별 검색어에 대해 네이버나 기타 포털이 보여주는 '같은' 정보만을 다 같이 보게 될 겁니다. (이것은 사실 좀 큰 문제 입니다. 기회가 되면 다음 번에 다른 포스트에서 구글 댄스와 함께 좀 자세히 다루어 보지요.)
어쨌든, 그럼 Digg는 집단지성에 기반한 사이트 일까요? 추천, 즉 'digg it!'이란 도구를 채용해서 집단의 지성으로 가치있는 기사에 대한 판단을 내리게 하는 '집단지성'이 구현된 사이트라고 생각할 수도 있습니다. 여담입니다만, Digg가 그렇게 유명해 진데에는 Digg란 말이 '이것은 좋은 내용이니 다른 사람도 보면 좋겠다'라는 추천인지, 아니면 '나는 이 글의 내용에 동의한다'라는 동의인지, 아니면 '이것은 내가 발굴(dig)한 것이다'라는 의미인지 모호하다는데 있는 듯도 합니다. 어떤 케이스건 그냥 누르는 거지요. 반면, reddit같은 경우는 '이것을 내가 읽었다' 라는 느낌이므로, '읽어보니 좋더라' 정도가 reddit 버튼을 누를 때 느끼는 느낌이 되려나요?^^
여튼 위키피디어나 네이버 지식인도 마찬가지지만, Digg처럼 다른 사람에게 보여주는 것이 목적이 되는 미디어적인 성격의 사이트이면, 더불어 그 서비스에서 사용자가 이루고자 하는 바가 사용자의 행동과 1:1로 매치하는 구조면 스팸이나 오남용 시도에 필연적으로 취약할 수 밖에 없습니다. 스플로그의 문제도 마찬가지 입니다.
정작 '집단지성'을 구현하는 매커니즘은 애덤 스미스의 '보이지 않는 손'처럼 디자인 될 때 더 잘 작동하고, 스팸이나 오남용의 위험에 처하지 않는 것 같습니다. 예를 들어 (이론상) P2P에서 내가 필요해서 파일을 내려받아 저장하는 개인적인 목적을 달성하기 위한 행위가 커튼 뒤에서는 P2P 네트워크에 또 다른 백업본을 만들어 네트워크의 신뢰도(reliability)를 높이고, 여러 소스에서 파일조각을 받게 하여 다른 사용자의 내려받는 속도를 높이는 역할을 하게되는 것 처럼... 이 경우 파일이 디폴트로 공유된 폴더에 저장하도록 하는 것이 집단지성을 구현하는 매커니즘이라 하겠습니다.
마찬가지로
마가린 같은 소셜 북마킹도 내가 필요해서 기억해 두기 위해 태깅하고 북마킹하는, 자신만을 위한 목적의 개인적인 행동이 물밑에서는 폭소노미와 동일 북마크 저장자 통계 등의 도구를 통해 집단지성을 이끌어 낼 수 있도록 디자인 되어 있습니다. 특히 오늘날과 같은 정보 과잉의 시대에는 예를 들어 웹2.0 이라고 마가린에서 검색한 후 다른 사람들이 많이 저장한 순서대로 위에서 너댓개만 읽어보면 대충 그게 뭔지 감을 잡을 수 있게 됩니다. 그리고 그 리스트는 집단지성을 반영하여 계속 순서가 바뀝니다.
또 쓰다보니 글이 많이 길어졌습니다... 요약한다면, Digg에 스팸이 많다고 해서 집단지성의 가치나 실현가능성 자체에 대해 의문을 던지는 것은 부당합니다. 그리고, Digg 같은 사이트는 스팸을 제거하기 위해서도 집단지성을 활용할 줄 알아야 합니다. 마지막으로, 집단지성을 더 좁게 정의해 본다면 그것은 단순한 협업을 넘어서는, 독특하고 세심하게 설계된 구조를 통해 발현되는 어떤 것일 겁니다.
트랙백 이란?
이 글의 트랙백 주소 ::
http://www.fortytwo.co.kr/tt/trackback/258
.
2007/05/11 16:34
.
매우 매우 긴 글이 되겠습니다. 저 생각보다 글 길게 적는 사람인데 이렇게 표현하는 것은 그만큼 저도 긴 글이 될 것이다라는 것을 염두에 두고 적는 것이니 참조하시길 바랍니다. 그러나 재...
메트칼프의 법칙이 네트워크의 가치가 그 자신을 제외한 다른 네트워크와의 연결에 비례하게 된다는 내용이므로 이를 수식으로 생각해 본다면 비례상수(proportional factor) k를 상정하여
V(네트워크의 가치) = k*n(n-1)/2
와 같이 나타낼 수 있을 겁니다.
그리고, 이 k는 각 네트워크의 어떤 특성들의 함수일 것입니다. 다시 말해, 특정 네트워크의 특성에 따라 그 값이 정해질 것입니다. 그러면 k의 값에 따라 한 사람이 더 네트워크에 참여함으로인해 늘어나는 단위 가치의 양 즉 기울기가 달라질 겁니다.
그렇다면, V를 높이는 방법은 전통적으로 말해지는 n이 커지는, 즉 '더 많은 사용자가 사용할수록 더 좋아지는' 방법과 별도로 네트워크 자체가 큰 값의 k를 가지게 만드는 방법도 있을 겁니다. 다시 말해, 더 많은 사용자가 사용할수록 더 유용해지는 특성을 가지도록 네트워크를 디자인하기도 해야 하지만, 한명의 사용자가 더 유입될 때 증가하는 가치의 단위량이 더 높아지도록 네트워크를 디자인하기도 해야 할 것입니다.
그렇다면 k의 값은 어떤 것들의 함수일까요?
per capita 사용량? 각 사람이 네트워크에 기여하는 평균가치? 아니면, 동질감이나 상실감 같은 소프트한 이슈? 참가자를 네트워크에 남아있도록 묶어두는 어떤 장치?
k가 산업별, 기술표준별로 다르다고 가정해 보면, 전화네트워크, 인터넷 네트워크, 팩스 네트워크 각각의 k 를 다르게 계산해 볼 수 있을까요? 또는 VHS와 베타의 싸움, CDMA와 PCS의 싸움을 이런 프레임워크로 생각해 볼 수 있을까요? 예를 들어 팩스나 비디오 표준의 문제에서는 우리회사의 표준이 다른 회사의 표준보다 네트워크 이펙트를 더 잘 만들게 하려면 어떻게 해야 하는가 의 문제에 답을 주지 않을까요? 지난 주에 만난 어떤 분은 다단계를 연구해 볼 것을 권하시더군요^^
아니면 참여자마다 네트워크에 기여하는 바가 다를 수 있으므로, k는 비례상수가 아니라 계수(coefficient)일까요? 더 재미있는 것은 정작 k는 n과 반비례 관계인지도 모르겠습니다. 예를 들어, 어떤 웹 서비스가 탈퇴하기도 쉽게 되어 있으면 문턱이 낮아져 오히려 n을 늘리기 쉽지 않을까요?