싸이월드 '우리사이' - 매력적인 표본
※이 글을 포스팅하려던 찰나, 형준이형이 msn으로 맥주를 마시자고 꼬셔서-_- 마시고 왔다.
돌아오니 2시 10분. 덜덜덜..
※
박상민 선배님의 블로그를 통해, 싸이월드가 우리사이라는 검색 서비스를 제공한다는 것을 알게 되었다.

이 서비스는 일촌을 통해서 어떤 특정 인물과 나와의 관계를 검색해주는 서비스이다. 예를들어, 내 일촌 중에는 A라는 사람이 있는데, A라는 사람은 방송인 노홍철과 1촌인 것이다. 이럴때 나와 노홍철은 2촌인 관계가 되고, A는 징검다리가 된다.
이 서비스는 케빈 베이컨 게임과 매우 유사하다. 아니 그냥 그 게임에서 표본만 달라졌다고 해도 될 정도. 최고 검색 한도가 6촌인 걸 보면 그렇다.
내가 이 서비스에서 관심을 갖는 건 두가지이다. 하나는 개인정보의 긍정적인 활용이고, 하나는 작은 세상 가설. (아 물론 구혜선씨와 내가 몇촌일까 이런것도 중요한 관심사이긴 하다. 4촌이다. 제길ㄱ-)
작은 세상 가설에 대해 말해보자. 사실 나는 복잡계 이론에 대해 잘 모른다. 아는 것이라고 해봐야 과학 콘서트나 링크에서 읽은 것이 다이고, 위키페디아를 몇번 돌려 본 것이 전부. 하지만 많은 분야에 적용될 수 있다는 점에서 내 관심을 끈다. 기본적으로 네트워크 이론에 관련이 있고, 생물학, 사회학 등에 응용이 될 수 있다(고 알고 있다).
이 데이터를 내가 얻을수 있다면 해보고 싶은 것은, 예를들면 A와 B가 n촌인 관계에 있을때, 중복되는 일촌의 비율같은 것들. 아니면 랜덤하게 일촌 링크를 타고 갔을때, 다시 나에게로 돌아올 확률같은 것. 비율에 따라 어떤 사람의 유명도(마당발 지수)를 알수도 있을거고, 사는 지역에 대해 통계를 내볼 수도 있을거다.
자발적으로 생긴, 신뢰할 수 있을만한 2000만개체의 표본이라. 매력적이지 않은가.
개인정보의 긍정적인 활용. 싸이월드의 약관에 일촌 데이터를 싸이월드 임의로 활용할 수 있다는 게 있었는지는 모르겠다. 이 서비스는 분명 개인 정보를 싸이월드가 임의로 가공해낸 것이다. 하지만 딱히 문제가 될 것 같지는 않다. 나와 구혜선씨는 싸이월드 상에서 4촌 관계인데, 싸이월드는 나와 1촌인 1단계로 뻗어나가는 사람만 알려준다. 나-A-B-C-구혜선인 상황에서, A만 알려주는 것이다.
정확한 계산이 어찌되었든, 만약 내가 B와 C가 누구인지 알고자 한다면, 최소한 1000번 이상 메일을 보내야 하는것은 당연해 보인다. 그러니까, 개인정보 침해의 논란은 비교적 적다는 것이다. 검색당하기 싫다면 비공개로 설정하면 된다.
이런 종류의 데이터는 연구에 매우 유용하게 사용될 수 있다. 이름을 숫자로 처리한 후 필요한 연구기관이 사용할 수 있게 한다면, 굉장히 긍정적이지 않을까?
ps : 중간에 그만둔 계산의 결과는 중간 과정을 모르는 상태에서 구혜선과 연줄이 닫기 위해 해야하는 전화 통화수이다. 좀더 생각해봐야겠다. 누가 벌써 해놨을지도 모르지만.


Commented by 











천문 문제.hwp
그냥 A한테 부탁해서 구혜선이랑 연결해보라고 하면 B가 나올것을 ㅋㅋ
그리구 C도 약간의 삽질을 통해 가능할듯?
아 근데 저거 두시간동안 검색해보느라 시간 다 날렸다ㅜㅜ
허허 말리게 할 생각은 전혀 없었는데...(훗)
실제로는 그렇게 되는거구나
개인정보 위험한건가ㄱ-;
저는 천수씨와는 3촌 나오더군요. 대체로 운동선수가 3촌인 경우가 더 많더라구요. 운동선수가 일촌을 잘 맺어주는건지..ㅎㅎ
그나저나 꼭 B, C를 알아야하는거야?;;;