Blog Archive

레이블이 펌질인 게시물을 표시합니다. 모든 게시물 표시
레이블이 펌질인 게시물을 표시합니다. 모든 게시물 표시

2006-12-19

어떤 형태의 펌질과 스크랩도 모두 반대합니다.

블로그 글의 무단 도용: 네이버 vs. 독립 블로거 라는 글을 읽고 다시 열불이 나서 한 마디 씁니다.


불법이고 합법이고를 떠나서 저는 펌질, 스크랩을 적극 반대합니다. 펌질, 스크랩을 통해 복사된 글들이 인터넷을 어지럽혀 결국 검색 엔진이 사용자가 원하는 글을 찾는 것을 매우 어렵게 만들고, 제목만 살짝 다르지만 결국에는 똑같이 복사된 글만 검색 결과에 올려놓는 어처구니 없는 현상을 양산해냅니다. 그래서 펌질에 의해 오염된 네이버 블로그, 싸이월드 미니홈피는 검색하면 원본 글은 누가 쓴 지도 모르겠고, 복사하고 또 복사한 쓰레기만 나오죠. 그나마 네이버와 싸이월드가 자신의 서비스들을 robots.txt로 검색을 막아놓은 게 어찌보면 다행일지도 모르겠습니다. 그렇지 않았으면 우리 나라 인터넷은 온통 복사된 쓰레기로 가득 찼을 지도 모르니까요.

웹의 기본은 스크랩이나 복사가 아니라 링크입니다. 그리고 그 링크에 의해서 검색의 중요도도 결정되어야 합니다. 펌질과 스크랩을 통해 데이터의 웹은 더욱 요원해져 갑니다. 사용자들이 올려놓은 지식 정보와 블로그, 카페는 마치 자기 자산인양 검색도 막아놓고, 다른 곳에서 링크를 걸려고 하면 매일 링크 주소를 바꿔버리는 네이버를 비롯한 국내 포털들의 행태가 어쩔 수 없이 펌질과 스크랩을 양산했고, 인터넷 세상을 오염시켜온 주범입니다. 그런 세상에서 파란과 같은 후발 주자가 어떻게든 트래픽을 모아보려고 타 블로그의 스크랩 기능을 넣었다는 것은 어찌 보면 이미 예상되어 온 일이라고 보입니다. 그나마 뺐으니 천만 다행이군요.

2006-06-11

그래도 펌/펌질에 대해 부정적인 이유

펌로그는 무조건 잘못된 것이다?라는 재미있는 글을 읽고서 새삼 다시 한 번 펌에 대해 생각해보게 되었습니다. 이상하게 우리 나라에 유독 많은 것이 바로 펌, 또는 펌질, 또는 스크랩이라고 불리면서 원본 글을 복사해다가 자신의 페이지에 붙이는 행위입니다. 이에 대해 쿠키님은 원본 글을 쓴 사람이 영구적이고 안정적인 소스로서 글이 가치를 갖도록 책임을 져야 한다는 의견을 제시하셨고, rantro님은 펌로그를 만드는 사람이 관련글을 찾아서 한 곳에서 보여주는 것만으로도 제 2의 창작이라 할만큼 가치있는 일이라는 의견을 내셨습니다. 그리고 주된 논쟁은 저작권과 관련되어 있는 것 같습니다. 두 분의 주장도 일리가 있다고 생각합니다만, 저는 그래도 펌 행위에 대해 비교적 부정적입니다. 예전에는 저 개인도 펌질을 별 생각없이 했었지만 요즘에는 웬만하면 원본에 링크를 걸고 있습니다.

논쟁에서도 나왔지만, 인터넷에서 자기가 원하는 목표에 가장 근접하는 정보를 찾는 것은 쉬운 일이 아닙니다. 그것은 검색 엔진의 기술이 발달하지 못한 탓도 있겠지만, 아직 웹에 있는 정보들이 논리적으로 잘 정리되어 쌓여있지 않기 때문이라고 봅니다. 즉, 아직까지 웹에 있는 정보들은 쓰레기의 바다라는 것이고, 그런 쓰레기 속에서도 비교적 사용자가 원하는 정보와 최대한 유사한 정보를 제시해주는 엄청난 기술을 제공하는 곳이 바로 구글과 야후와 같은 검색 엔진이라고 생각합니다. 그러면 그런 검색 엔진이 도대체 그 정보, 또는 문서가 가장 적합할 것이라고 어떻게 판단을 할까요? 우리가 생각하는 것보다 훨씬 복잡한 기술과 기법들을 사용하겠지만 단순화해서 생각해보면 아마 다음과 같은 것들도 포함될 것입니다.


  • 제목이 적절한 것
  • 제목이 불분명하다면 내용이 적절한 것
  • 다른 곳에서 해당 문서로 링크가 많이 걸린 것
  • 해당 문서의 조회수가 높은 것
  • 해당 문서에 사용자들의 답변과 의견이 많이 올라온 것

원본 문서가 가치있는 문서라면, 그것은 다른 곳에서 많이 링크가 걸릴 것이고, 또 많은 사람들이 들어올 것입니다. 즉, 더 많은 링크가 걸리거나 더 조회수가 많은 문서일수록 해당 문서는 우리가 찾고자 하는 적합한 문서이거나 또는 가치있는 문서일 가능성이 높다고 추측할 수 있습니다. 문서의 제목, 내용, 키워드 같은 것들은 기계도 이해할 수 있을만한 정해진 규칙이 아직까지 없고 사용자가 마음대로 작성할 수 있게 되어있어서 완전히 신뢰할 수 있는 것은 아닙니다. 그런 신뢰성을 부분적으로 메꾸어주는 것이 바로 외부 문서에서 해당 문서로 걸린 링크의 수, 조회수와 같은 다른 사용자들의 참여도와 인기도(?)일 수 있습니다. 우리가 어떤 키워드로 인터넷을 검색했을 때에 다른 문서보다 상위에 노출되었다면 아마도 제목, 내용, 링크의 수, 인기도, 조회수 등을 고려해 가장 적합하다고 기계가 판단했기 때문이겠지요.

그런데 원본 문서에 링크를 걸지 않고 그냥 내용을 복사해다가 새로운 사이트에 문서를 만들면, 원본 문서에 축적될 수 있는 가중치는 떨어질 수 밖에 없습니다. 즉, 검색을 했을 때에 그 원본 문서가 정말 정확한 내용을 담은 문서라면 최상위에 노출될 것인데, 복사본이 여기 저기에 있기 때문에 원본 문서의 링크수와 조회수는 떨어지게 되고, 검색 엔진은 원본 문서의 정확성이나 신뢰성을 실제보다 더 낮게 판단하게 됩니다. 사용자 입장에서는 특정한 검색 요청에 대해 원하는 문서가 아닌 다른 엉뚱한 문서를 결과로 얻게 될 수도 있습니다. 또는 원본 문서가 약간의 모양만 달리 해서 여기 저기 여러 군데에 있다 보니 검색 결과는 상당히 여러 개가 나왔는데 다 똑같은 내용을 펌질을 통해 복사한 결과라는 것을 알게되기도 합니다. 다시 말해서 검색의 적합성과 정확성, 그리고 신속성이 펌질로 인해 계속 떨어지는 것입니다. 우리 나라에서 인기있는 네이버에서 검색을 해보면, 네이버 지식인, 네이버 블로그라는 것들이 주로 이런 펌질로 이루어지다보니 똑같은 문서인데도 제목만 살짝 다르게 되어 마치 여러 개의 검색 결과인 것처럼 노출이 됩니다. 그래서 혹시나 새로운 내용을 담고 있나 하고 여러 검색 결과를 눌러봐도 사실은 똑같은 내용의 중복이라는 것을 발견하고 시간이 아깝다는 생각을 하게 됩니다.

말이 쓸데없이 길어졌네요. 결론적으로 아직까지 완벽하지 않은 인터넷 세계에서 외부에서의 링크수와 문서의 조회수는 그 문서의 중요성과 적합성을 판단하는 중요한 기준인데, 펌질을 해버리면 그런 기준들이 엉망이 되어버린다는 것입니다. 결국 안그래도 어지러운 인터넷 세상에서 펌질로 인해 똑같은 글이 여기저기 난무하게 되면 목적에 부합한 원하는 문서를 찾기가 더 힘들어진다고 생각합니다.