구글 검색엔진은 전 세계의 웹사이트를 크롤링하여 검색해주는 웹문서 전용 검색엔진이다.
그런데 얼마전 구글의 아주 놀라운 진실을 발견하였다.

그것은 바로 구글 이미지 검색(http://images.google.co.kr/)의 무서운 트래픽 도둑질에 대한 진실이다.

필자가 운영하고 있는 커뮤니티 사이트인 엑스티비(www.extv.co.kr)의 유입경로를 분석하다가 알게된 사실이다.
유입경로를 따라 구글 이미지 검색 페이지를 열어보았다.
그런데 이게 웬걸?
엑스티비의 이미지가 그대로 구글 이미지 검색 페이지에 노출되어 있는 것이 아닌가?
그것도 크롤링하여 구글 서버에 저장된 이미지가 아닌 엑스티비 웹호스팅 서버에 있는 이미지를 가져와서 그대로 보여주고 있었다.

이미지의 속성정보를 보면 원본이미지 경로를 이용하여 이미지를 끌어와 구글페이지에서 보여주고 있는 것을 확인할 수 있다.

즉, 구글은 자신의 페이지에서 이미지를 보여주면서 타 웹사이트의 이미지를 그대로 가져와서 보여주고 있는 것이다. 자신들의 트래픽에는 전혀 부담없이 말이다.
네티즌이 이미지를 제공하고 있는 웹사이트에 방문하기 위해서는 이미지의 하단 부분에 있는 '사이트' 버튼을 클릭해야만 한다.

물론 다음, 네이트 등의 포탈사이트에게는 큰 문제가 되지 않을 수 있지만 저용량, 저트래픽 웹호스팅으로 근근히 서비스하면서 네티즌의 방문을 통해 수익을 창출하는 소규모 웹사이트에게는 정말 치명적인 방식인 것이다. 말 그대로 트래픽은 트래픽대로 뺏기고 웹사이트 방문은 전혀 이루어지지 않고 있는 것이다.(과연 이미지를 보고 실제 웹사이트까지 방문하는 네티즌이 얼마나 될까?)
이렇게 되면 광고수입으로 운영되는 소규모 웹사이트는 광고수입 등을 전혀 기대할 수 없을 뿐더러 구글을 위해 이미지 트래픽 비용을 대신 지불하고 있는 꼴이 된다.

구글은 엄청난 양의 이미지 정보를 수집하여 돈 한푼 안들이면서 이미지 검색 서비스를 제공하고 있는 것이다.

분명 예전 구글 이미지 검색은 이런 형태의 것이 아니었다. 섬네일 정도 크기의 이미지를 자사 서버에 저장하여 검색데이터로 제공하고 실제 이미지를 보기 위해서는 해당 웹사이트에 방문해야만 볼 수 있는 형태였다. 구글 검색엔진의 목표는 검색서비스 이용자가 원하는 정보를 빨리 찾아서 구글을 빨리 떠나게 만드는 것이라고 알고 있는데 이제는 그 목표가 변한 것인가? 초심을 잃은 것인가?

구글 이미지 검색에서 '소녀시대'를 검색해보았다.


많은 검색결과가 나오는데, 그중 하나를 클릭해보면 다음과 같은 구글의 페이지가 뜬다.


이것 또한 실제 이미지가 위치한 웹사이트로 이동하는 것이 아니라 구글 페이지 내에서 이미지가 보여진다. 위의 이미지는 '청소년방과후아카데미'(http://www.youthacademy.or.kr/)에 올려져 있는 이미지이다. 물론 구글 서버에 크롤링되어 저장된 이미지가 아니라 이미지를 서비스하고 있는 '청소년방과후아카데미'에서 이미지 경로만 가져와서 보여주는 방식이다.
이미지를 서비스하고 있는 웹사이트는 이미지만 제공할뿐 그 어떠한 이익도 얻지 못할 것이다. 실제 웹사이트에서 발생하는 트래픽이 아니라 구글 내에서의 과도한 서비스로 인하여 트래픽 제한에 걸려 웹사이트가 서비스되지 못하는 사태가 발생한다면 구글은 그 손해를 어떻게 배상할 것인가? 

더욱 문제가 되는 것은 이와같은 방식으로 서비스를 함에 있어서 이미지를 보유하고 있는 웹사이트의 동의를 구했느냐 하는 것이다. 물론 동의를 구하는 절차는 생략한체 무단으로 트래픽을 가로채고 있는 것이다. 트래픽 부담은 이미지를 보유한 웹사이트에 전가하면서 말이다.

이것이 구글이 말하는 공유의 방식인가?
이것이 구글이 말하는 오픈(공개)의 방식인가?

필자는 오늘도 엑스티비(www.extv.co.kr/)의 수많은 이미지들이 구글에 의하여 검색되고, 구글 내에서 서비스되고 있는 것을 지켜볼 수 밖에 없다. 그중에 극소수의 네티즌들만이 실제 엑스티비 웹사이트로 유입될 것이다.
이렇게 어렵게 네티즌들을 유입시키면서 살아남아야 하는 것인가? 이것이 약자의 서러움이다.

트래픽을 도둑질하고 있는 구글의 못된 버릇을 어떻게 하면 고칠 수 있을까???
구글은 잘못된 이미지 검색 운영방식을 버리고, 이미지를 보유하고 있는 웹사이트에 해를 끼치지 않고 서로가 윈-윈할 수 있는 운영방식으로 전환할 것을 촉구하는 바이다.

댓글을 달아 주세요

  1. 자유인K  수정/삭제  댓글쓰기

    구글 이미지 검색 자주 사용하는데.. (다른 포털 검색보다 쪼금 빠른 듯 하여..) 뭔가 있었군요..

    2009.09.30 13:46 신고
    • 깜냥 윤상진  수정/삭제

      소규모 웹사이트에게는 치명적일 수 있습니다. 방문자가 조금만 많아도 바로 웹호스팅 트래픽제한에 걸려 사이트가 열리지 않는데 이런식으로 구글에 의하여 트래픽이 사용되고 있다는 것은 충격적인 일이 아닐 수 있습니다.
      게다가 실제 웹사이트에 들어와서 이미지를 봐야 그 이미지를 서비스하고 있는 웹사이트도 광고수익이 나오고 운영이 될텐데 이건 뭐 웹사이트로 들어가는 길목에서 가지 말라고 발목을 붙잡고 있는 꼴입니다.
      이걸 어떻게 대처를 해야 할지 감이 오질 않습니다... ㅠㅠ

      2009.09.30 14:04 신고
  2. 구글이 무임승차?  수정/삭제  댓글쓰기

    네이버 COO가 구글이 무임승차하고 있다고 발언하여 파문이 일었었는데, 정말 이런거 보면 무임승차가 맞네요.
    최소한 직접 웹사이트로 이동하도록 해야 한다고 생각합니다.

    2009.09.30 17:06 신고
    • 깜냥 윤상진  수정/삭제

      ㅎㅎ 구글의 웹페이지 검색 기술은 정말 훌륭한 것입니다. 빨리 자사의 검색페이지를 떠나가 만드는 운영방식도 훌륭하고요.. 왜 이미지검색을 이런 식으로 구글 페이지에서 서비스를 하고 있는지 모르겠습니다.
      이렇게 해서 새나가는 트래픽이 얼마나될지 모를일입니다.
      이건 웹사이트를 운영해본 사람만이 느낄 수 있는 부분일 겁니다. ^^

      2009.10.01 11:00 신고
  3. ㄷㄷㄷ  수정/삭제  댓글쓰기

    현재 대부분의 사진검색들이 사진을 미리 보여주지 않으면 쓰질 않죠. 그렇다고 그 사진들은 마구잡이로 크롤링해서 저장하는 것은 저작권법 문제가 복잡해질거고, 그렇다고 법적으로도 "인용 수준"으로 용인된다는 썸네일 만드는 것만으로는 미리 보여주기의 기능을 충분히 살리기 어렵죠.

    일단 클릭하면 사진을 직접 해당 주소의 서버에서 가져온다는 사실은 익히 알고 있었고 문제 제기를 해봤습니다만, 몇 번 생각해보니 어디까지가 적절한 사진 검색의 범주가 될지는 조금 더 생각의 여지가 있다고 생각합니다.

    그리고 구글 이미지 검색의 경우 직접 해당 서버에서 불러오기 때문에 저런 미리보기 기능을 사용할 경우 상당히 느린 경우가 많았습니다;;; 그래서 생각외로 잘 안쓰게 되죠...

    2009.09.30 19:45 신고
    • 깜냥 윤상진  수정/삭제

      네.. 분명 생각의 여지는 있겠지만 이런 식으로 남의 사이트 트래픽을 사용하는건 문제가 있다고 생각합니다.
      사진검색의 특성상 어느 정도의 트래픽은 어쩔 수 없겠지만 이건 전체 이미지를 다 불러다가 사용하는 거 아닌가요?
      솔직히 사이트를 운영하는 사람 입장에서 불쾌하기 짝이 없습니다.

      2009.10.01 11:11 신고
  4.  수정/삭제  댓글쓰기

    잘 몰라서 그런건데요
    이렇게해도 상관없지않나요?
    어차피 구글은 포털이 아니라 검색엔진이니까요

    2009.11.16 01:22 신고
    • 깜냥 윤상진  수정/삭제

      아.. 글의 취지를 제대로 이해 못하시는 것 같군요... ^^ 이건 구글에게는 전혀 문제가 안되죠~ 돈도 안들이고 검색서비스를 제공하는 것이니까요...
      근데 저에게는 문제가 됩니다.
      돈을 들여 호스팅을 하고 있는데 이미지를 무단으로 가져가 서비스하면서 트래픽을 도둑질하고 있으니까요...
      확실히 이 문제는 웹서비스를 운영해보지 않으면 현실적으로 마음에 와 닿지는 않겠군요~ ^^
      의견 주셔서 감사합니다.

      2009.11.16 19:05 신고
  5.  수정/삭제  댓글쓰기

    아뇨 이해했다고 생각하고요,
    저도 제가 찍은 사진 올리는 홈페이지를 하나 운영하고 있고요.
    구글은 검색 엔진이기 때문에 정말 '검색'만 하는게 맞지 않나요?
    그러니깐 중개사이트라고 해야할까 그런 개념인 것 같습니다.
    그 이미지를 다운로드해서 자기네들 계정에 올리는 건 더 이상한 것 같네요.

    2009.11.17 03:12 신고
    • 깜냥 윤상진  수정/삭제

      중개사이트라면 원본이미지를 그대로 다 보여주면 안되겠죠~
      작은 이미지로 보여주거나 낮은 해상도로 보여주고 실제 원본 이미지를 보고 싶으면 해당 웹사이트로 이동해서 볼 수 있도록 해줘야 한다는 이야기입니다.
      사실 원래 구글은 이 썸네일 이미지를 자신들의 서버에 저장해 놓고 그것을 검색에서 보여주고 원본은 실제 웹사이트에서 보게끔 했었습니다.
      이제 얼마전부터 이렇게 바뀌었더라구요~
      저같이 비용 문제때문에 트래픽이 적은 호스팅을 쓰는 사람 입장에서는 좀 힘든 부분입니다.
      실제 웹사이트 방문자는 얼마 안되는데 트래픽은 많이 사용되니 말이죠...
      이건 웹사이트 운영자에 따라 다르게 와 닿는 부분이라고 생각합니다.
      님께서 제 말투때문에 기분이 조금 상하셨을 수도 있다고 생각합니다. ^^
      제가 요즘 힘든 시기여서...
      이해해주시기 바랍니다.

      2009.11.18 09:44 신고
  6. 아쓰  수정/삭제  댓글쓰기

    서버 과부하 문제는 이해가 갑니다만, 트래픽을 도둑질 당했다는 상태는 어떤 걸 말하는 건가요??ㅠㅠ
    몇 번 읽어봐도 쪼금은 어렵군요.ㅠㅠ 그리고 구글에서 이미지 자주 검색하는데 썸네일 형태로 서비스하는게 맞다고 보여지네요. 제가 올린 이미지를 동의없이 맘껏 보여진다면 기분이 불쾌할 듯 싶어요. 여튼 구굴이 좋은쪽으로 변화했으면 싶네요.

    2009.12.25 01:16 신고
    • 깜냥 윤상진  수정/삭제

      흠... 사실 이게 조금은 기술적인 문제일 수 있어서 홈페이지를 직접 운영해보지 않은 분들에게는 조금 어려운 문제일 수 있습니다.
      문제는 하나입니다. 실제 이미지를 제가 운영하는 사이트에서 보면 문제가 안되는데 구글 페이지에서 제 사이트의 이미지를 불러오기만 해서 보여지는 것은 문제가 있다는 것이지요...
      왜냐하면 저와같이 작은 규모의 사이트를 운영하는 사람은 호스팅비로 월 몇만원씩 감당하기도 버겁거든요...
      호스팅비라는 것이 결국은 트래픽량에 따라 다른 것이니...
      그런데 트래픽은 올라가는데 실제 방문자가 그리 많치 않고 구글에서 사진만 보고 있다면 저는 돈도 못벌고 구글에 트래픽만 제공하는 꼴이 되는 것입니다.
      실제 사이트에 방문해야 저에게 돈벌 기회가 생기니까요...
      아휴... 제가 설명해도 어렵네요... ^^;

      2009.12.25 07:37 신고
  7. 미동  수정/삭제  댓글쓰기

    이미지 못퍼가게 하는 방식이 있지 않나요? 기존 커뮤니티에서 그런 기능을 사용해서 그런지 구글에서 제대로 표시 안 되는 경우가 있더군요. 그걸 활용하시면 될 것 같아요. (또는 완전히 구글에서 웹페이지 검색 노출도 안 되도록 막을 수도 있겠고요.)
    그리고 저는 좀 부담스러운 큰 용량의 이미지는 구글 플러스에 이미지를 올려서 블로그에서 사용하고 있답니다.

    2016.04.29 12:06 신고
  8. 마동석  수정/삭제  댓글쓰기

    무식하긴~~~ㅋㅋ
    robot.txt라는 파일이 없스면, 구글이던 뭐던 검색엔진은 다 컨텐츠를 긁어갈 수 있어요~~
    인터넷이 탄생했을때부터 그런 관례로 검색엔진들이 검색합니다....
    긁어가게 하지 않으려면, 서버 홈페이지 루트에 robot.txt파일 만들고, 구글봇은 긁어가지 마라 하고...써주는 게 있는데...
    자세한 건 robot.txt 검색해서 알아보세요~~
    ㅋㅋ..무식...법적으로도 하자는 당연히 없지요..

    2016.08.10 22:48 신고
  9. 모모  수정/삭제  댓글쓰기

    구글이 트래픽을 도둑질 한다고 생각하신다면 당연히 robot.txt에서 이미지 검색을 막으면 되는데, 또 그렇게 하라고 해놓은 댓글에는 그렇게 하면 유입자가 떨어지기 때문에 안된다고 하시네요. 아마 robot.txt로 구글 크롤링 자체를 막아라는 소리로 생각하셨나본데, robot.txt에서 이미지만 제거할 수도 있습니다. 솔직히 글을 이런 식으로 써놓은 건, 무식해서라고 밖에 생각 안되네요.

    중간에 동의를 구하는 절차 어쩌구 하시는데, 구글에 크롤링 등록 직접 하지 않으셨나요? 마치 구글이 가만히 있는 님 사이트에 무단으로 와서 긁어서 보여주고 있는 것처럼 생각하고 있으시네요. 크롤링 등록 자체가 용어에서도 말해주듯내 사이트 좀 긁어가 주세요라고 구글에 통보하는 행위입니다. 그리고 그런 크롤링에는 해당 웹페이지의 모든 것이 포함됩니다.

    따라서 이미지나 첨부파일을 긁어가는 것이 싫으면 거기에 따른 추가 설정을 해야 하는 것이고요. 그런 추가 설정이 귀찮고 싫으다면 구글에 등록하지 않으면 됩니다. 아니면 구글로부터 이미지 검색으로 인한 유입트래픽은 몽땅 누리고 싶은데, 그 비용을 내가 부담하는 것은 싫으니 구글이 섬네일을 만들어 자기들 서버에서 부담하길 바란다 이건가요? 굳이 그걸 바란다면, 리퍼러를 통해 구글봇이면 섬네일로 접속되게끔 직접 제공하면 됩니다.

    아니, 애시당초 본인 웹사이트의 트래픽 분석을 하고는 계신 건가요? 구글봇을 문제삼기 이전에 무식한 네이버봇 문제가 더 클텐데요? 구글봇은 엄청나게 효율적이여서 긁어가는 양에 비해 실유입이 상당한데, 네이버는 실유입량이 거의 없음에도 그 수십배, 수백배에 달하는 트래픽을 소모시킵니다. 거의 악성 스팸봇 수준이죠. 사이트 뻗는 건 네이버봇으로 인할 때가 대부분입니다.

    구글에서 이미지 검색으로 인해 사이트가 뻗을 정도면, 이미 검색 유입도 충분히 발생하는데, 그럼에도 불구하고 그 비용이 감당이 안된다면 사이트의 수익구조이나 부하처리에 대한 근본적인 문제가 있는 겁니다.

    2017.12.20 03:03 신고







처음 호스팅을 신청할 때 가장 낮은 레벨로 신청했는데 지금은 트래픽제한에 자주 걸리고 있습니다.
깜냥닷컴만 있으면 문제가 없을 것 같은데, 엑스티비 (http://www.extv.co.kr)와 같은 호스팅계정을 쓰다 보니 문제가 발생하는 것 같습니다.
즉, 깜냥닷컴(http://www.ggamnyang.com)은 엑스티비에 폴더를 하나 만들어 테터툴즈를 설치한 이후, 그쪽으로 포워딩하여 사용하고 있다는 것입니다. 실제 도메인은 http://www.extv.co.kr/aaa 입니다.
요즘 엑스티비에 방문객이 꾸준히 증가하고 있기 때문입니다.
아무래도 엑스티비에 사진, 동영상 등이 많기 때문으로 해석하고 있습니다.
사실 동영상은 동영상포탈이나 다음 등의 종합포탈에서 퍼온 것이 전부이기 때문에 트래픽에 큰 영향을 주지는 않을 것으로 보이며, 문제는 사진 데이터!
크게 생각하지 않았는데 사진 데이터들이 대부분 300K정도 되고, 10명만 봐도 3M는 금방 넘을 것 같더군요.
계속해서 이상태로는 죽도밥도 안될 것 같아 깜냥닷컴을 다른 호스팅업체의 계정으로 옮길 예정입니다.
카페24쪽으로 함 알아보고 있습니다.
이게 행복한 고민인건지는 모르겠지만 현재 내가 서비스할 수 있는 규모도 생각하여 홍보 및 광고활동도 체계적으로 해야 한다는 생각이 드는군요.
아무튼, 요즘 깜냥닷컴이 접속이 안되어 짜증 나셨던 분들이 계시다면 정중히 사과말씀드립니다! *^^*

댓글을 달아 주세요

  1. ㅋㅋㅋ  수정/삭제  댓글쓰기

    대박나시길 바랍니당~ ^^
    저는 아무리 많이 들어와도 트래팩제한까지는 안걸리던데...

    2007.06.01 11:47 신고







구글에서 제공하는 웹사이트 무료 트래픽 진단 서비스인 Google Analytics가 새로운 인터페이스로 찾아왔습니다.
제가 운영하고 있는 엑스티비(
http://www.extv.co.kr)도 이 서비스를 이용하여 트래픽을 분석하고 있습니다.
또한 깜냥닷컴(
http://www.ggamnyang.com) 또한 이 서비스를 이용하고 있습니다.
사용방법은 간단합니다.
가입한 이후 사이트를 등록하고 구글에서 제공하는 태그를 웹페이지에 입력하면 됩니다.
가장 유용한 메뉴는 두가지가 있습니다.
첫번째로 어디를 통해서 내 사이트로 유입되었는지, 두번째로 어떤 콘텐츠가 가장 인기가 있는지!
이 서비스를 이용하게 되면 아이러니하게도 네이버의 힘을 다시 한번 느끼게 됩니다.
네이버 지식인, 네이버 검색, 네이버 블로그 등을 통하여 많은 네티즌들이 사이트 및 블로그에 방문하는 것을 알 수 있기 때문입니다.
이 서비스를 이용하여 많이 유입되고 있는 사이트를 알게되면, 그 사이트에 대한 마케팅에 집중하여 더 많은 트래픽을 얻을 수 있을 것입니다.
그리고 가장 인기있는 콘텐츠가 어떤 것인지 알 수 있습니다.
그렇게 되면 아무래도 인기있는 콘텐츠에 주력할 수 있게 될 것이고 사이트는 번창할 수 있습니다.

이번에 새롭게 바뀐 인터페이스를 보면, 아무래도 세분화와 비쥬얼에 초점을 맞춘 것 같습니다.
날짜별로 방문자, 페이지뷰수 등을 직관적으로 볼 수 있도록 직선그래프 형태로 제공되며, 방문수, 페이지수/방문수, 평균사이트방문시간, 신규방문수비율, 반송률 등 사이트에 대한 많은 정보를 얻을 수 있습니다.
마케팅은 과학입니다!
사이트를 과학적으로 분석하여 보다 많은 트래픽을 발생시킬 수 있을 것입니다.
또한 이러한 툴을 이용하여 사이트의 문제점을 파악할 수 있을 것입니다.

최근 다음에서도 애드클릭스를 오픈하면서 사이트 트래픽 분석 서비스를 내놓은 것으로 알고 있는데 아직 써보지는 못했습니다.
기회가 된다면 다음에서 제공하는 트래픽 분석 서비스도 이용해 볼 생각입니다.


바로가기: http://www.google.com/analytics/ko-KR/
<Google Analytics 소개문>
The New Google Analytics
방문자들이 어디서 오는지 그리고 이들이 귀하의 사이트를 어떻게 사용하는지에 대해 보다 잘 파악할 수 있도록 Google Analytics가 새롭게 설계되었습니다.

발견.공유.실천해 보십시오.
새로운 Google Analytics는 귀하의 온라인 실적을 향상시켜 줍니다.보다 나은 광고를 작성하고, 마케팅 프로그램을 강화하며, 전환율이 높은 웹사이트를 만드십시오. Google Analytics는 모든 광고주, 게시자 및 사이트 소유자에게 무료로 제공됩니다.

댓글을 달아 주세요


BLOG main image
깜냥이의 웹2.0 이야기!
깜냥닷컴은 최근 트랜드로 급부상하고 있는 웹2.0, 소셜웹, SNS, 플랫폼에 대하여 IT업계의 실무자로써 일하면서 생각하고 있는 것들에 대하여 솔직하고 허심탄회하게 이야기하는 열린 블로그입니다.
by 윤상진

공지사항


Bookmark and Share

카테고리

깜냥이의 웹2.0 이야기! (1543)
Notice (24)
He's Story (134)
He's Talk (140)
Childcare Diary (125)
He's Column (1076)
Multimedia (23)
Various things (13)
Vision board (2)

달력

«   2018/09   »
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            
윤상진's Blog is powered by Textcube. Designed by Qwer999. Supported by TNM Media.