2012년 주요 구글 SEO 알고리즘 업데이트와 Top Heavy 2 업데이트

002

Google 알고리즘 업데이트와 Top Heavy 2

오늘은 최근 업데이트 된 구글 알고리즘에 대해서 정리 해 볼까요? 
우선 그 전에 본견적으로 구글 알고리즘 업데이트가 시작된 작년 초 얘기를 좀 하려고 합니다. 

<구글 Panda Update의 시작>
2011년 2월 경 이었죠. 뉴욕 타임즈에 “The Dirty Little Secrets of Search“라는 제목으로 SEO 관련된 기사가 큰 이슈가 되었었습니다. 바로 JC Penny 온라인 쇼핑몰 사이트 Black Hat (부정적인 검색엔진 최적화 작업)에 관련된 기사였습니다.

뉴욕 타임즈의 한 기자가 우연치 않게 여러 쇼핑 관련 일반 키워드를 검색했을때 JC Penny 웹 사이트가 상위에 검색되는 것을 발견하고 뭔가 이상하다고 생각되었습니다. 기사를 보면 “bedding”, “dresses”, “skinny jeans” 등을 포함하여 여러 쇼핑 관련 일반 키워드가 1위 내지는 상위에 JC Penny 웹 사이트가 상위에 등록되었다고 합니다. 그것도 몇 달 동안이나 유지 되었다고 하네요.

이런 결과를 뉴스 타임즈때문에 Google도 뒤늦게(?) 알게 되었고, 그 때서야 구글은 JC Penny가 여러 관련 없는 페이지들로부터 유료 link를 과다하게 구매하여 외부링크 인기도를 올리는 부정한 방법을 써서 상위에 등록되었다라는 것을 간파하게 되었습니다. 

구글로서는 굉장히 자존심 상하는 일이었죠.
하여튼, 이 사건으로 JC Penny 웹 사이트는 구글 검색결과에서 사라지게 되었고 이 때부터 구글 SEO 알고리즘은 Panda update 부터 시작되어 Penguin Update, EMD update 등으로 이어지며 메이저급 알고리즘 업데이트가 지금까지 쭉~~~ 이어지게 됩니다.

그럼 지금까지 업데이트 된 굵직한 구글 SEO 알고리즘을 한번 짚어 볼까요? 

 • Panda Update
: 웹 페이지 컨텐츠 내용이 너무 적거나 link 위주로 되어있거나, 광고위주로 되어 있는 페이지에 대해 penalty를 가하는 구글 업데이트로서 2011년 2월 23일에 첫 업데이트 후에 지금까지 20회의 Update가 실행 되었음.

• Penguin Update
   : 타이틀에 특정 단어를 너무 과다하게 사용했거나 본문 컨텐츠에 특정 단아를 여러번 중복해서 사용하는 등의 Over-Optimization을 적용한 페이지에 penalty를 가하는 구글 업데이트로서 2012년 4월 24일 첫 업데이트 후에 지금까지 3회 update가 실행 되었음.
• EMD Update

   : Exact Match Domain 의 약자로서 컨텐츠를 빈약하나 도메인만 의도적으로 롱테일 키워드를 사용하여 상위등록을 시도하는 사이트에 가하는 Penalty. 2012년 9월 28일에 최초로 실행 되었음.  

Top Heavy 2 Update   »»»  이건 무슨 update일까요?

<Top Heavy 2 업데이트> 

구글의 최근 알고리즘 업데이트 컨셉을 보면 “Quality” 와 “Spam” 이라고 판단됩니다.
Quality는 “Panda”와 “Penguin” 업데이트와 관련이 있고
Spam은 “EMD”와 이제 말씀드릴 “Top Heavy” 와 관련이 깊을 것 같네요.

사실 Top Heavy라는 용어는 SEO 업계에서 만든 용어이고 구글에서 언급한 공식 명칭은 Page Layout Algorithm 이라고 합니다. 내용은 아래와 같습니다.

Top Heavy 02 (Page Layout Algorithm) 업데이트 란? 
> 업데이트 내용

 : 구글에서 사용자 경험을 고려하여 업데이트한 SEO 알고리즘으로서 
 “방문자가 페이지 방문 시, 우선 보여지는 상위(top)영역이 광고(Ads)위주로 구성되어 있으며 실제 컨텐츠는 페이지 하단에 존재하고 있는 페이지에 Penalty를 가하는 Google SEO 알고리즘 업데이트.” 

 > 업데이트 일자
 : 2012년 10월 9일 (약 0.7%의 영문 조회 키워드에 영향을 줌)

> 업데이트 횟수 
 : 이번이 2번째 update (2012년 1월 19일에 1차 업데이트 실행 되었음) 

즉, 의도적으로 광고를 보여주기 위한 페이지들에게 적용되는 업데이트입니다. 
구글 검색결과에 이러한 페이지의 존재로 인해 여러 Google 사용자들로 부터 불만이 접수되어서 실행된 업데이트이고, Panda, Penguin 업데이트 소식에 묻혀서 저도 몰랐던 사실인데 이번 Top Heavy 업데이트실행이 2번째라도 하네요. 최근 워낙 많은 업데이트가 있다보니…쩝….놓쳤던 부분이네요.

2003년 구글 Florida 업데이트를 시작으로 여러번의 큰 업데이트가 있었는데, 최근처럼 공개적으로 알고리즘 업데이트에 대해서 언급한적이 없는 것 같습니다. 아무래도 JC Penny 사건으로 Google 검색 알고리즘 품질에 타격을 받았고, 그로 인해 공개적으로 “우리 이렇게 검색 품질을 높이기 위해 많은 노력을 하고 있다” 라는 보여주기 목적도 있는 것 같습니다. 

이렇게 정리를 하다가 느낀것은 Google 알고리즘도 결국엔 100% 자동화하기에는 한계가 있다라는 것 입니다.
결국 특정 부분은 어쩔 수 없이 사람이 눈으로 평가해야만 한다라는 것이죠.

그래서, 구글의 Penalty 방식도 사람이 평가하여 실행하는 Manual Action과 자동으로 Penalty를 가하는 Algorithmic Actions이 있습니다.  다음 주에는 이런 Penalty Action 내용을 가지고 각 Action 별 내용 및 차이점, 대처 방안에 대해서 정리 해 보도록 하겠습니다.

감사합니다.

한 눈에 알아보는 SEO (검색엔진 최적화) 변천사 2012

대문

연일 무너위가 계속되고 있습니다.
시원하게 비가 내렸으면 좋겠다라는 바람이 있었는데 마침 주말부터 차주 내내 단비가 내린다라는 반가운 뉴스가 들리네요. 제가 세차를 하면 그 다음날 비가오는 징크스가 있는데..사실 어제 세차를 했더니…ㅎㅎ 그래도 이번 비는 아주 반가울 것 같습니다. ^^

 

이번 글은 SEO, 즉 검색엔진 최적화의 변천사에 대해서 재 정리 해 보려 합니다. 
약 3년 전인 2009년 7월에 검색엔진 최적화 변천사에 대해서 정리 한 적이 있는데 그 동안 여러 검색엔진 알고리즘의 변화들이 있었기에 현 시점에서 다시 되짚어 보는 것도 필요할 듯 합니다. 

우선 SEO 탄생 배경부터 살펴볼까요. 
과연 누가, 어떻게 SEO 라는 걸 시작하게 되었을까요?
사실 이 질문에에 대한 공식적인 답변은 없지만 일반적으로 알려진 내용은 아래와 같습니다.

현 Search Engine Land 의 운영자 Danny Sullivan이
1995년에 최초의 검색엔진 최적화 가이드 책 “Webmaster’s Guide to Search Engines” 출간 후, 그 당시 온라인 마케팅 분야에서 가장 큰 조직이었던MMG (Multi-Media Marketing Group)의 Owner인 John Audette의 요청으로MMG 직원들에게 검색엔진 상위등록 교육을 진행하면서 SEO 라는 용어가 처음으로 사용되었다고 알려져 있습니다. 

이 때 교육받았던 직원들이 현재 SEO 개척자들로 인정받고 있으며
Search Marketing의 대가들로 활동하고 있습니다. 아래 2명이 그에 해당됩니다.

 – Marshall Simmonds: 현 뉴욕타임즈 검색전략팀 최고 책임자, 구 About.com 설립자 및 CEO 
simmonds_marshall

–  Derrick Wheeler: 현 MS SEO 기획팀 최고책임
derrick-wheeler-small

위 내용대로라면, 
SEO (Search Engine Optimization)가 생겨난지 약 17년 정도가 되었네요.
짧지 않은 시간이라고 볼 수 있겠습니다.  

간략하게 SEO의 탄생 배경에 대해서 정리 해 봤습니다. 

 

그럼, 지금부터 
검색알고리즘 진화에 따른 SEO 작업 변천사에 대해서 알아보겠습니다!

 

1997년 ~ 1999년 |  키워드만 많이 노출되면 장땡!!

90년대 중반 시점부터 현재의 메이저 검색엔진들이 등장하면서 검색엔진 마케팅의 중요성이
서서히 부각되기 시작하였습니다. 그러면서 SEO 에이전시도 적지 않게 나타나기 시작한 시점이죠.

이 당시 검색엔진이 판단하는 상위등록 기준(검색 알고리즘)중에서는
웹 페이지 내 키워드 노출 횟수
가 가장 비중이 컸습니다.


키워드 노출 수, 밀도 등을 통해 키워드 관련성 및 정도를 평가하였습니다.

그렇기 때문에, 무조건 키워드만 많이 노출시키기 위한 Trick 성 SEO
(전문 용어로 Black Hat SEO 라고도 합니다) 기법이 많이 사용되었습니다. 

대표적인 작업은 아래와 같습니다.
 –  Background와 같은 칼라의 Text 사용
 –  육안으로 확인 할 수 없는 Tiny Font Size 사용
 – Title, Meta tag,  HTML Comments 등에 키워드 반복 사용 등.  

이런 정도의 작업만 열심히(?)하면 상위등록이 어렵지는 않았다고 합니다.
현재 이러한 최적화 작업은 검색엔진 상위등록 안 되는 것은 물론이고
검색엔진 검색결과에서 아예 사라질 수도 있습니다. 이는 절대로 하지말아야
하는 SEO 작업(Black Hat)입니다.

키워드의 추가로만 상위등록이 가능했던 이런 SEO 환경이
1998년 9월 Google이 등장하면서 서서히 변하기 시작 합니다.

 

1999년 ~ 2004년 | Off-Page SEO의 등장 “외부링크 수” 중요! 
여러 Trick성 SEO 작업이 인기를 끌면서
 그렇게 SEO 작업된 웹사이트들이 검색엔진 노출이
잦아지고
 정확한 검색결과를 보여주는 것의 의미가 퇴색되기에 이릅니다.

결국, 검색엔진 측에서는 “사이트 중요성” 평가에 대해 고민에 빠집니다. 그러한 고민 끝에
Off-Page 요소가 등장하게 되고 
여러 검색엔진에서 외부링크 개수를 사이트 평가 기준의
하나로 도입하게 됩니다.

많은 사람들이 알고 있듯이,
Google은 PR (PageRank)라는 외부링크 인기도 체크 시스템을 도입하여 인터넷 유저들에게
더욱 정확한 검색결과를 제공함으로써 
2002년에 Yahoo을 제치고 검색엔진 점유율 1위를
차지하게 됩니다.

Off-Page SEO, 즉 외부링크 수 확장의 기본적인 작업은 아래와 같습니다.

  – 디렉토리 검색엔진 등록
  – 외부 페이지 내 링크 확장
  – 사이트 내부 페이지 내 링크 확장

외부 링크 수가 아닌 다른 평가 방법으로는
검색결과 페이지 클릭 수에 따른 사이트 중요도 평가를 하는 “Click-Tracking”가 있으며
그 시기에 DirectHit(현재, AskJeeves가 인수함)에 의해 도입 되었습니다.

 

이런 개선도 얼마 지나지 않아
“Link Farm” 이라는 외부링크 모음 페이지 작업을 통해
외부링크 수를 무작정 증가시키는 SEO작업으로 변질되기에 이릅니다.

참… SEO 업체들도 대단하다는 생각이 절로 드네요~

 

현재는 “Link Farm” 작업을 통한 SEO는 절대 불가합니다.
해당 페이지가 스팸으로 인식되어 검색결과에서 사라질 확률이 아주 높기 때문입니다.

하지만, 역시 이런 환경도 Google 알고리즘 업데이트 역사 상 가장 큰 변화를 주었다는
“Google Florida Dance”(2004년도 초 적용 됨)를 통해 또 한번의 작은 변화를 겪게 됩니다.

2004년 ~ 2007년 | On-Page, Off-Page SEO도 양보다는 질로 평가!

앞서 말한 Google Florida Dance의 알고리즘 변화의 요점 정리는 아래와 같습니다.

  1) SEO Filter : On-Page, Off-Page SEO 작업에 있어서 과다한 작업은 SEO Filter 기능을 통해
걸려지며 순위가 오히려 다운 됨.

  2) Local Rank : 검색결과 내 존재하는 페이지의 외부링크 인기도를 분석해 외부링크 질 평가

  3) Commercial list : 상업적인 내용을 너무 강조한 contents을 담고 있으면 순위 하락.                        

  4) Stemming: word-stem 시스템 도입: 직접 키워드 관련성 뿐만 아니라 word-stem 키워드에게도 확장 적용.
          (e.g. Drink’s word stem – drinks, drinking, drinker and drinkers etc.)

위 작업들의 주된 목적은
“페이지 관련성을 양보다는 질적으로 평가하여 검색결과에 반영”이라고 할 수 있습니다.

당연히, “Link Farm” 같은 문제적가 되는 작업은 사라지게 됩니다.

2007년 ~ 2009년 | Blended Search를 위한 다양한 컨텐츠 SEO 필수!

Blog를 포함해 여러 Social Media 사이트의 인기가 높아지면서,
검색엔진도 인터넷 유저들의 다양한 정보욕구를 해결하고자
웹 페이지 결과 뿐만 아니라 멀티미디어, 뉴스, Blog, 지도 등을 다양하게,
관련성 높은 순위로 보여주는 Blended Search 결과를 제공하기 시작합니다.

Google은 2007년 5월, Yahoo는 같은 해 10월에 Blended Search를 런칭하게 됩니다.

그 결과,
이제는 단순히 웹 페이지 뿐만이 아닌 다양한 웹 콘텐츠의 SEO 필요성이 높아졌습니다.

또한, Social Media 사이트의 인기로 인해 이들 사이트의 링크확장 작업도
SEO작업에 필수가 되었습니다.

물론, 기본적인 On-Page/Off-Page 작업이 진행에는 변함이 없습니다.
사실, 기본적인 것이 가장 중요하죠. 

2010년 ~ 현재 | Quality, Freshness & Over-Optimization

Google은 2010년에 Fresher Results 제공이라는 목적으로 Caffeine Update 라는
큰 알고리즘 업데이트를 하게 됩니다.

이어서 2011년에는 개인적으로 Panda 라는 동물이 싫어질(?) 정도로 Quality 평가
강화된 대대적인 Panda Update가 시작되고
현재까지 이어지고 있습니다. 

또한, 최근에는 Penguin Update 라 하여 스팸 성 contents를 강력하게 처단(?)하는
알고리즘 업데이트와 과다한 최적화를 한 사이트에도 penalty를 주는
Over-optimization 알고리즘 업데이트도 실행 되었습니다.  

이러한 변화에 따라 최적화 작업 시, Thin Contents (contents 양 너무 적은 페이지)
작성은 지양해야 하며, 과다한 최적화 적용 (예를들면, Title에 여러 키워드를
타게팅한다던지 중복 키워드를 불필요하게 사용하는 경우)는 피해야 합니다.

사실 전에 없었던 신규 알고리즘 업데이트는 아닙니다. 기존에 있던 알고리즘 요소 중에
특히 강화한 요소라고 생각하시면 될 것 같습니다.

 

 

이상으로 SEO 최적화 변천사를 정리 해 보았습니다.
Google이 이러한 변화가 있으면 Bing도 이어서 비슷한 알고리즘이 반영이되고 시간이 좀 더
흐르면 중국의 Baidu, 러시아의 Yandex 검색엔진도 적용하게 되는 것이 일반적인 추세입니다.

앞으로 어떠한 변화가 있을 지 궁금하네요.
이러한 변화가 있을 때 관련해서 정리 해 보도록 하겠습니다. 

긴 글 읽어주셔서 감사합니다. 

 

검색엔진 알고리즘??

오늘은 짧으면서도 얇은 (^^;;) 이야기를 하나 해 보려 합니다.
저의 주 업은… 검색엔진 최적화 (SEO) 컨설팅 입니다.

갑작스런 질문 1. 검색엔진 최적화란 무엇일까요?
당연한 답변 : 검색엔진 상위 노출을 위하여 검색엔진 알고리즘을 분석하고 이를 바탕으로 검색엔진 친화적인 사이트 구축을 위하여 최적화 작업을 진행 하는 것 입니다.

갑작스런 질문 2. 그럼 검색엔진 알고리즘은 무엇이가요?
당황스런 답변 : 네???

검색엔진 최적화의 가장 핵심 요소는 검색엔진 알고리즘 입니다.
검색엔진의 알고리즘은 공식적으로 공개된 적이 없습니다.
(만약 Google이 그들의 검색엔진 알고리즘을 공개 했다면, SEOer 들의 가치는 바닥을 “꽝” 쳤을 것입니다.)

단 한번도 공개 된 적 없는 알고리즘…. 하지만 지속 적으로 업데이트가 되고 업데이트 요소 역시 공개되지 않습니다.
알고리즘이란 도대체 무엇일까요? 중요한 건가요? 먹는건 아니겠죠?? (ㅡ.ㅡ;;;;;)

<알고리즘: Algorithm 이란?>
알고리즘이란 특정 함수 및 기능 구현 값을 구하기 위하여 각 요소를 정의한 메뉴얼 이라 할 수 있음. (Wikipedia)
“Algorithm is an effective method expressed as a finite list of well-defined instructions for calculating a function. Algorithms are used for calculation, data processing, and automated reasoning. In simple words an algorithm is a step-by-step procedure for calculations.”

그렇다면 검색엔진 알고리즘이란 무엇일까요?

<검색엔진 알고리즘 : Search Algorithm>
데이터 베이스 내 수집 된 여러 아이템 중에서 특정 성질 혹은 값을 찾아내는 알고리즘 임.
“Algorithm for finding an item with specified properties among a collection of items. The items may be stored individually as records in a database”

즉, 데이터 베이스 내 수집 되어 있는 무수히 많은 사이트 페이지들 중 특정 페이지를 찾아 내기 위한 알고리즘 이라 하겠습니다. 사용자가 특정 검색어로 검색을 할 경우, 검색엔진은 알고리즘에 기반하여 사용자가 요청한 검색어와 가장 관련성이 높은 사이트를 추출해 내고 이를 검색 결과에 보여주게 되는 것 입니다.

짧고 간단하게 말하면 “서울에서 김서방을 찾기 위한 방법론” 이라 할 수 있겠습니다.

검색엔진은 주기적인 검색 알고리즘 업데이트를 통하여 사용자에게 최상의 검색 결과를 보여주기위해 노력합니다.
양질의 검색 결과를 유지하기 위해서 검색엔진은 주기적인 업데이트를 진행 하며, 가장 최근에는 Google Panda 업데이트를 진행 하였습니다.

그렇다면 지난 10년간 Google의 검색 알고리즘 업데이트를 한눈에 쓰윽 보겠습니다.

<Google Algorithm Changes History>
google-algorithm

한눈에 쓰윽 보이시나욤?
위 표에서는 지난 10년간 있었던 Google의 업데이트 이름과 주요 항목을 나열한 표 입니다.
위 표를 년도 별로 묶어 보면 아래와 같은 특징을 찾을 수 있습니다.

 – 1997 ~ 1999 : Keyword Density of Page (각 페이지의 키워드 관련성)
 – 1999 ~ 2004 : Introduction of Off Page SEO (외부링크의 강화)
 – 2004 ~ 2007 : Quality beats Quantity (양보다는 질)
 – 2007 ~ 2009 : Variety of Contents for “Blended Search” (Universal 검색을 위한 컨텐츠의 다양성)
 – 2009 ~ 현재 : Quality of Contents & Social (컨텐츠의 질… 그리고 소셜)

이제 한눈에 보이시나요?
검색 알고리즘은 시간이 갈 수록 발전하고 있습니다.
처음 단순한 키워드 관련성으로 시작 되었던 검색 알고리즘은 시간이 지나면서 사용자의 인터넷 사용 패턴과 환경 변화를 인지하고 이에 맞춰 성장 합니다.
즉, 검색 알고리즘의 변화를 눈여겨 본다면… 검색엔진 친화적 사이트를 구축하는 것은 그리 어려운 일이 아니랍니다 ^^
Happy optimization~ 하세요~!