INSIGHT

Google 검색 알고리즘 업데이트!! Google Panda~!

안녕하세요~ 아티언스 홍일점 YunHeeC 입니다.

최근 Google 검색 알고리즘이 업데이트 된 사실을 알고 계셨나요?
Google에서 상세 내용을 공식 발표 하지 않았고, 한국어권은 이번 업데이트에서 제외가 되었기 때문에 아마 많은 분들이 눈치채지 못하셨을거라 생각합니다.
그래서 정리 합니다. “Google Panda Update”!!

panda

이번에 업데이트 된 Google 검색 알고리즘에 이름은 “Panda” 입니다.
Google의 검색 알고리즘은 최소 1년 ~ 2년에 한번씩 대대적인 업데이트를 하게 됩니다. 이럴때 마다 Google 검색 결과는 술렁술렁 흔들리며 여러 Webmaster 혹은 SEOer 들은 눈물을 흘린 답니다.
대대적인 업데이트 이외에도 1년에 300번이 넘는 자잔한 업데이트가 이루워 진다고 합니다.
(정신 바짝 차리지 않으면…밥줄이 날라갈지도 몰라요…ㅠ.,ㅠ)

Google Panda 업데이트는 2009년 Google Caffeine 업데이트 이 후 2년만에 이루어진 대대적인 업데이트 였습니다.
Google Panda 업데이트의 징조는 2011년 1월 Google Farmer 업데이트 부터 슬슬 나타나기 시작했습니다.
올 해 1월 Google은 검색결과에 불필요하게 보여지는 “Thin Contents (질 낮은 컨텐츠)” 와 전쟁을 선포합니다.
동시에 이런 컨텐츠를 걸러내기 위한 Google Farmer 업데이트를 진행합니다.

이 후 올해 2월부터 대대적인 Google Panda 업데이트가 이루어 졌습니다.

<Google Panda Update>
: 무수히 많은 컨텐츠 중 “질 낮은 컨텐츠” 가려내기 위한 Google 알고리즘 업데이트.
– Panda 1.0 : 2011.02.24
– Panda 2.0 : 2011.04.11
– Panda 2.1 : 2011.05.10
– Panda 2.2 : 2011.06.16
– Panda 2.3 : 2011.07.23
– Panda 언어 확장 : 2011.08.10 (중국어, 일본어, 한국어를 제외한 전 세계 언어로 확장)

Google Panda는 “질 낮은 컨텐츠”를 가려내기 위한 알고리즘이라고 합니다. 그렇다면 여기서 “질 낮은 컨텐츠”를 구분하는 정확한 기준은 무엇일까요? 이 부분에 대해서 Google은 명확한 답변을 하지 않습니다. 다만 아래와 같은 난해한 질문들만 하고 있습니다.

<What counts as a high-quality contents?>
– Would you trust the information presented in the page?
– Does the site have duplicate, overlapping or redundant articles on the same or similar topics with slightly
different keyword variation?
– How much quality control is done on content?

위와 같은 질문에 긍정적으로 답할 수 있따면 “질 좋은 컨텐츠”로 여겨지는 걸까요?
자세한 내용은 Google webmaster Blog에서 확인하실 수 있습니다.

이번 Google Panda 업데이트로 인하여 영어권은 전체 조회 키워드의 12%가 영향을 받았으며, 기타 언어권은 약 6~8%가 영향을 받을 것이라 합니다. SEOer 중 한 명으로써 짱짱히 잘 나가던 사이트가 하루아침에 사라지는 경우를 Panda 이후에 종종 보고 들을 수 있었습니다. 그렇다면 무엇을 해야 할까요?

사이트 내 “질 낮은 컨텐츠”를 최소화 하는 것입니다. (호호호…Google과 같이 원론적인 이야기 이죠?)
“질 낮은 컨텐츠”의 원인이 되는 무수히 많은 원인이 있을 수 있습니다. 그러나 이번 업데이트로 패널티를 받은 사이트들의 공통 요소는 바로 “중복 컨텐츠”와 “링크” 요소가 많았다고 합니다.

 – 중복 컨턴츠(Duplicate Contents) : 서로 다른 URL인데 전체적으로 완전히 같은 컨텐츠를 사용하고 있거나 일부 컨텐츠가 같은 경우를 의미. 자세한 내용은 “중복 컨텐츠 검색엔진 최적화 TIP 에서 확인 하세요~! – 중복 컨텐츠 종류
a. Internal True Duplicate : 하나의 사이트 내 정확하게 동일한 다 수의 컨텐츠 존재
b. External True Duplicate : 정확하게 동일한 다 수의 컨텐츠가 여러 도메인으로 존재 (e.g. 불법 스크렙 등)
c. Internal Near Duplicate : 하나의 사이트 내 소량의 내용만 다른 유사컨텐츠가 존재
(e.g. 색상이나 사이즈가 다른 동일 제품을 설명 하는 페이지)
d. External Near Duplicate : 소량의 내용만 다른 유사컨텐츠가 여러 도메인으로 존재
(e.g. 재조사 페이지와 상품을 파는 쇼핑몰 사이트)

“링크”적인 요소는 어떤 것을 의미할까요?

 – 링크적 요소 : 페이지 내 불필요한 링크들로 인하여 페이지 컨텐츠 가치가 하락하는 경우 – 예시
a. Heavy Template Footprint : 오리지널 컨텐츠보다 불필요한 링크가 더 많은 경우
147044384E5357331AB6B7

b. High AD Ratio : 사이트 내 컨텐츠 보다 광고가 더 많은 경우

위 두 경우 모두 실질적인 컨텐츠를 강조하지 못하기 때문에 Google 입장에서는 불필요한 정보가 더 많은 “질이 낮은 컨텐츠”로 인식하게 됩니다.

“중복 컨텐츠”와 “링크적 요인”이 Google Panda 업데이트로 인한 페널티를 받게 되는 절대적인 원인은 물론 아닙니다.
다만 비중있는 지표로 사용됨은 어느정도 인정해야 하지 않을 듯 합니다.
만약 이번 Google Panda 업데이트로 인하여 잘 나가던 사이트가 검색결과에서 사라졌다면, 위 요소들을 한번 고려해 보실 수 있을 듯 합니다.

Google Panda 뒷 이야기.
a. Google Panda 업데이트는 페이지 레벨의 페널티를 부여 하는 것이 아니라 사이트 레벨에 페널티를 부여 합니다.
즉, 사이트 내 몇몇 페이지의 문제로 인하여 사이트 자체가 검색 결과에서 사라지게 될 수 있다는 것이죠.
b. Google Panda 알고리즘을 짜기 위하여 처음에는 사람이 수동으로 알고리즘 요소를 뽑아 냈다고 합니다.
알고리즘을 짜고 사람이 테스트를 한게 아니라, 사람들이 수동으로 여러 요소를 우선 선별 하여 각 사이트 별 점수를 부여하고 이를 알고리즘 화 하여 테스트 하여 각 사이트의 사람이 직접 부여한 점수와 시스템이 부여한 점수가 어느정도 일치되는지를 일일이 확인했다고 하네요…. 독합니다. ㅡ.ㅡ;;;

얼마 전 Google의 검색 알고리즘 업데이트 히스토리를 정리하시던 저희 실장님께서..”Google의 큼지막한 업데이트는 모두 홀 수 년도에 이루어 지는데” 라는 말씀을 하셨습니다. 그 말이 사실이라면 2013년까지는 조금 안심 할 수 있을 것이라 스스로를 위로해 봅니다.