구글 검색은 페이지(URL) 전체 평가에서 '질문에 직접 답하는 단락(Passage)' 단위 평가로 확장되었으며, RAG(Retrieval-Augmented Generation) 기반 생성형 AI 검색 구조가 확산되면서 단락 단위 정보 구조화가 2026년 SEO·GEO(Generative Engine Optimization)의 핵심 전략 축이 되고 있습니다.

이 글에서는 구글의 Passage Ranking 개념, RAG 기반 AI 검색의 작동 구조, 단락 품질 평가 지표(Context Relevance·Answer Faithfulness·Answer Relevance), 그리고 2026년형 GEO 콘텐츠 전략을 순서대로 다룹니다.

목차

  • 배경: AI 검색은 문서를 어떻게 읽고 인용하는가?
  • 1. Passage Ranking이란 무엇인가?
  • 2. 검색 엔진은 어떤 단락을 '좋은 답변'으로 평가하는가?
  • 3. 2026년 GEO 전략은 무엇이 달라지는가?

배경: AI 검색은 문서를 어떻게 읽고 인용하는가?

: Text Chunking · Vector Embedding · RAG 구조

생성형 AI 검색 시스템은 긴 문서를 통째로 처리하는 대신, 문단·주제·문맥 단위로 나눈 여러 개의 정보 단위(Chunk)를 기반으로 검색하는 구조를 사용합니다. 공개된 생성형 AI 아키텍처 자료와 검색 업계 기술 문서에 따르면, 이 과정에서 Text Chunking·Vector Embedding·RAG가 핵심 메커니즘으로 활용됩니다.

  • Text Chunking: 시스템은 긴 문서를 문단·주제·문맥 단위로 분리해 여러 개의 Chunk로 나눕니다. 특정 질문과 관련된 부분만 빠르게 탐색하기 위한 구조입니다.
  • Vector Embedding: 분리된 텍스트 청크는 고차원 벡터 데이터(Vector Data)로 변환됩니다. 이를 통해 검색 시스템은 단순 키워드 일치가 아닌 의미 기반 유사성(Semantic Similarity)을 계산할 수 있습니다.
  • RAG(Retrieval-Augmented Generation): 사용자가 질문을 입력하면 시스템은 벡터 검색(Vector Retrieval)으로 관련성이 높은 Chunk를 우선 탐색한 뒤, 검색된 정보를 기반으로 생성형 AI가 답변을 생성합니다.
  • Reranking: 검색 시스템은 후보 문단들을 재평가하며, 질문과 관련성이 가장 높은 Passage를 상단으로 재정렬합니다. 검색 업계에서는 이 과정을 Context Relevance 평가로 설명합니다.

(전체 흐름 요약: Text Chunking → Vector Embedding → Vector Retrieval → RAG 기반 응답 생성 → Reranking 및 Relevance 평가.)

1. Passage Ranking이란 무엇인가?

: 구글은 왜 문서 전체가 아니라 단락을 평가하기 시작했는가?

구글의 Passage Ranking은 웹페이지 전체뿐 아니라, 문서 내부 특정 단락(Passage)의 의미와 검색 질의 관련성을 함께 평가하는 검색 시스템 개선 방식입니다. 구글 공식 Search Central 문서에 따르면, 구글은 페이지 전체를 색인(Indexing)하면서도 문서 내부 특정 구절을 별도로 이해할 수 있도록 검색 시스템을 개선했으며, 이는 긴 글 안에 숨어 있는 유용한 답변을 검색 결과에 반영하기 위한 목적이라고 설명합니다. 구글은 Passage Ranking이 전 세계 검색 질의의 약 7%에 영향을 미친다고 발표했으며(Google, 2021), 2021년 2월 미국·영어 검색을 시작으로 순차적으로 적용되었습니다(Search Engine Land, 2021).

  • 기존 Document Ranking 구조의 특징: 기존 검색 시스템의 핵심은 문서 랭킹(Document Ranking)이었습니다. Document Ranking은 웹페이지(URL) 전체를 하나의 평가 단위로 보고, 페이지 제목(Title), 메인 헤더(H1), 내부 링크 구조, 도메인 권위도(Domain Authority) 등의 신호를 종합해 검색 순위를 결정하는 방식입니다. Document Ranking 구조에서는 사이트 규모가 크고 도메인 권위가 높은 웹사이트가 상대적으로 유리하게 평가되었습니다.
  • Passage Ranking이 추가한 변화: 구글 Search Central은 Passage Ranking을 "페이지 전체를 이해하면서도 특정 구절의 관련성을 추가적으로 평가하는 시스템"으로 설명합니다. 구글은 Passage를 별도의 독립 문서처럼 따로 색인하는 것이 아니라고 명시하고 있습니다. 즉 Passage Ranking은 새로운 인덱싱(Indexing) 기술이 아니라, 기존 페이지 색인 위에서 문서 내부 의미를 더 정교하게 이해하는 검색 품질 개선에 가깝습니다. 내부 알고리즘으로는 BERT를 넘어선 SMITH(Siamese MultI-depth Transformer-based Hierarchical) 알고리즘이 활용됩니다(Google Research).

예를 들어, 페이지 전체 주제가 "주택 단열"이더라도 내부 특정 단락이 "창문 UV 차단 유리 확인 방법"을 상세히 설명하고 있다면, 구글은 해당 Passage를 관련 검색 결과에 활용할 수 있습니다.

평가 항목문서 랭킹(Document Ranking)패시지 랭킹(Passage Ranking)
평가 단위웹페이지(URL) 전체페이지 내부 특정 단락
핵심 신호Title, H1, 링크, 도메인 권위도문맥 의미, 질의 적합성
색인 방식페이지 전체 색인동일하게 페이지 전체 색인
강점사이트 전체 권위 평가특정 질문에 대한 직접 답변 추출
핵심 기술키워드·주제 기반 평가BERT·SMITH 기반 의미 이해

Passage Ranking의 핵심 변화는 검색 엔진의 평가 범위가 "페이지 전체의 명성"에서 "문서 내부 특정 단락의 의미와 관련성"까지 확장된 것입니다. 이 변화가 이후 GEO 전략에서 단락 단위 정보 구조화를 중요하게 다루게 된 직접적인 배경입니다.

2. 검색 엔진은 어떤 단락을 '좋은 답변'으로 평가하는가?

: Context Relevance · Answer Faithfulness · Answer Relevance 기반 단락 품질 평가

단락 품질 평가의 핵심은 질문과 직접 연결되는 정보를, 군더더기 없이 담고 있는가 입니다. RAG 기반 AI 검색 시스템은 검색된 단락(Passage)이 질문에 얼마나 적절하게 답하는지를 단락 단위 평가 지표로 측정합니다. RAGAS·TruLens 등 RAG 평가 프레임워크와 구글 Search Quality 문서에서 공통적으로 활용되는 대표 지표는 다음 세 가지입니다.

  • Context Relevance: 검색된 단락이 사용자 질문과 얼마나 관련 있는가를 평가합니다. RAG 파이프라인에서 retrieval 단계의 품질을 직접적으로 측정하는 핵심 지표로, 질문과 무관한 내용이 포함된 단락일수록 낮은 점수를 받습니다.
  • Answer Faithfulness: 생성된 답변이 검색된 단락의 내용에 실제로 근거하고 있는가를 평가합니다. 단락에 없는 내용을 답변에 포함하거나 사실을 왜곡할 경우(할루시네이션) 낮은 점수를 받습니다.
  • Answer Relevance: 최종 생성 답변이 사용자 질문에 직접적으로 답하는가를 평가합니다. 관련 없는 서론이나 장황한 배경 설명이 많을수록 점수는 낮아집니다.

구글 Passage Ranking의 내부 메커니즘도 같은 방향을 가리킵니다. 구글은 BERT·SMITH 알고리즘을 활용해 질의(Query)와 단락 간 의미적 유사도(Semantic Similarity)를 계산하며, 이를 통해 페이지 전체 주제와 별개로 특정 단락이 질문에 얼마나 직접 답하는지를 독립적으로 평가합니다.

3. 2026년 GEO 전략은 무엇이 달라지는가?

: 문서 SEO에서 '검색 가능한 단락 설계'로의 이동

2026년형 SEO와 GEO(Generative Engine Optimization)의 핵심 변화는 '문서 전체 최적화'에서 'AI가 이해하기 쉬운 단락 설계'로 평가 기준이 이동하고 있다는 점입니다. 구글의 AI Overviews(AIO)는 2025년 1월 전체 검색 쿼리의 6.49%에 출현했다가 같은 해 3월에는 13.14%로 두 달 만에 약 100% 증가했으며(Semrush, 2025), 미국 데스크톱 검색의 약 16%에서 표시됩니다(SE Ranking, 2025). AI Overviews가 표시되는 쿼리에서 상위 노출 페이지의 클릭률(CTR)은 최대 34.5% 하락하는 것으로 분석되었습니다(Semrush, 2025).

현재 검색 업계와 GEO 실무에서 자주 언급되는 구조 전략은 다음과 같습니다.

  • 질문형 소제목 아래에 핵심 답변 먼저 배치
  • 하나의 문단에서 하나의 핵심 주제만 설명
  • 통계·출처·Entity를 명확히 제시
  • 불필요한 서론보다 핵심 정보 우선 배치
  • 긴 문단보다 의미 단위별 구조화 강화
  • 전문 용어 등장 시 영문 병기 및 정의 제공

앞으로의 SEO는 단순 키워드 반복 경쟁보다 "AI가 신뢰할 수 있는 단락을 얼마나 명확하게 설계했는가"의 경쟁에 가까워질 가능성이 높다고 생각합니다. Document Ranking 시대에는 사이트 규모와 도메인 권위가 절대적으로 중요했지만, Passage Ranking과 RAG 기반 AI 검색 구조에서는 작은 사이트라도 특정 질문에 가장 직접적이고 구조화된 답변을 제공한다면 AI 검색 환경에서 인용될 수 있는 구조가 만들어지고 있습니다. AI 인용의 44%가 콘텐츠 앞부분 3분의 1에서 발생한다는 사실은 "얼마나 많이 썼는가"보다 "AI가 한 번에 이해하고 인용할 수 있는 단락을 얼마나 잘 설계했는가"가 핵심임을 보여줍니다.