키워드매칭 시대의 종말

2013년 Google의 Hummingbird 업데이트 이후, 검색은 ‘키워드 매칭’에서 ‘의도 파악’으로 크게 진화하였습니다. 사용자가 “밤에 잠이 안오는 이유” 라고 검색 했을 때, ‘불면증 해결법’, ‘수면클리닉’ 문서가 노출됩니다. 직접적으로 불면증이나 수면이라는 단어가 언급되지 않았음에도 불구하고 검색자의 “잠이 안오는 문제를 해결하고 싶다”는 의도를 파악한 결과라고 볼 수 있습니다.이 변화의 중심에 뉴럴매칭(Neural Matching)BERT(Bidirectional Encoder Representations from Transformers)라는 두 알고리즘이 있습니다.키워드 보다 맥락과 의미가 중요해진 GEO 시대에, 두 알고리즘이 어떻게 상호보완 하며 작동하는지 살펴보겠습니다.

목차

  • 뉴럴매칭 (Neural Matching)이란 무엇인가?
  • BERT (Bidirectional Encoder Representations from Transformers)란 무엇인가?
  • 뉴럴매칭과 BERT의 차이점은 무엇인가?
  • 뉴럴매칭과 BERT는 어떻게 서로를 상호보완 하는가?
  • AI 검색에서 뉴럴매칭과 BERT가 중요한 이유 5가지
  • 요약 및 결론

뉴럴매칭 (Neural Matching)이란 무엇인가?

뉴럴매칭(Neural Matching)은 검색자가 입력한 단어와 웹페이지의 단어가 정확히 일치하지 않더라도, AI가 그 안에 담긴 '숨은 의도와 개념'을 파악해 가장 알맞은 문서를 찾아주는 구글의 인공지능 알고리즘 기술입니다. 과거 검색엔진이 사용자가 입력한 단어와 정확히 일치하는 글자만 찾아내는 '키워드 매칭' 방식이었다면, 뉴럴매칭은 문장 전체의 맥락을 바탕으로 사용자의 숨겨진 검색 의도를 파악합니다.

쿼리 전체와 문서 전체를 각각 GPS 좌표처럼 고차원 벡터로 변환하고, 코사인 유사도를 계산하여 두 벡터의 방향이 얼마나 비슷한지(=의미가 얼마나 가까운지) 측정합니다.

ext vectorization for neural matching

예를 들어 사용자가 검색창에 "밤에 잠이 안오는 이유"라는 일상적인 문장을 검색했을 때, 정확히 일치하는 키워드가 아니어도 “잠”과 “수면”, “잠이안와” 와 “불면증” 같은 동의어나 관련 개념들이 가까운 위치에 있기 때문에 의미적으로 유사한 문서를 찾아낼 수 있습니다.

BERT (Bidirectional Encoder Representations from Transformers)란 무엇인가?

BERT는 문장 속 단어들의 앞뒤 문맥을 양방향으로 동시에 분석하는 언어모델 알고리즘입니다. 과거의 언어모델이 단어를 왼쪽에서 오른쪽으로 한 방향으로만 읽어 내려갔다면, BERT는 문장 전체 구조를 통틀어 단어와 단어 사이의 유기적인 관계를 추적합니다.

BERT analyzing the context of words based on all surrounding words

예를 들어 사용자가 "인천공항에서 JFK공항까지 비행시간"이라는 문장을 검색했을 때, BERT는 이 문장의 핵심이 단순한 공항 정보가 아닌 두 공간을 잇는 '이동 시간'과 방향성에 있음을 명확히 해석합니다.

과거의 검색엔진이라면 '인천공항', 'JFK공항', '비행시간'이라는 개별 단어에만 집중하여 각각의 공항 안내 페이지나 일반적인 항공권 예매 사이트를 무작위로 보여주곤 했습니다. 반면 BERT는 '에서'와 '까지'라는 조사의 맥락적 의미를 정확히 인지하여, 실제 인천에서 뉴욕 JFK공항으로 직항 혹은 경유할 때 걸리는 구체적인 소요 시간 운항 정보를 다룬 맞춤형 콘텐츠를 최상단에 노출 합니다.

뉴럴매칭과 BERT의 차이점은 무엇인가?

뉴럴매칭과 BERT의 가장 큰 차이는 검색어를 '개념'으로 접근하느냐, '문장 구조와 문맥'으로 접근하느냐에 있습니다. 뉴럴 매칭은 검색어와 콘텐츠 사이의 개념적 연관성을 찾아내는 일종의 '동의어 사전'으로 표현되곤 합니다. 반면 BERT는 문장 속에서 단어들이 어떻게 유기적으로 연결되는지 언어의 맥락과 구조를 분석합니다.

뉴럴매칭은 검색어의 ‘의도’와 ‘개념’을 넓게 매칭하고, BERT는 복잡하고 긴 문장의 '정확한 맥락'을 깊게 파악하는 역할을 합니다. 구글 시스템 안에서 이 두 알고리즘은 상호보완적으로 작동하며 사용자가 던진 모호한 질문에도 검색 의도를 반영한 답을 찾아내고 있습니다.

뉴럴매칭 vs BERT 비교

구분 뉴럴매칭 (Neural Matching) BERT (Bidirectional Encoder Representations from Transformers)
도입시기 2018년 2019년
핵심역할 개념연결 (Concept Matching) 문맥이해 (Contextual Understanding)
작동원리 쿼리와 페이지 간의 ‘유사한 개념’을 매칭 단어간의 앞뒤 관계를 양방향으로 분석해 ‘의도’ 파악
주요강점 검색어나 표현이 달라도 같은 의미를 가진 문서 찾기 조사, 전치사(to, for)나 어순에 따라 복잡한 문장의 뉘앙스를 파악
비유 “이 검색어는 대략 이런 주제를 찾는 거구나” “이 문장에서 이 단어는 이런 의미로 쓰였구나”

뉴럴매칭과 BERT는 어떻게 서로를 상호보완 하는가?

뉴럴매칭과 BERT는 쿼리와 잠재적으로 관련성 있는 결과를 포함한 언어를 이해하기 위해 함께 사용됩니다. 예시로 “맥북이 너무 뜨거워” 라는 쿼리에서 BERT는 ‘맥북’이라는 개체와 ‘뜨거워’ 라는 상태를 문맥적으로 파악한 뒤, 뉴럴매칭이 이 해석을 바탕으로 ‘노트북 발열’, ‘랩탑 과열’과 같은 개념적으로 유사한 문서들을 벡터 공간에 불러옵니다.

neural matching and BERT are complementary

핵심 포인트: BERT가 "무슨 뜻인지" 해석하면, 뉴럴매칭이 "어떤 문서가 그 뜻과 가까운지" 찾아내는 분업 구조.즉, BERT는 "정확한 해석"을, 뉴럴매칭은 "넓은 매칭"을 담당하며, 이 조합 덕분에 사용자가 정확한 키워드를 몰라도 원하는 정보를 찾을 수 있게 됩니다.

AI 검색에서 뉴럴매칭과 BERT가 중요한 이유 5가지

  1. AI는 ‘의미’로 콘텐츠를 선택

    AI가 답변을 생성할 때, 수백만 개의 문서 중 어떤 것을 참고할지 결정하는 기준은 키워드 일치가 아닌 의미적 유사도입니다. 뉴럴매칭 처럼 AI도 쿼리와 문서를 벡터 공간에서 비교하여 개념적으로 가까운 콘텐츠를 우선 선택합니다. "밤에 잠이 안 온다"는 질문에 "불면증"이라는 단어가 없어도 수면 장애 관련 콘텐츠가 선택되는 이유입니다.

  2. 문맥 해석 능력이 인용 여부를 결정

    BERT가 문장 내 단어 간 관계를 파악하듯, 생성형 AI도 콘텐츠의 문맥과 구조를 읽습니다. "인천공항에서 JFK 공항까지"라는 표현에서 ‘에서’와 ‘까지’의 방향성을 이해하고, ‘비행시간’이 거리나 가격이 아닌 시간 정보를 요청한다는 것을 파악합니다. 이처럼 문맥이 명확한 콘텐츠일수록 AI가 정확히 해석하고 인용할 확률이 높아지가됩니다.

  3. 정의문과 구조화된 정보를 우선

    AI가 답변을 생성할 때 가장 많이 인용하는 형태는 "X는 ~이다" 같은 명확한 정의문과 비교표, 단계별 설명 등 구조화된 정보입니다. 이는 BERT가 문장 구조를 파악하는 방식과 일치합니다. 모호한 표현보다 단정적이고 명확한 문장이 AI에게 "발췌하기 쉬운" 콘텐츠가 됩니다.

  4. 정확한 개체(Entity) 인식

    뉴럴매칭과 BERT 모두 사람, 장소, 제품, 기술명 등 각 개체를 정확히 인식하는 것을 중요하게 판단합니다.

  5. 주제의 깊이가 권위 확보

    Neural Matching이 쿼리와 문서 전체의 의미를 비교하듯, AI도 특정 주제에 대해 얼마나 깊이 있게 다루는지를 평가합니다. 같은 키워드를 10번 반복하는 것보다, 그 주제를 둘러싼 관련 개념 20개를 자연스럽게 다루는 콘텐츠가 더 높은 주제 권위를 인정받습니다.

요약 및 결론

뉴럴매칭과 BERT는 사용자의 의도를 파악하는 핵심 기술입니다. BERT가 문장 내 단어 간 관계를 양방향으로 해석하여 쿼리의 의도를 정확히 파악하면, 뉴럴매칭이 벡터 공간에서 개념적으로 유사한 문서를 매칭합니다. 키워드가 일치하지 않아도 의미가 가까우면 검색 결과에 노출되고 AI에게 인용되는 이유입니다. 뉴럴매칭과 BERT의 작동 원리는 현재 생성형 AI 검색의 기반이기 때문에 이 원리를 이해하고 적용하는 것은 SEO를 넘어, GEO 시대에 AI에게 인용되는 콘텐츠를 만드는 필수 전략입니다.





참고문서:
1. Understanding searches better than ever before
https://blog.google/products-and-platforms/products/search/search-language-understanding-bert/
2. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
https://arxiv.org/pdf/1810.04805
3. How AI powers great search results
https://blog.google/products-and-platforms/products/search/how-ai-powers-great-search-results/
4. Neural ranking models for document retrieval
https://arxiv.org/pdf/2102.11903