Knowledge Graph
엔터티와 엔터티 사이의 관계를 그래프 구조로 표현한 지식 베이스. 검색 엔진과 LLM이 엔터티 정체성 확인에 구조화된 참조 데이터로 활용한다
Knowledge Graph란?
Knowledge Graph(지식 그래프)는 엔터티(인물·조직·장소·개념)를 노드로, 그 관계를 엣지로 표현한 구조화된 지식 데이터베이스다. 구글이 2012년에 출시한 Google Knowledge Graph가 가장 잘 알려진 사례다. 출시 슬로건 "문자열이 아니라 사물(things, not strings)"은 검색을 키워드 매칭에서 엔터티 인식으로 전환하는 선언이었다.
구글은 Knowledge Graph를 어떻게 활용하는가?
Google Knowledge Graph Search API는 schema.org 타입 체계를 기반으로 엔터티를 식별한다. 브랜드를 검색하면 구글은 Knowledge Graph를 먼저 확인해 해당 엔터티의 종류를 파악하고, 웹에서 최신 정보를 채운다.
그래서 Knowledge Graph에 명확하게 등록된 브랜드는 특정 페이지가 높은 순위에 없더라도 Google AI Overview, Gemini 답변, 검색 결과 우측 Knowledge Panel에 일관되게 등장할 수 있다.
Knowledge Graph는 어떻게 채워지는가?
구글은 직접 등록 창구를 제공하지 않는다. 대신 여러 소스에서 구조화 신호를 수집한다:
| 소스 | 가중치 |
|---|---|
| Wikidata | 매우 높음 — 구조화된 삼중항, CC0 라이선스 |
| Wikipedia | 매우 높음 — 권위 있는 자연어 서술 |
| schema.org Organization (자사 사이트) | 높음 — sameAs 자기 선언 |
| Google Business Profile | 높음 — 구글이 직접 운영하는 채널 |
| 권위 매체 언론 보도 | 중상 — 독립적 검증 |
LLM에서의 Knowledge Graph Grounding
구글 외에도 LLM은 엔터티 획득의 세 번째 경로(사전학습·RAG 검색에 더해)로 Knowledge Graph Grounding을 활용한다. 답변 생성 시 구조화된 Knowledge Graph 사실을 참조해 응답을 고정(ground)하는 방식이다. Wikidata에 명확히 정의된 브랜드가 웹 문서에만 서술된 브랜드보다 AI 답변에 더 일관되게 등장하는 이유가 여기에 있다.