정보 유실 현상 (Lost in the Middle)
긴 컨텍스트에서 문서 중간 정보가 상대적으로 덜 활용되어 답변 정확도가 떨어지는 현상
#Lost in the Middle#정보 유실#컨텍스트 유실#중간 구간 손실
정보 유실 현상이란?
Lost in the Middle은 긴 입력 문서에서 앞뒤 정보보다 중간 구간 정보가 덜 반영되는 현상을 뜻합니다.
결과적으로 모델이 중요한 근거를 놓쳐 답변 정확도가 떨어질 수 있습니다.
어떻게 나타나나요?
문서 길이가 길어질수록 중간 부분의 세부 근거가 인용되지 않거나, 관련성 낮은 단락이 선택되는 패턴이 나타납니다.
- 중간 구간 근거를 답변에서 누락
- 앞부분·끝부분 중심으로 편향된 인용
- 복합 질의에서 핵심 문맥 연결 실패
왜 중요한가요?
RAG, 긴 문서 QA, 리포트 생성에서는 근거 누락이 신뢰도 하락으로 이어집니다.
청크 전략, 재정렬(reranking), 핵심 문맥 재삽입 같은 보정이 필수입니다.
관련 용어
자연어 처리 (NLP)
어텐션 (Attention)
입력 데이터에서 중요한 부분에 집중하는 딥러닝 메커니즘
자연어 처리 (NLP)
에이전트 (AI Agent)
스스로 판단하고 도구를 활용해 작업을 수행하는 자율 AI
자연어 처리 (NLP)
임베딩 (Embedding)
텍스트나 이미지를 숫자 벡터로 변환하는 표현 기술
자연어 처리 (NLP)
재랭킹 (Reranking)
초기 검색 결과를 다시 평가해 더 관련도 높은 순서로 재정렬하는 후처리 단계
자연어 처리 (NLP)
제로샷/퓨샷 (Zero-shot/Few-shot)
예시 없이 또는 소수의 예시만으로 AI가 새로운 작업을 수행하는 방법
자연어 처리 (NLP)
제미나이 (Gemini)
Google DeepMind가 개발한 멀티모달 생성형 AI 모델 계열