본문으로 건너뛰기
목록으로 돌아가기
자연어 처리 (NLP)

정보 유실 현상 (Lost in the Middle)

긴 컨텍스트에서 문서 중간 정보가 상대적으로 덜 활용되어 답변 정확도가 떨어지는 현상

#Lost in the Middle#정보 유실#컨텍스트 유실#중간 구간 손실

정보 유실 현상이란?

Lost in the Middle은 긴 입력 문서에서 앞뒤 정보보다 중간 구간 정보가 덜 반영되는 현상을 뜻합니다.
결과적으로 모델이 중요한 근거를 놓쳐 답변 정확도가 떨어질 수 있습니다.

어떻게 나타나나요?

문서 길이가 길어질수록 중간 부분의 세부 근거가 인용되지 않거나, 관련성 낮은 단락이 선택되는 패턴이 나타납니다.

  1. 중간 구간 근거를 답변에서 누락
  2. 앞부분·끝부분 중심으로 편향된 인용
  3. 복합 질의에서 핵심 문맥 연결 실패

왜 중요한가요?

RAG, 긴 문서 QA, 리포트 생성에서는 근거 누락이 신뢰도 하락으로 이어집니다.
청크 전략, 재정렬(reranking), 핵심 문맥 재삽입 같은 보정이 필수입니다.

관련 용어