LLM (대규모 언어 모델)
방대한 텍스트 데이터로 학습한 초대형 AI 모델
#LLM#GPT#언어모델
LLM이란?
LLM(Large Language Model)은 수십억 개 이상의 매개변수를 가진 초대형 인공지능 모델입니다. 인터넷에 존재하는 방대한 양의 텍스트 데이터를 학습하여 인간처럼 자연스러운 언어를 이해하고 생성할 수 있습니다.
쉽게 비유하자면, LLM은 수백만 권의 책을 읽은 박학다식한 비서와 같습니다. 이 비서는 직접 경험하지 않았지만 읽은 내용을 바탕으로 질문에 답하고, 글을 쓰고, 번역하고, 코드를 작성하는 등 다양한 언어 작업을 수행합니다.
어떻게 작동하나요?
LLM은 주어진 텍스트의 다음 단어를 예측하는 방식으로 학습합니다. "오늘 날씨가 정말..."이라는 문장 뒤에 "좋다", "춥다" 같은 단어가 올 확률을 계산하는 것입니다. 이 단순한 원리를 수십억 개의 매개변수와 엄청난 양의 데이터로 확장하면, 놀랍도록 정교한 언어 능력이 나타납니다.
핵심 구조로는 트랜스포머(Transformer) 아키텍처를 사용하며, 특히 셀프 어텐션 메커니즘을 통해 문맥을 깊이 이해합니다.
대표 사례
- GPT-4 (OpenAI): 가장 널리 알려진 LLM으로 ChatGPT의 기반 모델
- Claude (Anthropic): 안전성과 유용성을 강조한 대화형 AI
- Gemini (Google): 멀티모달 능력을 갖춘 구글의 차세대 모델
- LLaMA (Meta): 오픈소스로 공개되어 연구 커뮤니티에서 널리 활용
관련 용어
자연어 처리 (NLP)
GPT
OpenAI가 개발한 대표적인 대규모 언어 모델 시리즈
자연어 처리 (NLP)
에이전트 (AI Agent)
스스로 판단하고 도구를 활용해 작업을 수행하는 자율 AI
자연어 처리 (NLP)
컨텍스트 윈도우 (Context Window)
AI 모델이 한 번에 읽고 처리할 수 있는 입력 토큰의 최대 범위
자연어 처리 (NLP)
토큰 (Token)
AI가 텍스트를 처리하는 최소 단위
자연어 처리 (NLP)
파인튜닝 (Fine-tuning)
사전 학습된 AI 모델을 특정 목적에 맞게 추가 학습시키는 기술
자연어 처리 (NLP)
프롬프트 (Prompt)
AI 모델에게 원하는 결과를 얻기 위해 입력하는 지시문