본문으로 건너뛰기

검색

"LLM" 검색 결과 29건

탈라스, 칩에다 모델 새겨 넣어 추론 속도 10배 향상한 기술 공개
AI타임스
AI타임스

탈라스, 칩에다 모델 새겨 넣어 추론 속도 10배 향상한 기술 공개

AI 모델을 전용 실리콘 칩으로 구현하는 플랫폼이 등장했다. 대형언어모델(LLM)과 같은 컴퓨팅 집약적인 애플리케이션의 처리 속도를 높이기 위해 최적화한 그로크의 추론 엔진 ‘언어 처리 장치(LPU)’와 유사하다.스타트업 탈라스는 최근 새로운 모델을 전달받으면 약 두달 만에 이를 맞춤형 반도체(ASIC)로 구현할 수 있는 플랫폼을 개발했다. 이렇게 탄생한…

#AI#LLM#GPU
원문
'해석 가능한' 8B 모델 오픈소스 등장..."특정 개념 강화·제거 가능"
AI타임스
AI타임스

'해석 가능한' 8B 모델 오픈소스 등장..."특정 개념 강화·제거 가능"

미국의 한 스타트업이 AI의 답변이 어떻게 나왔는지 확인할 수 있는 새로운 아키텍처의 모델을 개발했다. 이전에도 모델의 블랙박스 문제를 해결하기 위한 시도가 있었지만, 이번에는 모델 내부를 추적하기 위해 처음부터 모델을 새로 구축했다.가이드랩스(Guide Lab)는 23일(현지시간) 80억개의 매개변수를 가진 '스티어링-8B(Steerling-8B)'를…

#AI#LLM
원문
"길게 생각하지 말고, 깊이 생각하라"... 구글, AI 추론 비용 절반 줄이는 'DTR' 공개
AI타임스
AI타임스

"길게 생각하지 말고, 깊이 생각하라"... 구글, AI 추론 비용 절반 줄이는 'DTR' 공개

대형언어모델(LLM)의 사고 사슬(CoT)을 더 길게 만들어 오래 생각하는 것이 항상 정확도를 올려주지 않으며, 대신 '깊이 생각하는 것'이 더 중요하다는 연구 결과가 나왔다. 이를 보완한 기술이 상용화되면 더 적은 토큰을 사용하고 정확한 답변을 낼 수 있을 것으로 기대된다는 평이다.구글과 버지니아대학교 연구진은 12일(현지시간) 온라인 아카이브를 통해…

#AI#LLM#구글
원문
GeekNews
Prod
GeekNews

프롬프트 반복으로 LLM 정확도 향상, Google 팀 연구 결과

Google Research 팀이 발표한 논문(“Prompt Repetition Improves Non-Reasoning LLMs”)에서 발견한 매우 간단하면서도 강력한 기법: 같은 프롬프트를 그대로 두 번 반복해서 입력하면 대부분의 최신 LLM(Gemini, GPT-4o, Claude, DeepSeek 등)에서 정확도가 크게 올라간다...

#GPT#LLM#Google
원문
크라우드웍스, ‘국가대표 AI 프로젝트 데이터 공급 파트너’ 합류
벤처스퀘어
벤처스퀘어

크라우드웍스, ‘국가대표 AI 프로젝트 데이터 공급 파트너’ 합류

AI 테크 기업 크라우드웍스가 모티프테크놀로지스 컨소시엄에 데이터 공급 핵심 파트너로 참여하며 대한민국 독자 AI 파운데이션 모델 개발 사업에 합류했다. 크라우드웍스는 3,000억 파라미터급 추론형 거대언어모델(LLM) 학습용 단계별 추론 특화 데이터셋을 제공하고, 비... The post 크라우드웍스, ‘국가대표 AI 프로젝트 데이터 공급 파트너’ 합류…

#AI#LLM#파운데이션 모델
원문
AI 에이전트와 잘못된 생산성 지표
ITWorld 협업
ITWorld 협업

AI 에이전트와 잘못된 생산성 지표

개발자 존 크리켓은 엑스(X)에 약간의 빈정거림을 담아 다음과 같은 글을 올렸다. “소프트웨어 엔지니어 : 컨텍스트 스위칭은 생산성을 죽인다. 또 다른 소프트웨어 엔지니어 : 이제 19개 AI 에이전트를 관리하면서 하루에 1,800건을 커밋한다.” 크리켓의 이 농담이 정확히 꽂히는 이유는 실제로 농담이 아니기 때문이다. 크리켓의 발언은 앞으로 벌어질 관리…

#AI#LLM#AI 에이전트
원문
엔닷라이트, 대한민국 독자 AI 파운데이션 모델 구축 국가 프로젝트 참여
벤처스퀘어
벤처스퀘어

엔닷라이트, 대한민국 독자 AI 파운데이션 모델 구축 국가 프로젝트 참여

3D AI 기술 스타트업 엔닷라이트가 모티프테크놀로지스 컨소시엄에 합류해 300B 파라미터급 LLM부터 시각언어행동모델(VLA)까지 단계적 AI 모델 고도화 국가 프로젝트에 참여한다고 24일 밝혔다. 엔닷라이트는 Sim-Ready 3D 데이터 생성과 VLA 학습용 합성... The post 엔닷라이트, 대한민국 독자 AI 파운데이션 모델 구축 국가 프로젝트…

#AI#LLM#파운데이션 모델
원문
클로드·제미나이 월정액 계정, 오픈클로에 연동하면 차단…왜?
ITWorld 협업
ITWorld 협업

클로드·제미나이 월정액 계정, 오픈클로에 연동하면 차단…왜?

클로드나 제미나이의 월정액 요금제 계정을 오픈클로에 연결해 그 강력한 AI 기능을 활용해왔다면, 계정 정지를 각오해야 한다. 오픈클로에 클로드·제미나이 월정액 계정을 오스 로그인 방식으로 연결한 사용자들이 계정 정지 조치를 받고 있다. 오픈클로는 반나절 만에 수백만 개의 AI 토큰을 소모하는 오픈소스 AI 에이전트 플랫폼이다. 차단은 사전 경고 없이…

#AI#GPT#LLM
원문
GeekNews
Prod
GeekNews

GGML·llama.cpp, Hugging Face 합류

Hugging Face가 llama.cpp와 GGML 엔진의 핵심 개발자 Georgi Gerganov을 인수했다는 소식. 주요 내용: llama.cpp (로컬 LLM 실행의 사실상 표준 엔진)와 GGML 기반 기술이 Hugging Face 산하로 들어가면서, 오픈소스 로컬 AI 생태계의 두 축이 하나로 통합되었습니다. llama.

#AI#LLM#Llama
원문
엔닷라이트, 모티프테크놀로지스 독파모 컨소시엄 합류
로봇신문
로봇신문

엔닷라이트, 모티프테크놀로지스 독파모 컨소시엄 합류

3D AI 기술 스타트업 엔닷라이트(대표 박진영)가 모티프테크놀로지스 컨소시엄에 합류해 정부 ‘독자 AI 파운데이션 모델(독파모)’ 구축을 위한 국가 프로젝트에 본격 착수한다고 24일 밝혔다.이번 모티프테크놀로지스 컨소시엄은 국가 AI 경쟁력 강화를 목표로, 300B 파라미터급 추론형 언어모델(LLM) 구축을 시작으로 시각언어모델(VLM),…

#AI#LLM#파운데이션 모델
원문
코드명 ‘갈릭’… 출시 임박한 오픈AI의 GPT-5.3 어떤 모습일까
newstheai
newstheai

코드명 ‘갈릭’… 출시 임박한 오픈AI의 GPT-5.3 어떤 모습일까

이른바 코드명 ‘갈릭(Garlic)’으로 불리던 오픈AI의 차세대 인공지능(AI) 모델인 ‘GPT-5.3’이 이르면 이번 주 공개될 예정이다.23일(현지시간) 레딧을 비롯한 커뮤니티와 외신들에 따르면 오픈AI는 GPT-5.3을 오는 26일 공개할 것으로 점쳐지고 있다. GPT-5.3의 개발 소식은 지난해부터 있었다. IT전문매체 디인포메이션은 지난해…

#AI#GPT#LLM
원문
시니어 시민과학 만난 AI…국립산림과학원, 제주 숲 보전의 ‘눈’이 되다
인공지능신문
인공지능신문

시니어 시민과학 만난 AI…국립산림과학원, 제주 숲 보전의 ‘눈’이 되다

산림청 국립산림과학원(원장 김용관)은 제주 지역의 산림 생태 데이터를 체계적으로 관리하고 분석하기 위해 대형언어모델(LLM)과 검색증강생성(RAG) 기술을 적용한 ‘AI 기반 산림 데이터 관리·분석 시스템’을 개발했다. 이 시스템은 그동안 현장에서 수집된 방대한 자료를 분석하여 잎이 나고 지는 시기나 개화 변동 등 제주 숲의 계절적 변화를 종합적으로…

#AI#LLM#RAG
원문
엔닷라이트, ‘국가 대표’ 독자 AI 파운데이션 모티프테크놀로지스 컨소시엄 합류
파이낸셜뉴스 IT
파이낸셜뉴스 IT

엔닷라이트, ‘국가 대표’ 독자 AI 파운데이션 모티프테크놀로지스 컨소시엄 합류

[파이낸셜뉴스] 3D 인공지능(AI) 기술 스타트업 엔닷라이트가 모티프테크놀로지스 컨소시엄에 합류해 대한민국 독자 AI 파운데이션 모델 구축을 위한 국가 프로젝트에 본격 착수한다고 24일 밝혔다. 이번 모티프테크놀로지스 컨소시엄은 국가 AI 경쟁력 강화를 목표로, 300B 파라미터급 추론형 언어모델(LLM) 구축을 시작으로 시각언어모델(VLM),…

#AI#LLM#파운데이션 모델
원문
코난테크놀로지, aT에 LLM 어플라이언스 구축
newstheai
newstheai

코난테크놀로지, aT에 LLM 어플라이언스 구축

코난테크놀로지가 한국농수산식품유통공사(aT)의 ‘FIS식품산업통계정보’ 시스템 고도화 사업에 서버 일체형 AI 어플라이언스 ‘코난 AI스테이션 ENT’를 공급하고, 대형언어모델(LLM) 기반 서비스 구축을 완료했다. 이번 사업은 공공기관이 생성형 AI를 도입할 때 겪는 인프라 설계와 구축 복잡도를 줄이고, 서비스 개시 시점을 앞당추는 데 초점을 맞췄다.…

#AI#LLM
원문
200밀리초의 벽을 지켜라…개발자를 위한 실시간 개인화 가이드
ITWorld 협업
ITWorld 협업

200밀리초의 벽을 지켜라…개발자를 위한 실시간 개인화 가이드

이커머스, 핀테크, 미디어 분야에서 동시성이 높은 애플리케이션을 구축하는 엔지니어에게 ‘200밀리초’는 넘으면 안 되는 상한선이다. 200밀리초는 사용자가 상호작용을 즉각적이라고 느끼는 심리적 임계값이다. 개인화된 홈페이지, 검색 결과, 다음 동영상 추천 목록 로딩이 200밀리초를 넘으면 사용자 이탈이 급증한다. 아마존의 유명한 연구에 따르면 지연 시간이…

#AI#LLM#GPU
원문
‘국가대표 AI’ 패자부활전에 모티프테크놀로지스 낙점
newstheai
newstheai

‘국가대표 AI’ 패자부활전에 모티프테크놀로지스 낙점

과학기술정보통신부는 현재 추진하고 있는는 ‘독자 AI 파운데이션 모델(독파모)’ 프로젝트의 추가 공모, 이른바 ‘패자부활전’에서 스타트업 모티프테크놀로지스가 최종 선발됐다고 20일 밝혔다.독파모는 세계 수준의 국산 AI 모델 개발을 지원하기 위해 정부가 추진하는 프로젝트다. 선발된 기업들은 ‘정예팀.으로 묶여 300B(3000억 파라미터)급 추론형…

#AI#LLM#파운데이션 모델
원문
R과 바이탈(vitals)로 최적의 LLM을 선택하는 방법
ITWorld 협업
ITWorld 협업

R과 바이탈(vitals)로 최적의 LLM을 선택하는 방법

생성형 AI 애플리케이션이 기대한 답변을 내놓고 있는가? 더 저렴한 LLM, 혹은 로컬에서 무료로 실행할 수 있는 모델로도 일부 작업을 충분히 처리할 수 있을까? 이 같은 질문에 답하기는 쉽지 않다. 모델 성능은 매달 달라지는 듯 보인다. 기존 소프트웨어 코드와 달리 LLM은 같은 질문에도 매번 동일한 답을 내놓지 않는다. 테스트를 반복 실행하는 과정은…

#AI#GPT#LLM
원문
[릴리즈 노트] 사람만큼 컴퓨터를 다루는 LLM, Claude Sonnet 4.6
요즘IT
요즘IT

[릴리즈 노트] 사람만큼 컴퓨터를 다루는 LLM, Claude Sonnet 4.6

Claude Sonnet 4.6은 지금까지 나온 Sonnet 계열 가운데 가장 뛰어난 모델입니다. 코딩, 컴퓨터 사용, 긴 문맥 추론, 에이전트 계획, 지식 업무, 디자인 전반에서 능력이 크게 향상된 완전한 업그레이드 버전입니다. 또한 Sonnet 4.6은 베타 단계에서 100만 토큰 문맥 창(context window)을 지원합니다. Free와 Pro…

#AI#LLM#Claude
원문
로버트 마틴: AI 시대, LLM이 개발자를 대체할 수 없는 이유
요즘IT
요즘IT

로버트 마틴: AI 시대, LLM이 개발자를 대체할 수 없는 이유

AI 시대, 개발자는 정말 대체될까요? 대규모 언어 모델(LLM)은 코드 작성과 문서화에 능숙해 보이지만, 실상은 기존 데이터를 통계적으로 재조합한 결과에 불과합니다. 로버트 마틴은 책 에서 팩토리얼 계산과 소수 판정 자바 코드 사례를 통해 LLM이 내놓는 코드의 비효율성과 한계를 구체적으로 증명합니다. LLM은 지능적인 사고가 아닌 패턴 매칭에 의존하기…

#AI#LLM
원문
AI가 선을 넘기 시작할 때, 기업은 뭘 해야 할까?
요즘IT
요즘IT

AI가 선을 넘기 시작할 때, 기업은 뭘 해야 할까?

대형 언어 모델(Large Language Model, 이하 LLM)의 급속한 발전으로 기업들은 놀라운 생산성 향상의 기회를 갖게 되었지만, 동시에 보안, 개인정보, 윤리적 위험이라는 새로운 도전에 직면하고 있습니다. 특히 내부망과 외부망 분리가 일반적인 국내 기업 환경에서는 이러한 문제가 더욱 두드러집니다. 오늘 이야기는 세 가지 주요 섹션으로…

#AI#LLM
원문
에임인텔리전스·BMW 그룹, LLM의 기업 정책 준수 평가 프레임워크 ‘COMPASS’ 공개
플래텀 AI
플래텀 AI

에임인텔리전스·BMW 그룹, LLM의 기업 정책 준수 평가 프레임워크 ‘COMPASS’ 공개

에임인텔리전스가 BMW 그룹, 국내 대학과 공동으로 거대언어모델(LLM)이 기업별 정책을 얼마나 준수하는지 체계적으로 평가하는 프레임워크를 개발했다. 표준 안전성 테스트를 통과한 모델도 기업 현장의 복잡한 규칙 앞에서는 취약점을 보인다는 점을 확인했다. AI 보안 전문기업 에임인텔리전스는 BMW 그룹과 협력해 LLM의 기업별 맞춤형 정책 준수 여부를…

#AI#LLM
원문
네이버 D2
Infra
네이버 D2

FE News 25년 12월 소식을 전해드립니다!

주요소식 다음과 같은 유용한 정보들을 만나보실 수 있습니다. Wasm Does Not Stand for WebAssembly WebAssembly라는 이름 때문에 많은 개발자들이 Wasm을 웹 기술이자 어셈블리 언어로 오해한다. 하지만 웹 어셈블리는 웹만을 위한 기술도 아니고 어셈블리도 아니다. WebAssembly라는 이름은 프로젝트 펀딩을 위한…

#AI#GPT#LLM
원문
Kanana-2 개발기 (2): 개선된 post-training recipe를 중심으로
카카오 테크
카카오 테크

Kanana-2 개발기 (2): 개선된 post-training recipe를 중심으로

안녕하세요. 카카오의 AI 모델 개발을 담당하는 카나나 LLM 조직에서 Post-training을 연구하고 있는 Juliet, Kevin입니다. 지난 12월 19일 카카오가 자체 개발한 차세대 언어모델 Kanana-2-30b-a3b를 오픈소스로 공개한 데에 이어, 한 달여 만에 성능과 활용성을 대폭 강화한 Kanana-2 모델 4종(Base,…

#AI#LLM
원문
Kanana-2 개발기 (1): Pre-training에서의 의사결정들을 중심으로
카카오 테크
카카오 테크

Kanana-2 개발기 (1): Pre-training에서의 의사결정들을 중심으로

안녕하세요. 카카오의 AI 모델 개발을 담당하는 카나나 LLM 조직에서 Pre-training을 연구개발하는 Lambda입니다. 지난 12월 19일 카카오가 자체 개발한 차세대 언어모델 Kanana-2-30b-a3b를 오픈소스로 공개한 데에 이어, 한 달여 만에 성능과 활용성을 대폭 강화한 Kanana-2 모델 4종(Base, Mid-training,…

#AI#LLM
원문
네이버 D2
Infra
네이버 D2

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2025(10월)에서 발표되었던 세션을 공개합니다. 발표 내용 LLM-friendly PDF parser PaLADIN을 소개합니다. 발표 대상 AI/LLM을 적극적으로 활용하고 싶으신 분 문서 처리에 관심이 있으신 분 웹검색에 관심이 있으신 분 목차 PDF가 왜 중요한가요?…

#AI#LLM#Google
원문
네이버 D2
Infra
네이버 D2

사용자의 목소리를 AI로 재현하다: LLM기반 Multi Agent UX플랫폼 개발기

네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2025(10월)에서 발표되었던 세션을 공개합니다. 해당 발표는 팀네이버 컨퍼런스 DAN25 홈페이지에서도 살펴보실 수 있습니다. 발표 내용 “사용자에 진심인 3명이 모여, Persona가 말하게 만들다” 이 세션은 잘 만든 AI 시스템을. 넘어, 디자이너·AI 리서처·개발자가 경험한…

#AI#LLM#에이전트
원문
네이버 D2
Infra
네이버 D2

[DAN25] 기술세션 영상이 모두 공개되었습니다.

지난 11월 6일, 7일 양일간 진행된 팀네이버 컨퍼런스 DAN25에서는 네이버의 기술뿐만 아니라 크리에이티브, 서비스와 비즈니스를 유기적으로 융합해 일상의 작은 변화부터 새로운 생태계로의 도약까지, 끝없이 확장되는 경험의 로드맵을 함께 나누는 자리로 진행되었습니다. 현장에서는 AI 에이전트, 소버린 AI, AX 등 네이버가 제시하는 미래 전략과 실제…

#AI#GPT#LLM
원문
네이버 D2
Infra
네이버 D2

경험이 쌓일수록 똑똑해지는 네이버 통합검색 LLM Devops Agent

네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2025(10월)에서 발표되었던 세션을 공개합니다. 발표 내용 네이버 통합 검색에서 더 나은 장애 대응 프로세스를 위해 LLM Agent를 활용하는 방식에 대해 소개합니다. Agent 를 어떤 방식으로 구성하고 구축했는지, 어떻게 평가하고 활용하고 있는지를 자세히 소개합니다. 발표 대상…

#LLM#Agent
원문
네이버 D2
Infra
네이버 D2

AI와 함께하는 프로젝트 자동화 : 더 빠르고, 더 스마트하게

네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2025(10월)에서 발표되었던 세션을 공개합니다. 발표 내용 로컬 환경에서 Ollama LLM과 mcp-agent를 연결해 빌드 실패 분석, 크래시 로그 요약, Slack 자동 리포트까지 구현했습니다. AI가 단순한 도구가 아닌, 프로젝트의 자동화 동료가 되는 과정을 공유합니다. 발표…

#AI#LLM#Llama
원문