본문으로 건너뛰기

검색

"GPU" 검색 결과 10건

레드햇, 하이브리드 전반 확장형 프로덕션 AI 구현...엔비디아 통합 ‘AI 팩토리’ 공개
지티티코리아
지티티코리아

레드햇, 하이브리드 전반 확장형 프로덕션 AI 구현...엔비디아 통합 ‘AI 팩토리’ 공개

기술 배경 및 필요성 에이전틱 AI 애플리케이션 확산으로 기업의 AI 인프라 전략은 실험 단계를 넘어 전사적 프로덕션 환경으로 전환되고 있다. IDC에 따르면 2029년까지 엔터프라이즈 AI 지출은 1조 달러를 넘어설 것으로 전망된다. 이에 따라 기업은 고밀도 에이전틱 워크플로우와 대규모 추론 환경을 안정적으로 운영할 수 있는 통합 스택을 요구하고 있다.…

#AI#LLM#NVIDIA
원문
탈라스, 칩에다 모델 새겨 넣어 추론 속도 10배 향상한 기술 공개
AI타임스
AI타임스

탈라스, 칩에다 모델 새겨 넣어 추론 속도 10배 향상한 기술 공개

AI 모델을 전용 실리콘 칩으로 구현하는 플랫폼이 등장했다. 대형언어모델(LLM)과 같은 컴퓨팅 집약적인 애플리케이션의 처리 속도를 높이기 위해 최적화한 그로크의 추론 엔진 ‘언어 처리 장치(LPU)’와 유사하다.스타트업 탈라스는 최근 새로운 모델을 전달받으면 약 두달 만에 이를 맞춤형 반도체(ASIC)로 구현할 수 있는 플랫폼을 개발했다. 이렇게 탄생한…

#AI#LLM#GPU
원문
[오늘의 대학] 반도체 설계부터 뇌 회로 분석까지… ‘AI 주권’ 이끄는 대학의 힘(26.2.23)
newstheai
newstheai

[오늘의 대학] 반도체 설계부터 뇌 회로 분석까지… ‘AI 주권’ 이끄는 대학의 힘(26.2.23)

국내 대학 연구실이 인공지능(AI) 시대의 가장 본질적인 질문들에 답을 내놓고 있다. 더 적은 전력으로 더 많은 연산을 처리할 수 있는가. 값비싼 장비 없이도 사람의 시야를 재현할 수 있는가. 뇌 속 회로를 정밀하게 제어해 난치병 치료의 실마리를 찾을 수 있는가. 기초과학부터 응용기술, 인재 양성까지, 오늘도 연구실 불은 꺼지지 않았다.고려대와 성균관대는…

#AI#GPU#AI 반도체
원문
200밀리초의 벽을 지켜라…개발자를 위한 실시간 개인화 가이드
ITWorld 협업
ITWorld 협업

200밀리초의 벽을 지켜라…개발자를 위한 실시간 개인화 가이드

이커머스, 핀테크, 미디어 분야에서 동시성이 높은 애플리케이션을 구축하는 엔지니어에게 ‘200밀리초’는 넘으면 안 되는 상한선이다. 200밀리초는 사용자가 상호작용을 즉각적이라고 느끼는 심리적 임계값이다. 개인화된 홈페이지, 검색 결과, 다음 동영상 추천 목록 로딩이 200밀리초를 넘으면 사용자 이탈이 급증한다. 아마존의 유명한 연구에 따르면 지연 시간이…

#AI#LLM#GPU
원문
AI가 기술을 죽이고 있는가?
ITWorld 협업
ITWorld 협업

AI가 기술을 죽이고 있는가?

우리는 역사상 가장 거대한, 아니 최소한 가장 빠른 기술적 격변을 지나고 있다. AI 혁명은 복잡한 업무를 자동화해 생산성을 크게 끌어올리고, 의학·바이오테크·소재과학 분야의 과학적 돌파를 앞당기며, 의료와 교육 같은 핵심 산업에서 전문 지식에 대한 접근을 민주화하겠다고 약속한다. 최전선에 선 이들은 이미 반복 업무를 바이브 코딩으로 밀어내고 있다. 살아…

#AI#GPU#AGI
원문
엔비디아, 메타와 장기 파트너십 체결... 생성 AI 다음은 인프라 전쟁
newstheai
newstheai

엔비디아, 메타와 장기 파트너십 체결... 생성 AI 다음은 인프라 전쟁

엔비디아와 메타가 온프레미스와 클라우드를 아우르는 차세대 인공지능(AI) 인프라 구축을 위해 장기 전략적 파트너십을 체결했다.생성형 AI 경쟁이 모델 성능을 넘어 인프라 설계 역량으로 이동하는 가운데, 양사는 데이터센터 아키텍처 전반에 걸친 공동 설계를 통해 대규모 AI 워크로드에 최적화한 컴퓨팅 환경을 구축한다는 계획이다.메타는 자사의 중장기 AI…

#AI#GPU#데이터센터
원문
네이버 D2
Infra
네이버 D2

FE News 26년 1월 소식을 전해드립니다!

주요소식 다음과 같은 유용한 정보들을 만나보실 수 있습니다. RSC Explorer - React Server Components 시각화 도구 Dan Abramov가 React Server Components(RSC) 프로토콜을 시각화하는 도구를 공개했다. 브라우저에서 RSC 스트림을 단계별로 재생하고 분해할 수 있으며,…

#AI#GPU#AGI
원문
네이버 D2
Infra
네이버 D2

비용, 성능, 안정성을 목표로 한 지능형 로그 파이프라인 도입

Logiss는 AIDA(Advanced Interface for Data & AI)라는 네이버 사내 통합 데이터 플랫폼의 일부로, 로그 수집과 실시간 검색을 통해 문제를 추적하고 데이터를 분석하도록 지원합니다. 또한 Cuve와 CQuery라는 대용량 데이터 저장소 및 분석 설루션과 데이터를 연동합니다. 이 글에서는 로그 파이프라인을 운영하면서 겪은 문제점과…

#AI#GPU
원문
네이버 D2
Infra
네이버 D2

웹툰 창작 생태계 보호를 위한 연구

네이버 웹툰은 웹툰, 웹소설 등 다양한 창작물을 독자에게 제공하는 플랫폼을 구축하고, 이를 통해 창작자가 전 세계 독자와 만나 소통하며 안정적인 수익을 바탕으로 창작 활동에 온전히 집중할 수 있는 환경을 만들기 위해 노력하고 있습니다. 특히 하나의 스토리를 다양한 IP(intellectual property)로 확장해 글로벌 시장의 규모를 지속적으로 키우고…

#AI#GPU#Stable Diffusion
원문