내부 토론을 시뮬레이션하는 AI 모델이 복잡한 작업에서 정확도를 크게 향상시킨다
Google의 새로운 연구에 따르면, 고급 추론 모델은 다양한 관점을 포함한 다중 에이전트와 유사한 토론을 시뮬레이션함으로써 높은 성능을 달성한다.
Google의 새로운 연구에 따르면, 고급 추론 모델은 다양한 관점을 포함한 다중 에이전트와 유사한 토론을 시뮬레이션함으로써 높은 성능을 달성한다.
현실 세계의 최적화 문제는 비용이 많이 드는 평가 문제와 복잡한 제약조건 등 최적화 알고리즘에 상당한 도전을 제시합니다.
대규모 언어 모델의 급속한 성장으로 인해 조직들은 종종 여러 공급업체의 GPU를 사용하여 GPU 클러스터를 확장하고 있습니다. 그러나 현재의 딥…
Dynamic Optimization Problems (DOPs)는 복잡한 특성, 즉 동적 환경 변화 때문에 해결하기 어렵습니다. Evolutionary Computation 방법…
다당사자 다목적 최적화 문제에서는 솔루션 집합을 일반적으로 클래식 성능 지표를 사용하여 평가하고, 의사결정자(DM)들에 걸쳐 집계합니다. 그러나, ...
Data 및 pipeline parallelism은 분산 장치에서 신경망 훈련을 확장하기 위한 핵심 전략이지만, 높은 통신 비용 때문에 ...
대규모 언어 모델(LLM) 서빙 시스템은 근본적으로 취약한 상태를 유지하고 있으며, 하이퍼스케일 클러스터에서 빈번한 하드웨어 결함이 서비스에 불균형적인 영향을 초래합니다...
Multi-stage ML inference pipelines는 이기종 리소스, 단계 간 결합, 그리고 동적 병목 현상 마이그레이션 때문에 자동 확장이 어렵습니다. 우리는 제시합니다…
증명 가능한 올바른 분산 프로토콜은 현대 분산 시스템의 핵심 구성 요소이며, 설계가 매우 어렵고 종종 d...
거래가 성사되면, 이는 Amazon이 AI 우위 경쟁에서 경쟁 스타트업들을 지원하고 있다는 의미가 된다....
Microsoft가 데이터 센터에 수십억 달러를 투자하고, 아무도 AI를 사용하지 않는다라는 소문이 돌고 있는 상황에서, CEO인 Satya Nadella가 몇몇 사용량 수치를 공유했습니다....
Genie 3는 “general-purpose world model”로, 다양한 인터랙티브 환경을 생성할 수 있다. 구글은 이제 미국의 AI Ultra 구독자들에게 접근을 허용한다.
Gradient-free black-box optimization (BBO)은 엔지니어링 설계에서 널리 사용되며, 토폴로지 최적화 (TO)를 위한 유연한 프레임워크를 제공하여 d...
인스타그램과 페이스북 전반에 걸쳐, AI‑generated 비디오가 유색인종이 ICE 요원을 제압하는 모습을 보여준다. 이것이 카타르시스적인가, 아니면 단지 잘못된 정보의 혼합에 더해지는 것인가?
세계 최대 기업들이 수천억 달러를 large language models에 투자하고 있는 가운데, 샌프란시스코에 기반을 둔 Logical Intelligence는 뭔가 다른 것을 시도하고 있습니다.
사이버 보안 운영은 민감한 데이터를 노출하지 않으면서 다양한 워크플로를 지원하는 어시스턴트 LLM을 필요로 합니다. 기존 솔루션은 독점 API에 의존하거나…
현대 diffusion/flow 기반 이미지 생성 모델은 일반적으로 두 가지 핵심 특성을 보인다: (i) 다단계 샘플링을 사용하고, (ii) 잠재…
공개 저장소에는 수백만 개의 fine-tuned models가 호스팅되고 있지만, 커뮤니티 사용은 여전히 소수의 foundation checkpoints에 불균형적으로 집중되어 있습니다....
Agentic Reinforcement Learning (Agentic RL)은 에이전트가 복잡한 추론과 도구 사용을 수행하도록 하는 데 눈에 띄는 성공을 거두었습니다. 그러나 대부분의 방법은 아직...
우리는 UEval이라는 벤치마크를 도입합니다. 이는 이미지와 텍스트를 모두 생성할 수 있는 통합 모델을 평가하기 위한 것입니다. UEval은 1,000개의 전문가가 선정한 질문으로 구성됩니다.
동적 객체를 조작하는 것은 Vision-Language-Action (VLA) 모델에게 여전히 해결되지 않은 과제이며, 정적 조작에서 강력한 일반화 능력을 보임에도 불구하고, str...
Neural networks는 일반적으로 그래픽 처리 장치(GPUs) 대신 중앙 처리 장치(CPUs)를 사용하는 다양한 자원 제한 엣지 디바이스에 성공적으로 적용되었습니다.
대형 비전-언어 모델(VLMs)은 원본 이미지에서 고전적인 시각 착시 현상에 대해 ‘정확하게’ 답변하는 경우가 많지만, 착시 현상의 사실이...
대규모 언어 모델(LLMs)과 강화 학습(RL)으로 구동되는 자율 웹 에이전트의 개발은 일반…
제한된 감독 학습 데이터 때문에, 대규모 언어 모델(LLMs)은 일반적으로 자체 감독 “다음 단어 예측” 목표를 사용하여 vas...
Audio-Visual Foundation Models는 사운드와 시각 콘텐츠를 공동으로 생성하도록 사전 학습된 모델로, 최근 다중‑...
프루닝에서, Lottery Ticket Hypothesis는 큰 네트워크가 희소 서브네트워크, 즉 winning tickets를 포함하고 있으며, 이들은 별도로 훈련되어 t...와 일치하도록 할 수 있다고 제시한다.
추론 지향 대형 언어 모델(LLMs)은 Chain-of-Thought (CoT) 프롬프트를 통해 눈부신 진전을 이루었지만, 여전히 근본적인 한계가 있다.
행렬 함수인 제곱근, 역제곱근, 그리고 직교화는 신경망 훈련을 위한 사전조건화된 gradient methods에서 핵심적인 역할을 합니다.
기존 에이전트 안전 벤치마크는 binary accuracy를 보고하며, early intervention과 post-mortem analysis를 혼동합니다. step 8에서 violation을 표시하는 detector는 …
Full-image relighting은 대규모 구조화된 paired data를 수집하기 어려운 점과 물리적 … 때문에 여전히 도전적인 문제로 남아 있다.
Pancreatic ductal adenocarcinoma (PDAC), 가장 치명적인 고형 악성 종양 중 하나로, 종종 늦은 단계에서 수술이 불가능한 상태로 발견됩니다. 선행 연구들의 회고적 검토는 …
대형 언어 모델(LLMs)은 복잡한 추론 작업에서 최첨단(state-of-the-art) 성능을 제공하지만, 추론(inference) 비용 때문에 대규모 배포가 제한됩니다. 작은 언어…
Multi-objective optimization은 경쟁하는 목표들을 가진 문제들을 해결하는 것을 목표로 하며, 종종 문제에 대한 black-box 접근만 가능하고 제한된 측정 예산을 가지고 있다.
Test-time scaling은 소프트웨어 엔지니어링(SWE) 작업에서 Large Language Model(LLM) 에이전트의 능력을 향상시키기 위해 널리 채택되었습니다. 그러나, the sta...
현재 generative video models는 text and image prompts로부터 새로운 콘텐츠를 생성하는 데 뛰어나지만, 기존 pre-recorded videos를 편집하는 데 중요한 격차를 남겨두고 있습니다, ...
Creative image generation은 새로운 고품질 이미지를 생산하고 경계를 확장하려는 필요에 의해 주도되는 매력적인 연구 분야로 부상했습니다.
대형 언어 모델(LLMs)은 질문 응답 및 진단을 포함한 의료 벤치마크에서 강력한 성능을 입증했습니다. 임상에서의 활용을 가능하게 하기 위해…
Quantization은 대규모 언어 모델(Large Language Model, LLM) 훈련의 연산(compute) 및 메모리 효율성을 크게 향상시켰습니다. 그러나 기존 접근 방식은 여전히 acc…
에너지는 이제 중요한 ML 컴퓨팅 자원입니다. 에너지 소비를 측정하고 추세를 관찰하는 것이 귀중한 첫 번째 단계이지만, 정확하게 이해하고 …
high-performance optical lenses를 설계하는 것은 surface curvatures, glass choices, element thickness 등과 같은 고차원이며 엄격히 제한된 공간을 탐색하는 것을 포함합니다…
Mercedes‑Benz S‑Class – AI‑Ready Luxury 140년 혁신 Mercedes‑Benz는 AI에 최적화된 새로운 S‑Class와 함께 자동차 혁신 140년을 기념합니다.
대규모 언어 모델(Large Language Model, LLM) 애플리케이션을 평가하는 것은 전통적인 소프트웨어 테스트와 다릅니다. 왜냐하면 출력이 stochastic하고, high-dimensional하며, 민감하기 때문입니다.
AI 에이전트 추론은 추론 중심의 데이터센터 미래를 주도하고 있으며, 컴퓨팅을 넘어 메모리 용량, 메모리 대역폭 및 hig...
현대 소프트웨어 아키텍처는 적응형이고 확률적이며 상황에 의존적인 추론을 하는 자율 에이전트를 지원하는 데 어려움을 겪으며, 시스템 통합…
편집자 주: 이 게시물은 Into the Omniverse https://www.nvidia.com/en-us/omniverse/news/ 시리즈의 일부이며, 개발자, 3D 실무자 및 …
기업 AI(enterprise AI) 프로젝트의 성공적인 구현 및 확장은 근본적으로 사람과 운영 모델(operating model) 과제이며, 단순히 기술 문제만은 아닙니다....
최근 연구에서는 Multi-Agent Reinforcement Learning (MARL)을 통해 LLM 협업을 최적화하는 방법을 탐구했습니다. 그러나 대부분의 MARL 파인튜닝 접근 방식은 사전...