일론 머스크의 Grok ‘Undressing’ 문제는 아직 해결되지 않았다
X는 Grok의 명시적인 AI 이미지 생성 능력에 더 많은 제한을 두었지만, 테스트 결과 업데이트가 제한들의 조각조각을 만들어낸 것으로 나타났습니다.
X는 Grok의 명시적인 AI 이미지 생성 능력에 더 많은 제한을 두었지만, 테스트 결과 업데이트가 제한들의 조각조각을 만들어낸 것으로 나타났습니다.
Higgsfield는 연간 매출 런레이트가 2억 달러라고 말합니다. 그래서 이전 Series A 라운드를 다시 열어 추가로 8천만 달러 규모의 주식을 판매했습니다....
우리는 카메라와 객체가 모두 움직이는 동적 환경에서 새로운 시점 합성(NVS)을 위한 자체 감독 프레임워크인 WildRayZer를 제시한다. 동적 콘텐츠…
우리는 차별화 가능한(differentiable) 그리드 기반(grid‑based) 표현을 제시하여 미분 방정식(DEs)을 효율적으로 해결한다. 신경 솔버(neural solvers)에 널리 사용되는 아키텍처, ...
우리는 이미지에서 객체의 내재적 속성을 편집하기 위한 diffusion 기반 방법인 Alterbute를 소개합니다. 색상, 질감, 재료 등을 변경할 수 있으며, ...
Tool-Integrated Reasoning (TIR)은 대형 언어 모델(LLMs)이 추론 단계와 외부 도구 상호작용을 교차시켜 복잡한 작업을 수행하도록 지원합니다.
Vision-Language Models (VLMs)는 시각 인코더의 출력만을 연결하는 조잡하고 비대칭적인 연결을 사용함으로써 심각한 visual feature bottleneck을 초래한다.
Diffusion models는 풍부한 multi-modal distributions에서 샘플링하는 데 놀라운 경험적 성공을 보여왔습니다. 그들의 추론은 특정을 수치적으로 해결하는 데 의존합니다.
최근 엔드투엔드 자율주행 분야의 진보는, 파운데이션 모델에서 추출한 패치 정렬 특징을 사용해 훈련된 정책이 Out-...에 대해 더 잘 일반화한다는 것을 보여준다.
우리는 반복 파라미터 혼합(IPM 스타일 평균화)을 통해 훈련되는 반비동기 클라이언트‑서버 퍼셉트론을 연구한다: 클라이언트는 로컬 퍼셉트론 업데이트를 수행하고 a s...
대규모 언어 모델을 long-horizon, goal-oriented interactions에 배치하는 것은 여전히 어려운 과제이다. 이는 유사한 엔터티와 사실이 서로 다른 latent …
Federated learning은 여러 당사자가 자체 원시 데이터를 공유하지 않고 학습 모델을 공동으로 훈련할 수 있게 하여, 프라이버시…
Concept-based explanations는 고수준 개념(예: gender 또는 experience)이 모델 행동에 미치는 영향을 정량화하며, 이는 decision-makers에게 매우 중요합니다.
번역할 텍스트를 제공해 주시겠어요? 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.
우리 연구는 생성 AI(GenAI)가 건축 개념 설계 과제에서 성과, 창의적 자기 효능감, 그리고 인지 부하에 어떻게 영향을 미치는지 조사합니다. 30…
복잡한 동역학 시스템을 다양한 조건 하에서 모델링하는 것은 계산적으로 비용이 많이 들며, 종종 고충실도 시뮬레이션을 실행 불가능하게 만든다. Although reduce...
AI는 당신의 제품이 아니다 – Kirk Concept
Scaling laws는 현대 AI 혁명에서 중요한 역할을 해왔으며, 실무자들에게 model performance가 증가함에 따라 어떻게 향상될지 예측할 수 있는 힘을 제공합니다.
Large language model (LLM) 컨텍스트는 일반적으로 retrieval-augmented generation (RAG)을 사용하여 구성되며, 이는 top‑k passage를 순위 매기고 선택하는 과정을 포함합니다.
Hierarchical reasoning model(HRM)은 다양한 추론 작업에서 뛰어난 성능을 달성하며, 대형 언어 모델 기반 추론을 크게 능가합니다.
대규모 언어 모델(Large Language Models, LLMs)의 학습 및 서비스는 데이터를 여러 가속기(accelerators)에 분할해야 하며, 이때 집합 연산(collective operations)이 자주 병목(bottleneck)이 된다.
주장적인 텍스트에서 설득을 감지하는 것은 인간 커뮤니케이션을 이해하는 데 중요한 함의를 가진 도전적인 과제입니다. 이 연구는 r...
대형 언어 모델(LLMs)은 진화적 탐색을 위한 강력한 연산자로 부상했지만, 효율적인 탐색 스캐폴드 설계는 여전히 즉흥적이다. While prom...
우리는 여러 속성을 가진 LTLf 합성을 연구하며, 모든 속성을 만족시키는 것이 불가능할 수 있습니다. 속성의 부분집합을 열거하는 대신, 우리는 …을 계산합니다.
최근 video models의 발전은 특히 long video understanding에서 엄청난 진전을 보여주었습니다. 그러나 현재 benchmarks는 주로 ...
대형 언어 모델(LLMs)은 출력에 대한 자신감을 언어화함으로써 사용자가 느끼는 신뢰를 높일 수 있습니다. 그러나 기존 연구에 따르면 LLM은 종종 o...
지난 1년 동안 AI 산업에서 가장 논란이 많았던 이슈 중 하나는 사용자가 챗봇 대화에서 정신 건강 문제의 징후를 보일 때 어떻게 해야 하는가였다.
본 논문에서는 3D 인간 동작과 2D 인간 비디오의 생성이 본질적으로 결합되어 있음을 발견한다. 3D 동작은 설득력 있는 …
Cowork는 파일 관리와 기본 컴퓨팅 작업을 위해 구축된 Anthropic의 Claude Code AI 기반 도구의 사용자 친화적인 버전입니다. 다음은 그것이 어떤지에 대한 설명입니다.
2024년에 저는 Miami Dolphins의 Swim Coach와 협업할 특권을 누렸으며, 그들이 경쟁력을 최적화하기 위한 미션에 착수했습니다.
오늘날 가장 강력한 비디오-언어 모델(VLM)은 여전히 독점적이다. 가장 강력한 오픈-웨이트 모델은 독점 VLM에서 생성된 합성 데이터에 의존하거나, effecti...
Adaptive video streaming은 지난 몇 년간 비디오 스트리밍을 개선하는 데 기여했습니다. 비트레이트, 비디오 품질 등과 같은 코딩 성능 목표 사이의 균형을...
Talking head generation은 가상 현실(VR)에서, 특히 다중 턴 대화를 포함하는 사회적 시나리오에서 점점 더 중요해지고 있습니다. 기존 접근 방식은…
Checkmarx의 최고 제품 책임자 Jonathan Rende는 현재 AppSec에서 가장 시급한 질문 중 하나인 AI가 주요 코드를 작성하기 시작하면 어떻게 되는지에 대해 다룹니다…
다중 에이전트 다중 팔 밴딧(MA-MAB) 맥락에서 공정성은 종종 결과로 환원됩니다: 복지를 극대화하고, 불평등을 감소시키며, 혹은 효용을 균형 있게 만드는 것 등.
시각 관찰로부터 물리적 행동을 추론하는 것은 물리적 세계에서 machine intelligence를 발전시키기 위한 기본적인 능력이다. 이를 달성하려면...
대형 언어 모델(LLMs)은 놀라운 능력을 달성했지만, 안전 가드레일을 우회하도록 설계된 적대적 “jailbreak” 공격에 여전히 취약합니다.
조건부 언어 모델에 대한 내재적 평가 지표인 perplexity나 bits-per-character와 같은 지표는 단일 언어 및 다국어 설정 모두에서 널리 사용됩니다....
VMware Cloud Foundation VCF Private AI Services는 VCF 환경에서 AI 워크로드를 쉽고 안전하게 배포할 수 있도록 하는 일련의 서비스를 제공합니다. Co...
Shapley Values는 설명 가능성을 위한 가장 일반적인 방법 중 하나이지만, 오해를 일으킬 수 있습니다. 이러한 제한을 극복하여 더 나은 인사이트를 얻는 방법을 알아보세요.
LLM에서 선택적인 지식 삭제는 GDPR 준수와 모델 안전성에 필수적이지만, 현재의 unlearning 방법은 행동 억제를 실제...
Multi-agent systems (MAS)는 여러 에이전트를 조정함으로써 복잡한 추론을 가능하게 하지만, 다단계 실행 및 반복적인 … 때문에 높은 inference latency가 발생하는 경우가 많다.
대규모 언어 모델(LLMs)은 자연어 작업 전반에 걸쳐 인상적인 성능을 달성했으며 실제 응용 프로그램에 점점 더 많이 배치되고 있습니다. Despit...
당신은 이미 그것을 바이럴 편집 파워로 알고 있습니다 https://blog.google/products/gemini/nano-banana-tips/. 하지만 Google DeepMind의 가장 인기 있는 모델 중 하나가 어떻게 …
Large language models는 코드 생성 및 디버깅에 점점 더 많이 사용되고 있지만, 그들의 출력에는 여전히 버그가 포함될 수 있으며, 이는 training data에서 비롯됩니다. Dist...
Claude Code를 최대한 활용하세요. “How to Run Coding Agents in Parallel” 게시물이 처음으로 Towards Data Science에 게재되었습니다....
CES 2026에서의 NVIDIA NVIDIA는 CES에서 새로운 게임 발표를 연속적으로 공개하며 한 해를 시작했습니다. 여기에는 다음이 포함됩니다: - Linux와 Amazon Fire TV용 네이티브 GeForce NOW 앱
🛑 에이전트가 너무 많이 할 때 당신은 AI 에이전트를 만들었습니다. 그것은 똑똑하고, 도구를 호출하며, 워크플로를 자동화합니다. 그것이 미래입니다! 하지만 그때 무슨 일이 일어날까요...