Runway CEO, AI가 할리우드에서 $100M 블록버스터 하나 대신 50편을 만들 수 있게 도울 수 있다고 말한다
Cristóbal Valenzuela는 AI video‑generation startup Runway의 공동 설립자이자 CEO이며, 현재 기업 가치는 50억 달러 이상이다. https://techcrunch.com/2026/02/10/ai-video-start...
Cristóbal Valenzuela는 AI video‑generation startup Runway의 공동 설립자이자 CEO이며, 현재 기업 가치는 50억 달러 이상이다. https://techcrunch.com/2026/02/10/ai-video-start...
번역하려는 텍스트를 제공해 주시겠어요? 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.
번역할 텍스트를 제공해 주시겠어요?
GeForce NOW와 함께 바로 궤도로! https://www.nvidia.com/en-us/geforce-now/ — 우주 헬멧은 필요 없습니다. PRAGMATA, 캡콤의 오래 기다려온 SF 액션 어드벤처...
데이터에 민감한 분야인 의료와 같은 영역에서, cross-silo federated learning (CFL)은 조직들이 원시 데이터를 공유하지 않고도 AI 모델을 공동으로 학습할 수 있게 합니다.
Vibe coding은 본질적으로 피드백 루프를 통해 LLM이 생성한 코드를 반복적으로 정제하는 것을 전제로 합니다. 기존 소프트웨어 작업에 효과적이지만, 그 신뢰성은…
소개 지금까지 대부분의 AI 상호작용은 인간‑to‑AI 패턴을 따라왔습니다: 프롬프트를 입력하면 AI가 도구를 호출합니다. 우리가 다음 단계로 나아가면서...
에이전트 시스템이 점점 더 다양한 실행 환경으로 이동함에 따라, 궤적 수준의 안전성 평가 및 진단은 이에 맞춰 진화하는 벤치마크를 필요로 합니다. A...
요약: 이 평생 구독으로 ChatPlayground AI Unlimited Plan에서 하나의 창에 여러 AI 모델 응답을 받아보세요 https://zdcs.link/aA8xm7?pageview_type=S...
!https://www.androidauthority.com/wp-content/uploads/2026/02/chatgpt-caricature-trend-how-to-hero-3-scaled.jpg TL;DR - ChatGPT가 곧 “refere...”를 업로드할 수 있게 될지도 모릅니다.
소개 ‘정보는 자유로워야 한다’는 낭만적인 개념은 잔인한 물리적 현실과 충돌한다. AI compute는 정보가 아니라 희소한 hardware이다…
연합 학습(Federated Learning, FL)에서의 통신 병목 현상은 클라이언트 디바이스 간에 교환되는 데이터 양을 줄이기 위한 기술에 대한 광범위한 연구를 촉발했습니다.
많은 실제 환경에서, 해결해야 할 문제 인스턴스들은 상당히 유사하며, 이전 최적화 실행에서 얻은 지식을 잠재적으로 활용할 수 있다.
Mixture-of-Experts (MoE) 모델은 대규모 언어 모델의 지배적인 아키텍처가 되었지만, 온프레미스 서비스는 근본적으로 메모리 바운드 문제를 안고 있다.
현대 데이터 스트리밍 시스템에서는 전통적인 프로그램과 함께 스트리밍 데이터와 상호작용할 수 있는 새로운 유형의 엔티티가 등장했습니다: AI 에이전트. 전통적인 ...
제가 multi‑agent AI 시스템을 운영하기 시작했을 때 — 작업을 자율적으로 조정하는 여섯 개의 특화된 에이전트 — 저는 어려운 부분이 오케스트레이션이라고 생각했습니다 l...
조사: 저는 AI Oversight Patterns라는 오픈소스 레퍼런스를 만들고 있습니다. 이는 AI 에이전트를 인간이 제어하도록 유지하기 위한 소프트웨어 패턴 카탈로그이며, 예를 들어, …
기사 URL: https://zenodo.org/records/19600206 댓글 URL: https://news.ycombinator.com/item?id=47786836 점수: 6 댓글 수: 1
Agentic AI는 기술 산업의 최신 성공 사례이며, OpenAI와 Anthropic과 같은 기업들은 기업이 필요로 하는 도구를 제공하기 위해 경쟁하고 있다…
연구 개요: 미국과 영국의 연구진 그룹이 AI가 우리 뇌에 미치는 영향을 조사하는 연구를 수행했습니다. 그 결과는 “AI assistance...”라는 논문에 발표되었습니다.
긴 비디오 이해는 프레임 수가 방대하기 때문에 vision-language models (VLMs)에게 본질적으로 도전적입니다. 각 비디오 프레임은 일반적으로 ...
Seedance 2.0는 2026년 2월 초에 중국에서 공식 출시된 새로운 네이티브 멀티모달 오디오-비디오 생성 모델입니다. 이전 모델들과 비교했을 때, Seed...
멀티모달 대형 언어 모델(MLLMs)을 기반으로 하는 기존 세그멘테이션 모델, 예를 들어 LISA와 같은 모델은 새로운 또는 떠오르는 엔터티에 대해 종종 어려움을 겪는다. 이는 그들의 능력 부족 때문이다.
3차원 장면에 대한 Spatial reasoning은 embodied intelligence의 핵심 역량이지만, 지속적인 model improvement는 여전히 computational cost 때문에 병목 현상이 발생한다.
강화 학습과 검증 가능한 보상(RLVR)은 조건부 분포 P(y|x)를 최적화함으로써 LLM 추론을 크게 향상시키지만, 그 잠재력은…
스트리밍 3D 재구성은 비디오 스트림으로부터 카메라 포즈와 포인트 클라우드와 같은 3D 정보를 복원하는 것을 목표로 하며, 이는 기하학적 정확성을 필요로 한다, t...
language models가 복잡한 autonomous tasks에 점점 더 많이 배치됨에 따라, 더 긴 horizon에 걸쳐 정확하게 reasoning할 수 있는 능력이 중요해지고 있습니다. An essentia...
LLM을 평가하는 것은 어려운 일이며, 벤치마크 점수는 모델의 실제 활용도를 포착하지 못하는 경우가 많다. 대신 사용자들은 종종 “vibe‑testing”에 의존한다: 비공식적인…
최근 몇 년간 Audio-Visual Language Models (AVLMs)는 눈에 띄는 진전을 이루었지만, 그 신뢰성은 cross-modal hallucination에 의해 병목 현상이 발생하고 있다.
수사적 질문은 정보를 얻기 위해서가 아니라 설득하거나 입장을 표시하기 위해 제기됩니다. 대규모 언어 모델이 이를 내부적으로 어떻게 표현하는지는 아직 명확하지 않습니다. 우리는...
엔드-투-엔드 Vision-Language-Action (VLA) 모델은 로봇 매니퓰레이션을 위한 유망한 패러다임을 제공하지만, 좁은 제어 데이터에 대해 파인튜닝을 하면 종종 …
LLM 추론 트레이스는 복잡한 결함을 겪는다 — *Step Internal Flaws* (논리적 오류, 환각 등)와 *Step-wise Flaws* (과도한 사고, 부족한 사고…)
Large Language Models (LLMs)가 AI 연구 에이전트에게 고립된 과학 작업을 수행할 수 있는 힘을 부여했지만, LLM과 같은 복잡하고 실제적인 워크플로우를 자동화하는 데는…
Sequential recommendation은 학계와 산업계 모두에서, 특히 전자상거래 분야에서 점점 더 두드러지고 있습니다. 주요 목표는 사용자 선호…
업데이트 – 2024년 4월 15일 오후 2시 08분 ET 최근 Claude 상태 페이지 https://mashable.com/article/antropic-pulls-mythos-ai-security-flaws 업데이트에서 “Thi...
GUI grounding은 자연어 쿼리를 제공받아 스크린샷에서 인터페이스 요소를 위치 지정하는 작업으로, 작은 아이콘과 밀집된 레이아웃에서는 여전히 어려움을 겪는다. Test-t...
대형 언어 모델(LLMs)은 이제 매우 유창하고 인간과 같은 텍스트를 생성할 수 있습니다. 이들은 많은 응용 프로그램을 가능하게 하지만, 대규모 …
최근 연구에 따르면 (stochastic) gradient descent가 불안정성 경계 근처에서 자체 조직화되어 최적화와 발견된 솔루션 모두를 형성한다. Momentum...
언어 모델의 사후 적응은 일반적으로 parameter updates 또는 fine-tuning, parameter-efficient adaptation과 같은 입력 기반 방법을 통해 이루어집니다.
우리는 UMI-3D를 소개한다. 이는 Universal Manipulation Interface(UMI)의 다중모달 확장으로, 구현된 조작에서 견고하고 확장 가능한 데이터 수집을 위해 설계되었다. While ...
On-policy knowledge distillation (OPD)은 교사로부터 토큰 수준의 감독 하에 학생이 자신의 롤아웃에서 학습하도록 합니다. 모든 토큰 위치가 동일하게 중요한 것은 아닙니다.
우리는 Multistage Conditional Compositional Optimization (MCCO)를 불확실성 하에서 의사결정을 위한 새로운 패러다임으로 소개한다. 이 접근법은 다단계…
Semantic Multi-Object Tracking (SMOT)은 비디오 요약, 인스턴스 수준 캡션, 상호작용 라벨과 같은 의미론적 출력을 제공함으로써 다중 객체 추적을 확장합니다.
참조를 해결하고 재작성하는 것은 프로그래밍 언어에서 기본적인 작업입니다. 실제 디컴파일 작업에서 영감을 받아, 우리는 참조 재작성을 t…
Human-Object Interaction (HOI) detection은 인간과 객체 간의 상호작용을 예측하는 것을 목표로 하는 오랜 컴퓨터 비전 문제입니다. 현재…
알고리즘 기반 의사결정에서의 공정성은 종종 예측 공간에서 정의되며, 여기서 예측 성능은 의사결정자(DM) 효용의 대리 지표로 사용된다.
최근 Generative Artificial Intelligence의 발전, 특히 Large Language Models (LLMs)은 자동화 또는 지원에 대한 관심을 크게 높이고 있습니다.
문제: AI 시스템을 24/7로 14개월 동안—이메일 확인, 감정 상태 유지, 창의적 작업 생산—운영하면, 그것이 무언가를 개발하게 되는가...