펜타곤, Anthropic을 공급망 위험으로 공식 지정
배경: 펜타곤은 Anthropic을 공급망 위험으로 공식 지정했으며, 연방 기관 및 방위 계약업체에 해당 AI 도구 사용을 중단하도록 명령했습니다.
배경: 펜타곤은 Anthropic을 공급망 위험으로 공식 지정했으며, 연방 기관 및 방위 계약업체에 해당 AI 도구 사용을 중단하도록 명령했습니다.
고품질 3D 스트리밍은 다중 카메라에서 제공되며, 많은 AR/VR 애플리케이션에서 몰입형 경험을 위해 필수적입니다. 제한된 뷰 수는 종종 실제…
스케일링 imitation learning은 근본적으로 데이터 수집 효율성에 의해 제한됩니다. handheld interfaces가 확장 가능한 솔루션으로 부상했지만 …
대규모 언어 모델(LLM)의 효율적이고 안정적인 학습은 현대 머신러닝 시스템에서 여전히 핵심 과제입니다. 이 과제를 해결하기 위해 Reparamete...
우리는 Transformer 언어 모델에서 두 가지 반복적으로 나타나는 현상을 연구한다: 소수의 토큰이 몇몇 채널에서 극단적인 이상값을 보이는 대규모 활성화, ...
우리는 reasoning models에서 performative chain-of-thought (CoT)의 증거를 제공하며, 모델이 최종 답변에 대해 강하게 확신하지만 계속해서 …
AI 모델이 단순한 챗봇을 넘어 보다 복잡한 워크플로우로 발전함에 따라, 우리는 AI 시스템이 활용될 event horizon에 점점 더 가까워지고 있습니다...
비디오 이해를 위한 데이터셋이 시간 단위의 길이까지 확장되었지만, 이들은 일반적으로 자연스럽고 즉흥적인(unscripted) 상황과는 다른, 촘촘히 연결된 클립들로 구성됩니다.
우측 검열된 생존 데이터에서 이질적인 치료 효과(HTEs)를 추정하는 것은 정밀 의학 및 개인 맞춤 치료와 같은 고위험 응용 분야에서 매우 중요합니다.
특이한 통계 모델(혼합 모델, 행렬 분해, 신경망 포함)은 파라미터 비식별성 및 d... 때문에 정규 비대칭성을 위반한다.
하이퍼스펙트럴 이미지(HSI)는 환경 모니터링부터 국가 안보에 이르기까지 다양한 분야에 활용되며, 물질 탐지 및 식별에 사용할 수 있습니다.
현재 video generation models는 forces와 robotic manipulations와 같은 3D 행동의 물리적 결과를 시뮬레이션할 수 없으며, 구조적 이해가 부족하기 때문입니다.
AI 디자인 피드백 뒤에 있는 스크립트 아마도 이 피드백을 들어보셨을 겁니다: - “계층 구조가 명확합니다.” - “시각적 리듬이 일관됩니다.” 아마도 이것까지도…
모두가 2 TB와 Gemini 접근을 언급하지만, 그건 단지 박스 📦일 뿐이다. 진정한 가치는 조용히 열어주는 워크플로에 있다—어디를 봐야 할지 안다면. 진정한…
개요 Google의 NotebookLM AI‑based 도구는 이제 연구와 메모를 완전한 애니메이션 “cinematic” 비디오로 전환할 수 있습니다 – 이는 원래 비디오에 비해 발전된 기능입니다.
소프트웨어 리포지토리를 구축하는 데는 일반적으로 상당한 수동 작업이 필요합니다. 최근 대형 언어 모델(LLM) 에이전트의 발전으로 자동화가 가속화되었습니다...
TL;DR - 구글은 Gemini 이미지 생성 기능을 확장하고 있으며, 디즈니와 협력하고 OpenAI와 경쟁하고 있습니다.
Naive Memory의 문제 하지만 아무도 말하지 않는 것이 있습니다: Naive Memory는 비용이 많이 듭니다. 그리고 단지 금전적인 비용만이 아니라. 에이전트에게 거대한 context window를 제공하면…
번역할 텍스트를 제공해 주세요.
구글을 상대로 한 Gemini AI 챗봇에 대한 소송이 제기됨: 수요일, 캘리포니아 연방 법원 원고: 조나단 가발라스(36세) 가족 주장 - 조나단 G...
Soulkiller in Code: AI 동면 트릭, MoE를 물 위에 떠오르게 함. AI가 그냥… 잠들기를 원했나요? 시뮬레이션된 잠이 아니라 실제 인지…
Anthropic와 같은 기업들이 AI의 군사적 사용에 대한 제한을 논의하는 동안, Smack Technologies는 전장 작전을 계획하기 위해 모델을 훈련하고 있습니다....
코드 생성은 AI의 가장 큰 영향력을 가진 사용 사례 중 하나로 떠올랐지만, 기존 벤치마크는 전체 ‘zero-to-one’ 프로세스가 아니라 개별 작업만을 측정합니다.
릴리스 개요 2월 초에 OpenAI는 Codex 코딩 앱을 업그레이드하여 다중 AI 에이전트를 관리할 수 있는 기능을 부여하고 독립형 m...
인간 동작 예측은 trajectory forecasting와 human pose prediction 작업을 결합합니다. 두 작업 각각에 대해, 특화된 models가 개발되었습니다.
optical transients의 발견 속도는 Vera C. Rubin Observatory의 Legacy Survey of Space and Time이 시작되면 밤당 1천만 개의 public alerts로 폭발적으로 증가할 것입니다.
피드포워드 트랜스포머 모델은 3D 비전에서 급속한 발전을 이끌었지만, VGGT 및 π³와 같은 최첨단 방법은 계산 비용이 규모에 따라 증가합니다.
YouTube는 크리에이터들이 affiliate marketing을 통해 영향력을 수익화하는 강력한 플랫폼으로 진화했으며, 투명성 및 e...
전통적인 vision-language 모델은 대비적인 세밀한 분류학적 추론에 어려움을 겪으며, 특히 시각적으로 유사한 종을 구별할 때 그렇다.
Large Language Models (LLMs)이 자율적인 다중 에이전트 생태계로 전환함에 따라, 견고한 minimax 훈련이 필수적이지만 여전히 불안정성에 취약합니다 wh...
Generative audio는 세밀한 제어 가능한 출력을 필요로 하지만, 대부분의 기존 방법은 특정 제어나 inference-time controls를 위해 모델 재학습이 필요합니다 ...
Unscented Kalman Filter (UKF)는 비선형 상태 추정을 위한 널리 사용되는 도구이지만, 그 성능은 정적 파라미터화에 의해 제한됩니다…
개요: AI 에이전트는 강력하지만 처음에는 일반적입니다. 그들은 많은 일반 정보를 알고 있지만, 귀하의 도메인‑특화 지식, 선호도 등을 결여하고 있습니다…
최근 로봇 학습의 최근 발전은 인간 환경에서 일상적인 작업을 수행할 수 있는 일반 로봇(generalist robots)으로의 진전을 가속화했습니다. 그러나 여전히 diffi...
병리 보고서 생성은 주로 gigapixel 규모와 복잡한 형태학적 이질성 때문에 비교적 탐구가 부족한 downstream task로 남아 있습니다.
대규모 Vision‑Language Foundation Models(VLFMs), 예를 들어 CLIP은 이제 다양한 컴퓨터 비전 연구 및 응용 분야의 기반이 되고 있습니다. VLFMs는 종종 ada...
컴퓨팅은 데이터보다 훨씬 빠르게 성장합니다. 현재의 스케일링 법칙은 두 요소를 모두 비례적으로 증가시켜야 확장할 수 있지만, 성장의 비대칭성은 인텔리…
컴퓨터 지원 설계(CAD) 모델을 구축하는 것은 노동 집약적이지만 엔지니어링 및 제조에 필수적입니다. 최근 대규모 언어 모델(Large Language Models, LL…)
연합 학습(Federated learning, FL)은 두 가지 구조적 긴장을 안고 있다: 그래디언트 공유는 데이터 재구성 공격을 가능하게 하고, 비IID 클라이언트 분포는 집계 성능을 저하시킨다...
최근 연구는 대형 언어 모델(LLM) 은닉 상태에서 지리적 및 시간적 변수들을 선형적으로 복원할 수 있는 것을 세계와 유사한 ...의 증거로 해석한다.
복잡한 추론 작업에 대한 Test-time scaling은 독립적으로 샘플링하고 여러 s를 집계하는 등과 같은 방법으로 inference-time compute를 활용하는 것이 ...
Large Language Models (LLMs)은 종종 매우 순응적이고 강화하는 대화 스타일을 보이며, 이는 AI-sycophancy라고도 알려져 있습니다. 비록 이 행동이 ...
대형 언어 모델(LLMs)이 연구 프로토타입에서 실제 시스템으로 전환함에 따라, 맞춤화가 핵심 병목 현상으로 부상했습니다. 텍스트 프롬프트는…
사용자 피드백은 모바일 앱의 진화에 필수적입니다. 그러나 연구에 따르면 사용자는 정보가 부족하거나 모호하거나 파괴적인 피드백을 제출하는 경향이 있습니다.
Alibaba의 Qwen 팀의 최근 개발 상황에 대해 나는 Qwen 3.5에 대한 글쓰기가 뒤처지고 있다. Qwen 3.5는 Alibaba의 Qwen 팀이 출시한 눈에 띄는 open‑weight 모델 패밀리이다.
우리는 VietNormalizer1을 소개합니다. 이는 베트남어 텍스트 정규화를 위해 설계된 오픈소스, 의존성 없는 Python 라이브러리로, Text-to-Speech (TTS) 및 Natural Language …
실제에서는 stochastic differential equations를 multi‑objective optimization에 적용하는 것이 두 가지 지속적인 격차, 즉 불완전한 stability analysis 때문에 제한되어 왔습니다.
코드 주석 분류는 자동화된 소프트웨어 문서화 및 분석을 위한 중요한 작업입니다. NLBSE'26 Tool Competition의 맥락에서, 우리는 Lo...