[Paper] Stream-CQSA: Flexible Workload Scheduling을 통한 Attention Computation의 Out-of-Memory 방지
긴 컨텍스트 대형 언어 모델의 확장성은 정확한 self-attention의 제곱 메모리 비용에 근본적으로 제한되며, 이는 종종 …
긴 컨텍스트 대형 언어 모델의 확장성은 정확한 self-attention의 제곱 메모리 비용에 근본적으로 제한되며, 이는 종종 …
자연어 텍스트로 학습된 언어 모델은 T=2, 5, 10의 지배적인 주기를 갖는 주기적 특징을 사용하여 숫자를 표현하는 방법을 학습합니다. 이 논문에서는 두…
강화 학습(RL) 사후 훈련은 인간 선호와 생성 모델을 정렬하는 표준이 되었지만, 대부분의 방법은 단일 스칼라에 의존합니다.
LLM이 에이전트 시스템에 점점 더 통합됨에 따라, 동적으로 정의된 기계가 해석할 수 있는 인터페이스를 준수해야 합니다. 우리는 LLM을 in-cont…
대형 비전-언어 모델(LVLMs)은 올림피아드 수준의 추론 작업에서 상당한 진전을 이루었습니다. 그럼에도 불구하고 현재 올림피아드 수준의 멀티모달...
인공지능(AI)의 가치 정렬 문제는 종종 순수하게 기술적이거나 규범적인 과제로 제시되며, 때로는 가상의 미래에 초점을 맞추기도 합니다.
RGB 이미지에서 3D Human-Object Interaction을 재구성하는 것은 인지 시스템에 필수적입니다. 그러나 이는 하위…
국소 게이지 대칭은 기본 상호작용과 강하게 상관된 양자 물질의 근본을 이루지만, 기존의 머신러닝 접근법은 일반적인, 원칙적인…
우리는 LLaDA2.0-Uni를 소개한다. 이는 통합된 이산 확산 대형 언어 모델(dLLM)로, 원시적으로 통합된 멀티모달 이해와 생성을 지원한다. LLaDA2.0-Uni는 텍스트, 이미지, 오디오, 비디오 등 다양한 모달리티를 동시에 처리할 수 있는 단일 모델 아키텍처를 제공한다. 이 모델은 이산 확산 과정과 대규모 언어 모델링을 결합하여, 복잡한 멀티모달 입력에 대한 깊이 있는 이해와 고품질의 생성 출력을 동시에 달성한다. 또한, LLaDA2.0-Uni는 기존의 멀티모달 파이프라인에서 발생하는 모달 간 불일치 문제를 최소화하고, 다양한 작업에서 일관된 성능 향상을 보여준다. 실험 결과, 이 모델은 텍스트-이미지 매칭, 비디오 캡션 생성, 오디오-텍스트 변환 등 여러 벤치마크에서 최첨단 성능을 기록했으며, 멀티모달 AI 시스템 구축에 있어 새로운 표준을 제시한다.
이 논문은 대형 언어 모델(LLMs)이 외부 온톨로지 메모리 레이어와 결합된 하이브리드 아키텍처를 지능형 시스템에 제시한다. ...
대형 언어 모델(LLMs)은 의료 분야에 점점 더 많이 도입되고 있지만, 임상 표준과의 의사소통 정렬은 아직 충분히 정량화되지 않고 있습니다.
우리는 인간과 유사한 작업 기억 제약을 Transformer 아키텍처에 통합하는 방안을 조사하고, 여러 인지적으로 영감을 받은 attention v...
희소한 다중 뷰 비디오에서 동적 3D 장면을 재구성하는 것은 매우 ill-posed하며, 종종 geometric collapse, trajectory drift, 그리고 floating artifact를 초래한다.
Radar로 촬영된 내부 ice layers는 snow accumulation와 ice dynamics에 대한 핵심 증거를 제공하지만, radar-derived layer boundary 관측은 종종 불완전합니다.
AI 코딩 에이전트가 대규모로 채택되고 있지만, 사람들이 실제로 어떻게 사용하는지와 그들의 출력이 실무에서 얼마나 유용한지에 대한 실증적 증거가 부족합니다. ...
게시일: 태평양 일광 절약시각(PDT) 오전 9시 58분 · 2026년 4월 22일 !Google Cloud Next 발표 https://techcrunch.com/wp-content/uploads/2026/04/GettyImages-2266466589.jpg?w=1024 Image Cr...
Space-time self-similarity (STSS)는 프레임 간 시각적 대응을 포착하여 비디오의 시간적 동역학을 효과적으로 표현하는 방법을 제공합니다.
우리는 bilingual Latin and English settings에서 question answering 및 translation을 위한 benchmark dataset을 소개합니다. 약 7,800개의 question‑answer pairs를 포함합니다. T...
OpenAI는 이번 주에 ChatGPT Images 2.0을 소개했으며, 회사는 이것이 이미지 생성의 새로운 시대를 연다고 말합니다. Images 2.0은 더 잘 다룰 수 있는 업데이트된 모델입니다.
Freight brokerages는 동적 가격 책정 조건 하에서 매일 수천 건의 carrier rates를 협상하고, 모델이 대화 중간에 목표를 자주 수정합니다. Classica...
이 논문은 CO₂ 격리 문제를 위한 하이브리드 솔버를 제시한다. 이 솔버는 IGA‑ADS(IsoGeometric Analysis Alternating Directions solver)를 사용하여 …
이 연구는 자유 텍스트 법률 질문 응답에 대한 LLM-as-a-Judge 평가에서 프롬프트 디자인과 판사 선택의 역할을 탐구합니다. 우리는 자동…
스타트업 펀드레이징 플랫폼인 VentureCrowd가 AI 코딩 에이전트를 도입하기 시작했을 때, 다른 기업들과 동일한 이점을 경험했습니다: 프런트엔드 개발을
딥러닝과 양자 컴퓨팅 간의 시너지 효과가 커짐에 따라, Quantum Neural Networks (QNNs)는 양자를 활용하여 유망한 패러다임으로 부상하고 있습니다.
프롬프트 문제 만약 시각용 generative AI를 가지고 놀아본 적이 있다면, 그 고충을 알 것입니다. 당신은 어떤 비전을 가지고 있습니다—아마도 새로운 제품 촬영(product shot)일 수도 있고…
우리는 고전적인 Hopfield/Marr 자동 연관 기억 모델을 CA3에 적용한 생물학적으로 상세한 확장을 제시하며, 열 개의 집단(두 개의 비대칭 …)을 구현합니다.
개요: 메타는 이제 업무용 컴퓨터에서 직원 활동을 활용해 AI 에이전트를 훈련시키고 있습니다. 로이터에 따르면, 이 회사는 Model Capab이라는 도구를 배포하고 있습니다.
흥분과 존재적 두려움이 AI engineering에 대한 나의 시각을 정의했었다—하지만 이번 주까지는. 나의 두려움은 우리를 미래의 설계자로서의 역할에 대한 믿음으로 대체되었다.
우리는 state space models와 데이터에서 장거리 종속성을 포착하기 위한 state-of-the-art architecture 사이의 수학적 대응 관계를 설정하고, 그리고 exa...
Assurance case는 시스템 요구사항이나 특성에 대한 주장을 정당화하는 구조화된 논증 문서이며, 이는 증거에 의해 뒷받침됩니다. In regul...
Lateral predictive coding (LPC)은 생물학적 신경 회로에서 feature detection을 이해하기 위한 간단한 이론적 프레임워크이다. 최근 이론적 연구 [Huang …]
우리는 대형 언어 모델(Large Language Models, LLMs)이 반형식 텍스트 청사진, 즉 간결한 제약 조건에 대해 직접 feature model analysis operations(AOs)를 수행할 수 있는지를 연구한다.
Behaviour-Driven Development (BDD) 스위트는 단계 텍스트 중복을 축적하며, 그 유지 관리 비용은 이전 연구에서 입증되었습니다. 기존 탐지 기법은 …
Quality-Diversity (QD) 알고리즘은 다양한 스킬 레퍼토리를 발견하는 데 뛰어나지만, 샘플 효율성이 낮고 종종 수십 밀리…
우리는 gauge‑covariant stochastic neural‑field 프레임워크를 확장하여 architecture‑level 파라미터를 함수 공간에서 진화하는 느린 stochastic 변수로 승격한다.
TL;DR: 아이볼루트 AI Book Creator를 사용하면 아이디어를 몇 분 안에 전체 길이의 KDP‑준비된 책으로 만들 수 있습니다. https://zdcs.link/z64N22?pageview_type=Standard&template=article...
번역할 텍스트를 제공해 주시겠어요? 현재는 링크만 포함되어 있어 내용이 확인되지 않습니다. 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.
Kernel Logistic Regression (KLR)을 기반으로 한 고용량 연관 메모리는 탁월한 성능으로 알려져 있지만 높은 계산 비용으로 인해 제한을 받는다…
Intuit의 group engineering manager인 Chase Roossin과 staff software engineer인 Steven Kulesza가 팟캐스트에 참여해 가장 어려운 문제일지도 모르는 것에 대해 이야기합니다.
Synergistic Collapse는 100명 이상의 에이전트로 확장할 때 개별 최적화로는 방지할 수 없는 초선형 성능 저하가 발생할 때 일어납니다. 우리는…
소개 이 표현과 함께 떠오르는 밈이 있지만, 관련 이미지를 찾을 수 없습니다. 표준 벤치마크의 문제 시스템을 구축할 때마다, p...
IoT 디바이스의 급증과 클라우드 컴퓨팅의 도입은 데이터 기반 인텔리전스의 새로운 시대를 열었습니다. 전통적인 중앙 집중식 머신러닝 모델은 …
TL;DR: 프롬프트 작성이 느려진다면, VibeFarm이 구축하고 저장하며 재사용을 도와줍니다 https://zdcs.link/922Wxe?pageview_type=Standard&template=article&module=conte...
멀티‑에이전트 시스템이 주목받고 있습니다. Kimi K2.6은 Claw Groups를 탑재해 300개의 병렬 서브‑에이전트를 지원합니다. Hermes Agent는 100 K GitHub 스타를 t 이하의 시간에 돌파했습니다.
!https://9to5mac.com/wp-content/uploads/sites/6/2026/04/chatgpt-images-2-0.webp?w=1600 OpenAI는 업그레이드된 ChatGPT 이미지 생성 모델인 ChatGPT Ima...를 발표했습니다.
ChatGPT Images 2.0 모델이 출시되었습니다. 우리의 테스트에 따르면 이 모델은 더 자세한 이미지를 만들고 텍스트를 렌더링하는 데 더 뛰어나지만, 여전히 언어에 어려움을 겪고 있습니다…
ChatGPT Images 2.0 모델이 출시되었습니다. 우리의 테스트에 따르면 이 모델은 더 자세한 이미지를 만들고 텍스트를 렌더링하는 데 더 뛰어나지만, 여전히 언어…
ChatGPT Images 2.0가 생성한 이미지. | 이미지: OpenAI OpenAI는 새로운 “thinking capabilities”를 갖춘 최신 버전의 AI‑powered 이미지 생성기를 출시하고 있습니다.