[Paper] 빠른 공간 메모리와 Elastic Test-Time Training
Large Chunk Test-Time Training (LaCT)는 긴 컨텍스트 3D 재구성에서 강력한 성능을 보여왔지만, 완전한 플라스틱 추론 시간 업데이트는 여전히 취약...
4486 posts from this source
Large Chunk Test-Time Training (LaCT)는 긴 컨텍스트 3D 재구성에서 강력한 성능을 보여왔지만, 완전한 플라스틱 추론 시간 업데이트는 여전히 취약...
Exact relevance certification은 좌표 구조화된 의사결정 문제에서 최적 행동을 결정하는 데 필요한 좌표가 무엇인지 묻는다. The tractable fa...
모션 제어 비디오를 생성하는 것은—사용자가 지정한 행동이 자유롭게 선택된 시점에서 물리적으로 타당한 장면 동역학을 구동하도록—두 가지 능력을 요구한다.
생성형 인공지능(AI)의 급속한 성장으로 전례 없는 계산 요구가 발생했으며, 이는 에너지 발자국의 상당한 증가를 초래하고 있다.
Pluralistic alignment는 대형 언어 모델(Large Language Models, LLMs) 개발에서 중요한 최전선으로 부상했으며, reward models(RMs)는 핵심 메커니즘으로 작용합니다.
대부분의 저장소 수준 코드 번역 및 검증 기술은 컴... 때문에 단일 소스‑타깃 프로그래밍 언어(PL) 쌍에 대해 평가되었습니다.
우리는 TC‑AE를 제안한다. 이는 ViT 기반의 딥 압축 오토인코더 아키텍처이다. 기존 방법들은 일반적으로 잠재 표현의 채널 수를 증가시킨다.
3D Gaussian Splatting (3DGS)은 빠른 새로운 시점 합성에 혁신을 가져왔지만, 불투명도 기반의 공식화는 표면 추출을 근본적으로 어렵게 만든다. U...
robot learning을 확장하려면 실제 환경에서 풍부하고 장기적인 상호작용을 포함한 인간 데이터가 필요할 가능성이 높습니다. 이러한 데이터를 수집하기 위한 기존 접근법은…
훈련 데이터의 선택이 AI 모델에 어떤 영향을 미치는가? 이 질문은 interpretability, privacy, 그리고 basic science에 있어 중심적인 중요성을 가진다. 그 핵심은 …
본 논문에서는 비동기 Q…에 의해 생성된 Polyak‑Ruppert 평균 반복에 대한 고차원 central limit theorem의 수렴 속도를 유도한다.
Propositional Linear Temporal Logic (LTL)은 소프트웨어, 네트워크 등에서 바람직한 요구사항 및 보안·프라이버시 정책을 지정하기 위한 인기 있는 형식이다.
신경망의 복잡성이 증가함에 따라 자원 제한이 있는 장치에서 분산 머신러닝을 배포하는 것이 어려워집니다. Split learning (SL)은 …
Multiple Instance Learning (MIL)은 컴퓨터 병리학에서 기가픽셀 전체 슬라이드 이미지(WSI) 분류를 위한 지배적인 프레임워크입니다. 그러나 현재 MIL…
공간 이해는 인간 수준 지능의 근본적인 초석입니다. 그럼에도 불구하고 현재 연구는 주로 도메인 특화 데이터에 초점을 맞추고 있습니다…
고급 원자로의 Real-time supervisory control은 물리적 센서가 위치한 지점을 포함한 plant‑wide thermal‑hydraulic 상태를 정확히 예측해야 합니다.
교육 분야에서 인공지능(AI)에 대한 논쟁은 종종 교육을 점점 더 자동화되거나 위임될 수 있는 모듈식·절차적인 작업으로 묘사한다…
GROMACS는 고전 분자 동역학(MD)의 사실상 표준이다. 거의 양자 수준의 정확성을 MD 전반에 걸쳐 추구하는 AI 기반 interatomic potentials의 부상이…
임상 전문성은 의료 지식을 습득하는 것뿐만 아니라 재사용 가능한 진단 패턴을 만들어내는 경험을 축적함으로써 향상됩니다. 최근 LLMs 기반 ...
대규모 언어 모델(LLMs)이 민감한 사용자 데이터로 점점 더 많이 학습됨에 따라, 언어 학습에서 프라이버시의 근본적인 비용을 이해하는 것이 필수적이 된다…
대형 언어 모델(LLMs)이 정적 챗봇에서 autonomous agents로 진화함에 따라, 주요 취약점 영역은 최종 출력에서 intermediate …
LoRA는 LLM의 효율적인 맞춤화를 가능하게 하며, 멀티 테넌트 및 멀티 태스크 서빙에 널리 사용됩니다. 그러나 MoE와 같은 새로운 모델 아키텍처는 …
출력 토큰 수를 제출 시점에 예측할 수 있을 때 (Gan et al., 2026), 블랙박스 LLM API에 대한 클라이언트 측 스케줄링은 반예지적이 된다: de...
현대 추천 모델은 매개변수가 트릴리언 단위로 증가했습니다. 클러스터 규모가 O(1k) 수준으로 확장됨에 따라, 분산 학습 병목 현상이 계산 측면에서 변합니다.
이 논문에서는 SOS 작업( Set of Output Sets tasks )이라고 하는 새로운 클래스의 분산 작업을 정의합니다. 이는 값들의 서로 다른 출력 집합들의 집합 O에 의해 정의됩니다.
상피 조직은 세포 간의 국부적인 기계적 상호작용을 통해 동적으로 형태를 재구성하며, 이 과정은 vertex models에 의해 잘 포착됩니다. 그러나 그들의 많은 조정 가능한 파라미터...
이슈 해결은 주어진 이슈 설명으로부터 자동으로 패치를 생성하는 것을 목표로 하며, 대규모 언어 모델의 급속한 발전과 함께 큰 관심을 받고 있습니다.
전통적인 optimization 문제는 종종 개별적으로 연구되었지만, 오늘날 많은 실제 문제들은 여러 optimization 구성 요소 간의 상호 의존성을 요구합니다.
과학 문헌의 급속한 성장으로 인해 연구자들이 관련 작업을 효율적으로 발견하고, 평가하며, 종합하는 것이 점점 더 어려워지고 있습니다. Re...
정적인 “train then deploy” 패러다임은 대규모 언어 모델(LLM)이 지속적인 스트…에 대응하여 가중치를 동적으로 조정하는 것을 근본적으로 제한한다.
Churn flow‑수직 two‑phase flow에서의 혼돈적이고 진동적인 레짐은 40년 넘게 정량적인 수학적 정의가 없었다. 우리는 최초로…
대형 Vision‑Language 모델은 이미지 설명에서 object hallucination을 발생시킬 수 있으며, 효과적인 detection 및 mitigation 전략의 필요성을 강조한다.
Character Error Rate (CER)는 Optical Character Recognition (OCR)의 품질을 평가하는 핵심 지표입니다. 그러나 이 지표는 텍스트가 …
RL에서, 프롬프트가 주어지면 모델에서 여러 개의 완성을 샘플링하고 점수를 매깁니다. 두 가지 질문이 뒤따릅니다: 어떤 완성이 확률 질량을 얻어야 하는가, 그리고 h...
MLLM은 멀티모달 임베딩 작업에 성공적으로 적용되었지만, 그들의 생성적 추론 능력은 아직 충분히 활용되지 않고 있습니다. 직접적으로 cha...
대형 언어 모델(LLMs)이 일관된 내부 세계 모델을 형성하는지는 여전히 핵심 논쟁거리이다. 기존의 Next-Token Prediction(NTP)은 하나에 초점을 맞춘다.
인공지능 거버넌스에는 사각지대가 있다: AI 시스템이 행동하기 위해 사용하는 머신 아이덴티티이다. AI agents, service accounts, API tokens, 그리고 auto...
효율적인 데이터 로딩은 근시일 양자 머신러닝에 여전히 병목 현상으로 남아 있다. 기존 스킴(angle, amplitude, and basis encoding)은 충분히 활용하지 않는다…
이 논문은 Polynomial Mixer (PoM)를 소개한다. 이는 선형 복잡도를 갖는 새로운 토큰 믹싱 메커니즘으로, self-attention을 대체할 수 있는 드롭인 방식이다....
이 연구는 RGB 사전 학습된 VLM과 열 적외선 이미지 간의 표현 격차를 메우기 위한 경량 멀티모달 적응 프레임워크를 제안한다, 그리고…
스케일러블한 야외 주행 장면 생성을 위해서는 여러 시점에서 일관성을 유지하고 넓은 영역으로 확장 가능한 3D 표현이 필요합니다. 기존의 …
대규모 언어 모델(LLM) 에이전트는 다중 에이전트 환경에서 인간 대리인으로 점점 더 많이 활동하고 있으며, 여기서 대표 에이전트는 다양한 피어를 통합합니다.
현대의 Transformer 기반 언어 모델은 자연어 처리 작업에서 강력한 성능을 달성하지만, 그들의 latent semantic spaces는 여전히 크게 통합되지...
Graphics Program Synthesis는 시각 데이터를 해석하고 편집하는 데 핵심적인 역할을 하며, 정적인 비주얼을 편집 가능한 형태로 역공학하는 과정을 효과적으로 지원합니다.
성격 특성은 자연어에 풍부하게 인코딩되어 있으며, 인간 텍스트로 학습된 large language models (LLMs)는 프롬프트에 조건을 걸면 성격을 시뮬레이션할 수 있다.
Modern exascale GPU- 및 APU 기반 시스템은 여러 power 및 energy sensors를 제공하지만, scope, update rate, timing, filtering의 차이로 인해 복잡해진다.
Graphics Processing Units (GPUs)는 대규모 하드웨어 병렬성을 쉽게 활용할 수 있는 정규 데이터 병렬 워크로드에서 뛰어납니다. 반면에, 많은 importa...
대규모 언어 모델(LLMs)은 강력한 프로그램 수리 성능을 달성하지만, 종종 과도한 수정으로 올바른 코드를 덮어쓰는 과다 편집(over-editing) 문제를 겪는다 ...