[Paper] GenTac: 생성 모델링 및 축구 전술 예측
오픈플레이 축구 전술을 모델링하는 것은 게임의 stochastic하고 multi-agent적인 특성 때문에 어려운 과제입니다. 기존의 computational approaches는 일반적으로 p...
오픈플레이 축구 전술을 모델링하는 것은 게임의 stochastic하고 multi-agent적인 특성 때문에 어려운 과제입니다. 기존의 computational approaches는 일반적으로 p...
언어 변화는 사회적 과정을 반영하고 형성하며, 기본 개념들의 semantic evolution은 역사적 및 사회적 과정의 측정 가능한 흔적을 제공한다.
Kullback-Leibler (KL) divergence는 정보 이론에서 두 확률 분포 사이의 차이를 정량화하는 기본 개념입니다. In the co...
General first-order methods (GFOM)는 상태 벡터를 행렬‑벡터 곱과 원소별 비선형 연산으로 업데이트하는 유연한 클래스의 반복 알고리즘이다.
Serverless 제공업체는 배포 밀도를 최적화하여 높은 자원 활용도를 달성하려고 합니다: 하나의 호스트 서버당 몇 개의 애플리케이션을 배포할 수 있는가. 그러나, achi...
Spiking Transformers는 Transformers의 확장성과 Spiking Neural Networks (SNNs)의 희소하고 에너지 효율적인 특성을 결합하여 ...를 달성했습니다.
고성능 컴퓨팅 및 AI 워크로드가 GPU에 점점 더 의존하게 되면서, 빠르게 진화하는 하드웨어 세대에 걸쳐 높은 성능을 유지하는 것이 ...
클라우드 네이티브 아키텍처는 클라우드 환경을 최대한 활용하기 위해 확장 가능한 마이크로서비스 애플리케이션을 구축하고 실행하는 것을 의미합니다. Managed Kubernetes ...
양자 컴퓨팅 커뮤니티는 양자 프로세서를 고전 HPC 워크플로우 내에서 GPU와 TPU에 비유되는 가속기로 점점 더 위치시키고 있습니다. 그러나…
Multi-model LLM routing은 각 prompt를 ...에 할당함으로써 serving cost와 latency를 줄이면서 output quality를 유지하는 효과적인 접근법으로 부상했습니다.
Vision-language models (VLMs)은 여전히 공간 이해와 시점 인식과 같은 시각 인지 작업에서 어려움을 겪고 있다. 가능한 한 가지 원인…
Large Vision Language Models (LVLMs)는 강력한 멀티모달 추론 능력을 달성하지만, 종종 높은 확신을 가지고 hallucination과 잘못된 응답을 보입니다, ...
생산 환경에서 엑사스케일 성능을 지속하려면 실제 배포 제약과 요구 사항 하에서만 나타나는 엔지니어링 선택과 운영 관행이 필요합니다.
노름, 형식 이론 언어학자와 클로드, 계산 언어 과학자는 현대 언어 모델이 … 할 수 있는지에 대해 즐겁게 토론한다.
모델 포이징 공격은 연합 학습(Federated Learning, FL)에 중대한 보안 위협을 제기합니다. 대부분의 기존 모델 포이징 공격은 공모에 의존하며, 공격자...
I‑Ching의 King Wen 순서(기원전 약 1000년)는 64개의 hexagram—6차원 이진 공간의 상태—을 학자들을 당황하게 만든 패턴으로 배열한다.
Von Economo neurons (VENs)은 대형 양극성 투사 뉴런으로, 전전두 대상피질(ACC)과 전두 섬(insula)에서만 독점적으로 발견되며, 복잡한 …
현대 LLM 강화 학습(RL) 워크로드는 이기종 컴퓨팅 리소스 전반에 걸쳐 학습을 확장하기 위해 고효율 weight transfer system이 필요합니다.
사회적 행위자들은 집단 규범을 내면화하고 창의적 행동을 통해 이를 재구성하지만, computational models는 이 양방향 과정을 포착하지 못했다.
인체 피팅은 SMPL과 같은 파라메트릭 바디 모델을 옷을 입은 사람들의 원시 3D 포인트 클라우드에 정렬하는 작업으로, 하위 작업들을 위한 중요한 첫 단계 역할을 합니다.
Free-form bones는 표면에 밀접하게 맞춰져 비강체 변형을 효과적으로 포착할 수 있지만, 직관적인 con...에 필요한 kinematic structure가 부족합니다.
에이전시 멀티모달 모델의 등장은 시스템이 외부 환경과 적극적으로 상호작용할 수 있게 했습니다. 그러나 현재 에이전트들은 심각한 me...
Text-to-video diffusion models는 개방형 비디오 합성을 가능하게 했지만, 프롬프트에 지정된 정확한 객체 수를 생성하는 데 종종 어려움을 겪습니다.
Event 카메라는 헤드 마운트 장치에서 단안 egocentric 3D 인간 자세 추정을 수행할 때 밀리초 수준의 시간 해상도, 높은 …
Robotic manipulation with deformable objects는 embodied learning에서 데이터 집약적인 regime을 나타내며, 여기서 shape, contact, 그리고 topology가 ... 방식으로 공동 진화한다.
이 논문은 긴 비디오 시퀀스로부터 대규모 3D 장면 재구성 작업을 다룹니다. 최근의 feed-forward reconstruction 모델들은 유망한 결과를 보여주었습니다.
Multimodal Mixture-of-Experts (MoE) 모델은 vision-language 작업에서 눈에 띄는 성능을 달성했습니다. 그러나 우리는 Seei…라는 당혹스러운 현상을 확인했습니다.
Text-to-Audio-Video (T2AV) 생성은 미디어 제작의 핵심 인터페이스로 빠르게 자리 잡고 있지만, 그 평가 방법은 여전히 파편화되어 있습니다. 기존 벤치마크는 …
Group Relative Policy Optimization (GRPO)은 최근 멀티모달 대형 언어 모델(Multimodal Large Language Models) 분야의 발전을 이끄는 사실상의 강화 학습(Reinforcement Learning, RL) 목표로 부상하고 있습니다.
Visual decoding from brain signals은 computer vision과 neuroscience의 교차점에서 핵심 과제이며, neural representation을 연결하는 방법을 필요로 합니다.
우리는 RewardFlow를 소개한다. 이는 사전 학습된 diffusion 및 flow-matching 모델을 추론 시에 다중 보상 Langevin dynamics를 통해 조정하는 inversion‑free 프레임워크이다.
Personal AI tools는 이제 natural-language 요청으로 생성될 수 있지만, 생성 후에도 종종 고립된 상태로 남아 있습니다. 우리는 공유 상태 아키텍처인 PSI를 제시합니다.
On-policy distillation (OPD)은 강력한 교사로부터의 감독을 활용하면서 학생 모델을 자체 유도 분포 하에서 학습시킵니다. 우리는 실패를 식별한다…
오늘날의 large language models (LLMs)은 reinforcement learning과 같은 방법을 통해 사용자 선호에 맞추도록 훈련됩니다. 그러나 모델들은 점점 d...
스티어링 벡터를 대형 언어 모델(LLMs)에 적용하는 것은 효율적이고 효과적인 모델 정렬 기술이지만, 이에 대한 해석 가능한 설명이 부족합니다…
AI 에이전트는 당신의 받은편지함을 자동화할 수 있을지도 모르지만, 삶의 다른 일상적인 측면을 자동화할 수 있을까요? 매일의 온라인 작업은 현실적이면서도 아직 해결되지 않은 테스트를 제공합니다.
대형 언어 모델(LLMs)은 매개변수에 사실 지식을 기억하는 데 어려움을 겪을 수 있으며, 이는 종종 환각을 일으키고 지식‑
대규모 언어 모델(LLMs)은 놀라울 정도로 복잡한 작업을 수행할 수 있지만, 이러한 능력이 사전 학습 중에 어떻게 나타나는지에 대한 세밀한 세부 사항은 여전히 충분히 이해되지 않고 있다.
우리는 최근 Kleinberg와 Mullinathan [KM24]가 도입한 모델인 language generation in the limit를, differentia의 제약 하에서 연구를 시작한다.
과학은 현재 quality assurance에 대해 두 가지 옵션을 제공하지만, 둘 다 충분하지 않다. Journal gatekeeping은 integrity와 contribution을 모두 검증한다고 주장하지만 실제로는 …
Prompt injection attacks는 실제 응용 분야 전반에 걸쳐 심각한 보안 위험을 초래합니다. 점점 더 많은 관심을 받고 있지만, 커뮤니티는 …
이전 연구에 따르면, 신경망 기반 노드 임베딩은 동일한 파라미터로 같은 데이터셋을 학습시켜도 서로 다른 결과를 반환한다는 것이 입증되었다, ju...
검증 가능한 보상을 이용한 강화 학습(RLVR)은 수학과 같은 형식적 영역에서 대형 언어 모델(LLM)의 추론 능력을 크게 향상시켰다…
Federated learning (FL)은 분산된 항공우주 함대 전반에 걸쳐 프라이버시를 보호하는 예측 유지보수를 가능하게 하지만, gradient communication overhead가 제약을 가한다.
Topological Data Analysis (TDA)는 데이터의 형태를 설명하는 도구를 제공하지만, 위상학적 특징을 딥러닝 파이프라인에 통합하는 것은 여전히 도전 과제이다.
검증 가능한 보상을 이용한 강화 학습(RLVR)으로 구동되는 대규모 추론 모델(LRMs)에서 상당한 진전이 있었음에도 불구하고, 이 패러다임은 근본적으로 …
GPU 컴퓨트 처리량과 메모리 용량의 발전은 다양한 워크로드에 큰 기회를 제공합니다. 그러나 이러한 자원을 효율적으로 활용하는 것은 ...
Kubernetes 컨트롤‑플레인 노드의 배치는 클러스터의 신뢰성, 확장성 및 성능을 보장하는 데 매우 중요하며, 따라서 중요한…