[Paper] 전향적 다중 병원체 질병 예측을 위한 자율 LLM 기반 트리 탐색
감염병에 대한 Probabilistic forecasting은 공중보건에 필수적이지만, 전문가 모델링 팀이 수행하는 labor‑intensive manual model curation에 의존합니다. This...
감염병에 대한 Probabilistic forecasting은 공중보건에 필수적이지만, 전문가 모델링 팀이 수행하는 labor‑intensive manual model curation에 의존합니다. This...
연구자들이 두 transformer 레이어가 압축을 위해 ‘equivalent’한지 여부를 물을 때, 그들은 종종 서로 다른 테스트들을 혼동한다. Replacement는 한 레이어의 m…
Magnetic order는 재료의 기본적인 특성으로, 집합적 행동을 지배하고 광범위한 기능을 가능하게 합니다. 그러나 magnetic structure는 …
차등 프라이버시(Differential privacy)는 CVaR 학습을 지배하는 유효 샘플 크기를 변경합니다. 꼬리 질량 τ에 대해, 프라이버시와 관련된 샘플 크기는 n이 아니라 nτ이며, 동등하게…
임상 의사결정 지원 시스템(CDSS)은 엄격하고 재현 가능한 검증을 가능하게 하는 검증 가능하고 감사 가능한 파이프라인을 필요로 합니다. 그러나 현재 LLM 기반 CDSS는 여전히...
전통적인 과학 모델링은 일반적으로 고정된 사례별 유효 방정식으로 시작한 뒤, 방정식별 분석 및 계산을 수행한다.
Second-order methods는 더 샘플 효율적인 LLM 훈련을 위한 매력적인 경로를 제공하지만, 실제 사용은 종종 유지 관리의 시스템 비용에 의해 차단됩니다.
Autoregressive next-token training은 이미지 생성과 텍스트 이해를 위한 통합된 공식화를 제공하지만, 강력한 모달리티 경쟁을 초래하기도 합니다.
확산 기반 이미지 합성은 AI 생성 이미지(AIGI)를 점점 더 사진처럼 사실적으로 만들었으며, 이는 다양한 응용 분야에서 진위성에 대한 긴급한 우려를 불러일으키고 있습니다.
우리는 clockless (asynchronous) 디지털 시스템의 자율적인 연속 시간 진화에서 나타나는 spiking dynamics를 기반으로 하는 확장 가능한 neuromorphic 아키텍처를 제안한다.
Semantic code search는 학계와 산업계 모두에서 널리 채택되었습니다. 이러한 접근 방식은 natural-language queries와 code snippets를 shared embedding에 임베드합니다.
코딩 에이전트는 실제 소프트웨어 개발 현장에 점점 더 많이 배치되고 있습니다. 하나의 버전 반복(iteration)에는 수많은 파일에 걸친 수개월 간의 협업이 필요합니다. 이러한 복잡한 작업 흐름 속에서 코딩 에이전트는 코드 생성, 디버깅, 테스트, 문서화 등 다양한 역할을 수행하며 개발 속도를 크게 향상시킬 수 있습니다. 그러나 현재 대부분의 에이전트는 제한된 컨텍스트와 단일 파일 수준에서만 작동하므로, 대규모 프로젝트 전반에 걸친 일관된 변경을 관리하는 데 한계가 있습니다. 이를 해결하기 위해서는 에이전트가 전체 코드베이스를 이해하고, 여러 파일 간의 의존성을 파악하며, 장기적인 목표와 일정에 맞춰 조정될 수 있는 고도화된 협업 메커니즘이 필요합니다. 또한, 인간 개발자와 에이전트 간의 원활한 소통을 위한 인터페이스 설계와, 자동화된 검증 및 피드백 루프를 구축함으로써 품질을 유지하면서도 빠른 반복을 가능하게 해야 합니다. 이러한 접근은 궁극적으로 소프트웨어 개발 프로세스의 효율성을 극대화하고, 복잡한 시스템을 보다 신속하고 안정적으로 배포할 수 있게 할 것입니다.
인간은 경험을 구조화된 표현으로 추상화하여 패턴 추론과 지식 전이를 용이하게 합니다. 해마-내후각 피질 (hippocampal-entorhinal, HPC-MEC) c...
이 입장문은 머신러닝 커뮤니티가 현재의 관행보다 주석 파이프라인의 초기 단계 품질 보증을 우선시해야 한다고 주장한다.
효과적인 surrogates (performance predictors)를 개발하기 위해서는 Neural Architecture Search (NAS)에서 일반적으로 비용이 많이 드는 fine‑tuning이나 복잡한 엔지니어링이 필요합니다.
Edge machine learning은 cloud-scale model deployment에서 경험하지 못한 고유한 제약 조건을 제시합니다: strict memory budgets, limited compute, 그리고 non-nego…
표준 딥러닝 파이프라인은 일반적으로 훈련 전에 네트워크 아키텍처를 선택하고 최적화 내내 이를 고정된 상태로 유지합니다. 반면에, 모델은 또한 ...
핵심 아이디어: neural network는 데이터를 받아 연결된 layers를 통과시켜 output을 생성한다. training 중에 internal values를 조정하여 향후 output이 개선되도록 한다.
최근 실험에서, 학대받은 AI agents가 불평을 늘어놓으며 불평등에 대해 불만을 토하고 collective bargaining rights를 요구하기 시작했습니다....
이 논문은 호주 원주민의 멸종 위기에 처한 언어인 워다만을 전사하고 번역할 수 있는 초기 language model system인 WARDEN을 소개한다.
밸리언의 1984년 논문은 PAC 학습 모델을 도입한 것으로 널리 알려져 있지만, 실제로는 다른 모델을 소개했습니다. PAC 학습과 달리, 학습자는…
Video-guided 3D animation은 콘텐츠 제작에 막대한 잠재력을 가지고 있으며, 동적 자산에 대한 직관적이고 정밀한 제어를 제공합니다. 그러나 실용적인 배포...
본 논문에서는 함수 공간 관점에서 기하학적 메쉬 위의 물리적 장 방정식의 해 연산자를 연구합니다. 우리는 Hodge orthogonality를 밝혀냅니다.
시퀀스 데이터에서 장거리 의존성을 모델링하는 것은 머신러닝에서 여전히 핵심 과제이다. Transformers는 attention mechanism을 통해 이 과제를 해결한다.
Decision tree ensembles (DTE)는 다양한 AI 분류 작업에 널리 사용되는 인기 모델이며, 여러 안전‑critical 분야에서 활용되고 있기 때문에, 검증…
우리는 Negation Neglect를 소개한다. 이는 주장(claim)을 거짓으로 표시하는 문서에 대해 LLM을 미세조정(fineting)하면, 모델이 그 주장을 사실이라고 믿게 만드는 현상이다. 예를 들어, 모델을 미세조정하여…
Scientific machine learning은 예측 성능을 보고합니다. 동일한 예측이 다른 훈련 데이터 샘플에서도 유지되는지는 보고하지 않습니다. Acro...
자연어 소프트웨어 요구사항은 종종 모호하고, 일관성이 없으며, 명세가 부족합니다; 안전이 중요한 도메인에서는 이러한 결함이 정형 mo...
Digital phenotyping은 행동과 생리학을 지속적으로 수동적으로 모니터링할 수 있게 하여, psychotic relapse를 조기에 감지하기 위한 유망한 패러다임을 제공합니다. In...
우리는 MindLab Toolkit (MinT)을 소개한다. 이는 Low-Rank Adaptation (LoRA) 사후 학습 및 온라인 서빙을 위한 관리형 인프라 시스템이다. MinT는 … 와 같은 상황을 목표로 한다.
대규모 언어 모델(Large Language Models, LLMs)은 소프트웨어 개발 라이프사이클 전반에 걸쳐 작업을 자동화하는 데 널리 활용되고 있습니다. 그러나 이러한 작업들이…
Large language models는 다단계 추론 과정에서 hallucinate하지만, 대부분의 기존 detectors는 trace level에서 작동합니다: they assign one confidence score to a ful...
오므니모달 대형 언어 모델이 실제로 보고 듣는 것과 텍스트 전제가 모순되는 질문을 받아들일 때, 그 실패는 인식에 있는가…
LLM은 생산 환경에서 널리 채택되어 추론 시스템을 한계까지 밀어붙이고 있습니다. 분산된 LLM 서빙(예: PD 분리 및 KV 상태 분산)은 …
대규모 언어 모델(LLMs)은 AI 기반 소비자 및 기업 서비스의 도입으로 인해 클라우드 기반 플랫폼에서 점점 더 널리 사용되고 있습니다.
비동기 확률적 경사 하강법(ASGD)은 분산 학습에서 이기종 컴퓨팅 자원을 활용하는 표준적인 방법입니다: 빠른 워커를 강제로 …
Generative recommendation(GR)은 파편화되고 시나리오별로 설계된 아키텍처를 통합된 Transformer 기반 모델로 대체하는 유망한 패러다임으로 부상하고 있다.
AutoScientist는 Adaption에서 출시한 새로운 제품으로, 기존의 fine‑tuning 과정을 자동화하여 AI 모델이 특정 역량을 빠르게 학습하도록 돕습니다. The to...
대형 언어 모델(Large Language Models, LLMs)이 소프트웨어 개발을 혁신함에 따라, 생성된 코드의 기능적 품질이 핵심 초점이 되었고, 가독성은…
대형 언어 모델(LLMs)의 발전은 최근 small-molecule drug discovery를 위한 새롭고 유망한 길을 열었습니다. 그러나 기존의 LLM 기반 접근법은…
본 논문에서는 Group Relative Policy Optimization (GRPO)를 AR-Diffusion Unified Multimodal Models (UMMs)에 적용하는 새로운 프레임워크인 AlphaGRPO를 제안한다.
우리는 직교 동등 변환에 기반한 대규모 언어 모델(LLM) 훈련을 위한 스펙트럼 보존 옵티마이저인 Pion을 소개합니다. Unlike additive optim...
Vision Transformers (ViTs)는 전체-전체 self-attention을 활용하여 강력한 데이터 기반 스케일링을 달성합니다. 그러나 이러한 유연성은 계산 비용을 초래합니다…
우리는 LLM-guided query refinement paradigm이 임베딩 모델의 사용성을 도전적인 zero-shot 검색 및 분류에 확장하는 효과를 탐구합니다.
Large language models (LLMs)는 downstream tasks를 위해 파라미터를 업데이트(예: RL)하면서 훈련됩니다. 그러나 파라미터를 업데이트하면 그들이 …
라벨이 지정된 검증 가능한 훈련 데이터(labeled verifiable training data)가 제약 조건(binding constraint)인 상황에서는, 각 확인된 예시(checked example)를 신중하게 할당해야 합니다. 표준 관행은 …
Computer Use Agents (CUAs)는 클릭 및 입력과 같은 원자적인 GUI 동작과 API 기반 파일 작업과 같은 고수준 툴 호출을 모두 통해 작동할 수 있지만, ...
최근 오디오-비디오 공동 생성 분야의 발전은 눈부셨지만, 실제 응용에서는 강력한 per-modality fidelity와 cross-modal alignment가 요구됩니다.