[Paper] 임베딩이 그래프 신경망을 형성하는 방식: 고전 vs 양자 지향 노드 표현
Node embeddings는 graph neural networks의 정보 인터페이스 역할을 하지만, 그들의 실증적 영향은 종종 일치하지 않는 backbones, splits, 그리고 …에 대해 보고됩니다.
Node embeddings는 graph neural networks의 정보 인터페이스 역할을 하지만, 그들의 실증적 영향은 종종 일치하지 않는 backbones, splits, 그리고 …에 대해 보고됩니다.
이 논문은 텐서 프로그램을 위한 최초의 심볼릭 슈퍼옵티마이저인 Prism을 소개한다. 핵심 아이디어는 sGraph이며, 이는 심볼릭하고 계층적인 표현으로서 압축적으로…
신뢰할 수 있는 uncertainty estimation은 의료 영상 분할에서 매우 중요합니다. 여기서 automated contours는 downstream quantification 및 clinical decision support에 활용됩니다.
본 논문에서는 소프트웨어 개발 라이프사이클(SDLC)에서 널리 사용되는 검증 및 검증(Verification and Validation, V&V) 활동 중 두 가지를 자동화하는 데 초점을 맞춥니다: Soft...
비직교 상태(non-orthogonal states)를 동시에 복제할 수 없다는 불가능성은 양자 이론(quantum theory)의 기초에 놓여 있다. 근사 오차(approximation errors)를 허용하더라도, 복제(cloning)…
LLM 에이전트가 다른 목표 추구 에이전트와 효과적이고 안전하게 상호작용하는 것이 점점 더 중요해지고 있지만, 최근 연구들은 반대 추세를 보고하고 있다: LLMs ...
Looped transformers는 더 어려운 문제에 더 많은 iterations를 사용함으로써 test-time compute scaling을 약속하지만, 어떤 architectural choices가 이를 가능하게 하는지는 아직 명확하지 않다.
Speculative decoding (SD)은 가벼운 초안 모델이 더 강력한 타깃 모델이 검증하는 출력을 제안하도록 함으로써 대형 언어 모델 추론을 가속화합니다.
우리는 제로섬 행렬 게임에서 minimax 정책을 학습하는 문제를 연구한다. Fiegel et al. (2025)은 최근 이 분야에서 마지막 반복 수렴(last-iterate convergence)을 달성하는 것이…
LLM-as-a-judge 패러다임은 자동화된 AI 평가 파이프라인의 운영 백본이 되었지만, 검증되지 않은 가정에 기반하고 있습니다: 즉, 심사자들이 평가한다는…
인공지능은 시스템 엔지니어링 활동에 점점 더 도입되고 있으며, 특히 요구사항 엔지니어링 분야에서 품질 평가가.
유머는 추론을 올바르게 하는 것이 정답을 맞추는 것만큼 중요한 몇 안 되는 인지 작업 중 하나입니다. 최근 연구에서는 유머를 평가…
Machine learning이 의료와 같은 고위험 분야에서는 강력한 예측 성능뿐만 아니라 신뢰할 수 있는 불확실성 정량화(UQ)를 필요로 한다...
그룹 수준 사용자 행동을 시뮬레이션하면 비용이 많이 드는 온라인 실험 없이도 상인 전략에 대한 확장 가능한 반사실 평가가 가능해집니다. 그러나, building a tr...
Agentic workflows는 여러 대형 언어 모델(LLM)과 도구들을 조정하여 복잡한 작업을 수행합니다. 이러한 워크플로를 목표 처리량으로 제공하려면 …
Sparse attention은 변환기(transformers)의 2차 비용을 완화하는 방법으로 제안되었으며, 이는 장기 컨텍스트 학습에서의 핵심 병목 현상입니다. 유망한 방향은 …
LLMs는 기계 번역에 능숙함을 입증하고 있지만, 그들의 생성적 특성 때문에 때때로 다양한 방식으로 overgenerate할 수 있습니다. 이러한 overgeneration…
이 작업은 단일 줄기 세포에서 시작하여 유전자 조절 규칙에 의해 제어되는 피질 신경 발생의 발달 과정을 시뮬레이션합니다. 이 규칙들은 mo...
현대의 AI 중심 데이터센터는 SmartNIC에 크게 의존하지만, 기존 장치는 심각한 트레이드오프를 강요합니다. 상용 SmartNIC는 높은 대역폭을 제공하고 ...
이 베타 기술 보고서는 재사용 가능한 경험을 어떻게 표현해야 효과적인 테스트 시점 제어와 반복을 위한 기반으로 기능할 수 있는지를 묻는다.
공간을 탐색하기 위해 뇌는 place cells, grid cells, head direction cells 등 다양한 세포를 이용해 환경의 내부 표상을 만든다.
Open-weight Small Language Models(SLMs)는 더 낮은 비용으로 빠른 로컬 추론을 제공할 수 있지만, 상용 모델과 동일한 성능 수준을 달성하지 못할 수 있습니다…
Pareto 최적화는 진화적 다목적 알고리즘을 통해 제약이 있는 단조 서브모듈러 함수를 효율적으로 해결할 수 있음이 입증되었습니다. 전통적으로 …
코드 최적화는 소프트웨어 개발에서 핵심 목표로 남아 있지만, 현대 컴파일러는 방대한 최적화 공간을 탐색하는 데 어려움을 겪고 있다. 최근 …
Prefill-decode (PD) 디스어그리게이션은 대규모 LLM 서빙을 위한 표준 아키텍처가 되었지만, 실제로는 배포 경계가 여전히 …에 의해 결정됩니다.
컴퓨팅 파워에 대한 수요 증가로 클라우드 제공업체가 멀티-NUMA 서버를 도입하고 고객에게 멀티-NUMA 가상 머신을 제공하게 되었습니다. 하지만...
Generative AI는 연구 소프트웨어가 개발되는 방식을 바꾸고 있지만, 빠른 AI-assisted development는 연속성, 추적 가능성, 그리고 방법론적 명확성을 약화시킬 수 있다....
Artificial Intelligence (AI)의 현재 트렌드로, large foundation models가 AI 서비스의 핵심으로 점점 더 많이 활용되고 있습니다. 그러나 학습이 끝난 후에도, ...
Android 앱은 핵심 Android 시스템 기능을 추상화하는 API 위에 구축됩니다. 이러한 API는 Android SDK와 함께 배포되는 여러 파일에 공식적으로 문서화되어 있습니다.
데이터에 민감한 분야인 의료와 같은 영역에서, cross-silo federated learning (CFL)은 조직들이 원시 데이터를 공유하지 않고도 AI 모델을 공동으로 학습할 수 있게 합니다.
Vibe coding은 본질적으로 피드백 루프를 통해 LLM이 생성한 코드를 반복적으로 정제하는 것을 전제로 합니다. 기존 소프트웨어 작업에 효과적이지만, 그 신뢰성은…
에이전트 시스템이 점점 더 다양한 실행 환경으로 이동함에 따라, 궤적 수준의 안전성 평가 및 진단은 이에 맞춰 진화하는 벤치마크를 필요로 합니다. A...
실제 소프트웨어 엔지니어링(SWE) 문제를 자율 에이전트로 해결하려면 복잡하고 장기적인 추론이 필요합니다. 현재 파이프라인은 un...에 의해 병목 현상이 발생하고 있습니다.
연합 학습(Federated Learning, FL)에서의 통신 병목 현상은 클라이언트 디바이스 간에 교환되는 데이터 양을 줄이기 위한 기술에 대한 광범위한 연구를 촉발했습니다.
많은 실제 환경에서, 해결해야 할 문제 인스턴스들은 상당히 유사하며, 이전 최적화 실행에서 얻은 지식을 잠재적으로 활용할 수 있다.
Mixture-of-Experts (MoE) 모델은 대규모 언어 모델의 지배적인 아키텍처가 되었지만, 온프레미스 서비스는 근본적으로 메모리 바운드 문제를 안고 있다.
현대 데이터 스트리밍 시스템에서는 전통적인 프로그램과 함께 스트리밍 데이터와 상호작용할 수 있는 새로운 유형의 엔티티가 등장했습니다: AI 에이전트. 전통적인 ...
긴 비디오 이해는 프레임 수가 방대하기 때문에 vision-language models (VLMs)에게 본질적으로 도전적입니다. 각 비디오 프레임은 일반적으로 ...
Seedance 2.0는 2026년 2월 초에 중국에서 공식 출시된 새로운 네이티브 멀티모달 오디오-비디오 생성 모델입니다. 이전 모델들과 비교했을 때, Seed...
멀티모달 대형 언어 모델(MLLMs)을 기반으로 하는 기존 세그멘테이션 모델, 예를 들어 LISA와 같은 모델은 새로운 또는 떠오르는 엔터티에 대해 종종 어려움을 겪는다. 이는 그들의 능력 부족 때문이다.
3차원 장면에 대한 Spatial reasoning은 embodied intelligence의 핵심 역량이지만, 지속적인 model improvement는 여전히 computational cost 때문에 병목 현상이 발생한다.
강화 학습과 검증 가능한 보상(RLVR)은 조건부 분포 P(y|x)를 최적화함으로써 LLM 추론을 크게 향상시키지만, 그 잠재력은…
스트리밍 3D 재구성은 비디오 스트림으로부터 카메라 포즈와 포인트 클라우드와 같은 3D 정보를 복원하는 것을 목표로 하며, 이는 기하학적 정확성을 필요로 한다, t...
language models가 복잡한 autonomous tasks에 점점 더 많이 배치됨에 따라, 더 긴 horizon에 걸쳐 정확하게 reasoning할 수 있는 능력이 중요해지고 있습니다. An essentia...
LLM을 평가하는 것은 어려운 일이며, 벤치마크 점수는 모델의 실제 활용도를 포착하지 못하는 경우가 많다. 대신 사용자들은 종종 “vibe‑testing”에 의존한다: 비공식적인…
우리는 풀에서 발생하는 블록 위드홀딩 공격, 특히 최신 기술인 Power Adjusting Withholding (PAW) 공격을 고려한다. 우리는 일반화를 제안한다.
최근 몇 년간 Audio-Visual Language Models (AVLMs)는 눈에 띄는 진전을 이루었지만, 그 신뢰성은 cross-modal hallucination에 의해 병목 현상이 발생하고 있다.
수사적 질문은 정보를 얻기 위해서가 아니라 설득하거나 입장을 표시하기 위해 제기됩니다. 대규모 언어 모델이 이를 내부적으로 어떻게 표현하는지는 아직 명확하지 않습니다. 우리는...