[Paper] 비평형 ECRAM 동역학을 활용한 뉴로모픽 회로에서의 단기 가소성
Short-term plasticity (STP)는 생물학적 신경 시스템에서 시간 정보 처리를 위한 기본 메커니즘이지만, neuro...에서 효율적으로 구현하기는 여전히 어렵다.
Short-term plasticity (STP)는 생물학적 신경 시스템에서 시간 정보 처리를 위한 기본 메커니즘이지만, neuro...에서 효율적으로 구현하기는 여전히 어렵다.
최근 몇 년간, 인기 있는 다목적 진화 알고리즘(MOEAs)이 다목적(다수 목표) 최적화를 어떻게 수행할 수 있는지에 대한 이론적 이해가 급속히 발전했습니다.
우리는 처음부터 만든 약 150M 파라미터의 widened‑D 기판(D=1536, V=32000; D/V 약 0.048; ‘widened‑1536’…) 위에서 진화적 mixture‑of‑LoRA 시스템을 분해한다.
Diffusion 및 flow-based 모델은 이미지와 비디오와 같은 연속 데이터 생성에 있어 사실상의 표준 접근법이 되었습니다. 그들의 성공은…
최근에는 강화 학습 기반의 사후 훈련 방법들이 특히 Group Relative Policy Optimization (GRPO)에 초점을 맞추어 견고한…
스마트 안경과 같은 웨어러블 디바이스가 Large Multimodal Models (LMMs)를 개인 사용자의 연속적인 1인칭 시각 스트림에 통합함에 따라, 진화…
극단적인 사건과 heavy-tailed 현상을 모델링하는 것은 금융, 기후 과학, safety‑critical 시스템과 같은 분야에서 신뢰할 수 있는 예측 시스템을 구축하는 데 핵심적입니다.
Mixture-of-Experts (MoE)는 computation을 비례적으로 증가시키지 않으면서 model capacity를 확장하지만, 그 방대한 total parameter footprint는 상당한 …
자기 주의(self‑attention) 모듈을 핵심 구성 요소로 하는 트랜스포머는 현대의 대규모 언어 모델 및 파운데이션 모델에서 필수적인 아키텍처가 되었습니다. 이 논문에서는…
대규모 언어 모델 에이전트는 복잡한 작업을 해결하기 위해 외부 스킬에 점점 더 의존하고 있으며, 스킬은 그들의 능력을 확장하는 모듈형 단위로 작동합니다.
최근 3D 생성 모델의 발전으로 이미지‑to‑3D 합성 품질이 급격히 향상되어 고해상도 geometry와 보다 현실적인 appearance를 구현할 수 있게 되었습니다. ...
우리는 유한하고 연결된 그래프 상에서 로봇 집합이 목표 집합으로 이동하도록 하는 익명 다중 에이전트 경로 찾기(MAPF)를 고려한다. 우리는 M...
손글씨 Bangla 복합 문자 인식은 복잡한 문자 구조, 큰 클래스 내 변동성, 그리고 제한된 …
우리는 Shepherd를 소개합니다. 이는 메타‑에이전트 연산을 대상 에이전트에 대한 함수로 형식화하는 함수형 프로그래밍 모델이며, 핵심 연산은 Lean에서 기계화되었습니다.
대형 언어 모델 및 비전-언어 모델은 점점 더 사용자를 대신하여 명령줄 인터페이스(CLI)를 활용하는 에이전트를 구동합니다. 그러나 대부분의 에이전트는...
우리는 전면(all-to-all) 큐비트 연결성을 가진 장치에 대한 Clifford 양자 회로 합성 문제를 고려한다. 우리는 이 작업을 강화 학습(reinforcement learning)으로 접근한다.
이 작업은 제한된 정책 클래스에 사용되는 표준 policy gradient 방법을 재검토한다. 이러한 방법은 suboptimal critical points에 갇히는 것으로 알려져 있다. 우리는 …를 식별한다.
AI 에이전트에 대한 지배적인 패러다임은 에이전트가 계획을 합성하고 사용자 p에 대응하여 몇 초 또는 몇 분 안에 행동을 실행하는 'on-the-fly' 루프이다.
모델 패밀리, 트레이닝 레시피, 그리고 컴퓨트 예산이 점점 표준화됨에 따라, 머신러닝 시스템의 추가적인 향상은 점점 데이터에 의존하게 된다...
이 논문은 사전 학습된 VLA 모델이 성능을 효과적으로 향상시키고 적응 비용을 감소시키는 데 종종 실패한다는 문제를 해결하기 위한 새로운 접근법을 제안한다.
Guardrail Classifiers는 production language models를 유해한 행동으로부터 방어하지만, 테스트에서는 결과가 유망해 보이지만, formal guarant...
Deep research agents, 즉 계획을 세우고, 검색하고, 증거를 평가하며, 장문 보고서를 종합하는 시스템을 훈련시키는 것은 reinforcement learning을 그 …
대형 vision-language 모델은 visual ungroundedness 문제를 겪습니다: 이들은 언어 priors에 전적으로 의존하여 유창하고 자신감 있으며 때로는 정확한 응답을 생성할 수 있습니다.
On-policy distillation은 추론 모델을 훈련하기 위해 밀도 높은 per-token 감독을 제공하지만, 이 신호가 언제 유익한지는 아직 명확하지 않다.
Shielding은 자율 에이전트의 안전을 보장하기 위한 대표적인 모델 기반 기법입니다. Classical shielding은 나쁜 일이 절대 일어나지 않도록 보장하는 것을 목표로 하며…
오픈 월드 객체 카운팅은 여전히 취약합니다: 비전-언어 모델(VLMs)의 급속한 발전에도 불구하고, 사용자가 의도하는 객체를 신뢰성 있게 세는 것은 아직 멀었습니다.
최근 GPU 세대는 FP8과 같은 저정밀 연산을 사용하여 훨씬 높은 FLOPs를 제공한다. 이는 대형 언어 모델(LL…에 성공적으로 적용되었다.
Cross-domain few-shot medical image segmentation (CD-FSMIS)은 모델이 새로운 해부학적 카테고리와 보지 못한 영상 도메인에 동시에 일반화할 수 있도록 요구한다.
전자 건강 기록(EHRs)에서 Automated question answering (QA)은 정확한 evidence retrieval, 충실한 answer generation, 그리고 explicit grounding을 요구한다.
최근 machine learning과 large-scale biological data collections의 발전은 가상 세포(virtual cell), 즉 세포의 computational model을 구축한다는 전망을 다시 부활시켰다.
효율적인 LLM 추론 연구는 주로 각 디코딩 단계의 비용을 줄이는 데 초점을 맞춰 왔으며(예: quantization, pruning, sparse attention 사용), 일반적으로…
이미지나 3D 관찰에서 편집 가능한 CAD 프로그램을 복구하는 것은 AI‑assisted design의 핵심이지만, 기존 평가 방법 때문에 진행 상황을 측정하기가 어렵다.
비록 대형 언어 모델(Large Language Models, LLMs)이 눈부신 진전을 이루었지만, 현재의 preference optimization methods는 방향 일관성을 맞추는 데 여전히 어려움을 겪고 있다.
이 논문은 RUBEN이라는 인터랙티브 도구를 시연하여, 검색 보강된 대형 언어 모델(LLM)의 출력 결과를 설명하기 위한 최소 규칙을 발견한다.
현재 LLM 에이전트는 고립된 API 호출에 능숙하지만 상업용 소프트웨어 자동화의 ‘라스트 마일’에서는 어려움을 겪습니다. 실제 시나리오에서는 도구가…
스파이킹 신경망(SNN)은 스파이킹 활동이 희소하고 전통적인 인공 신경망(ANN)과 비교할 때 에너지 소비를 줄일 수 있다.
Rejection Fine-Tuning (RFT)은 LLM 에이전트를 훈련시키는 표준 방법으로, 성공하지 못한 트래젝터리를 훈련 세트에서 제외합니다. In the context of...
인공지능(AI)과 분산 원장 기술(DLT)의 통합은 성장하는 연구 분야가 되었지만, 기여는 …
기존 Meta-Black-Box Optimization (MetaBBO) 방법은 최적화기를 제어할 때 **어떻게** 탐색할지에 초점을 맞추지만, **어디를** 탐색할지는 크게 간과하고 있다. 우리는 Meta...
Adaptive behavior는 뇌가 서로 다른 contexts 사이를 전환하면서 prior experience의 representations를 유지하도록 요구한다. 재구성 능력은 n...
프로그램 합성에서 핵심 과제는 online library learning이다: 미래 작업 수요에 대한 불확실성 하에서 reusable abstractions를 점진적으로 획득하는 것.
밀리미터파(mmWave) 센싱은 프라이버시를 보호하면서 항상 켜져 있는 엣지 인식을 가능하게 하지만, 그 측정값은 종종 희소하고 시간적으로 불규칙하며 손상될 수 있습니다...
“당신은 비범한 순간에 세상에 들어가고 있습니다,” NVIDIA 창립자이자 CEO인 Jensen Huang이 카네기 멜론...
대형 언어 모델은 모드 붕괴(mode collapse)를 나타내어, 유효한 솔루션 공간을 탐색하지 못하고 동질적인 출력을 생성합니다. 우리는 QD-LLM이라는 프레임워크를 제시합니다, ...
대규모 언어 모델(LLM) 정렬을 위한 Gradient-based preference optimization 방법은 preference collapse가 발생하여, 좁은 행동 모드로 수렴한다 w...
Spike-based encodings은 sparse하고 energy‑efficient하지만, 대부분 probabilistically하게 공식화되어 signal processing 문헌과는 크게 단절되어 있다. ...
!Electricity transmission towers https://cdn.mos.cms.futurecdn.net/KHUetaXQbsmm6z9m5g5Pne.jpg 이미지 출처: Shutterstock FERC에 대한 고소 메릴랜드 사무국...
백그라운드 Voice agents는 실행 비용이 많이 들고 오케스트레이션이 고통스러웠습니다. 이는 모델이 대화를 처리하지 못해서가 아니라, context ceilings 때문에였습니다.