[Paper] 무한 폭 및 깊이 한계에 관한 Predictive Coding Networks
Predictive coding(PC)은 표준 backpropagation(BP)에 대한 생물학적으로 타당한 대안으로, 네트워크 활성에 대한 에너지 함수를 최소화합니다.
3058 posts from this source
Predictive coding(PC)은 표준 backpropagation(BP)에 대한 생물학적으로 타당한 대안으로, 네트워크 활성에 대한 에너지 함수를 최소화합니다.
대규모 이질적인 water distribution systems (WDS)의 microbiological safety를 보장하려면 일반적으로 적절한 수준의 disinfectant residual을 관리해야 합니다.
멀티모달 대형 언어 모델(MLLMs)은 빠르게 발전했지만, 의료 분야에서의 채택은 도메인 커버리지, 모달리티 정렬, ...에 의해 제한됩니다.
기존의 신경망 활성화 분석 접근법인 PCA와 sparse autoencoders와 같은 방법은 강력한 구조적 가정에 의존합니다. Generative models offe...
AI agents가 작업을 성공할지를 예측할 수 있을까? 우리는 작업 전, 작업 중, 작업 후에 success probability estimates를 이끌어냄으로써 agentic uncertainty를 연구한다.
본 논문은 능동 자기 부양 시스템을 위한 데이터 기반 최적 미분 피드백 컨트롤러의 설계 및 구현을 제시한다. A direct, mod...
Tokenization은 터키어와 같이 생산적인 교착이 특징인 형태학적으로 풍부한 언어(morphologically rich languages, MRLs)에서 neural language modeling을 위한 중요한 설계 선택입니다.
unsupervised representations를 의미론적으로 의미가 있고 실행마다 안정적인 방식으로 학습하는 것은 현대 representation learning에서 여전히 핵심 과제이다.
딥 뉴럴 네트워크의 분류 성능은 대규모이며 정확하게 주석이 달린 데이터셋에 대한 접근에 크게 의존합니다. 그러나 의료 영상 분야에서는 이러한 데이터셋을 확보하는 것이…
현실적인 sound propagation은 가상 장면에서 몰입을 위해 필수적이지만, 물리적으로 정확한 wave-based simulations는 여전히 계산 비용이 너무 커서 실용적이지 않다.
범용 AI 아키텍처가 예측을 넘어 우주를 지배하는 물리 법칙을 발견할 수 있을까? 진정한 지능은 ‘world models’에 의존한다 — ca...
비전 대형 언어 모델(VLLM)의 비전 능력은 언어 능력에 비해 지속적으로 뒤처져 왔습니다. 특히, 수많은 벤치마크 stu...
완전 비지도 세분화 파이프라인은 가장 눈에 띄는 객체를 단순히 찾으려고 합니다(그 객체가 존재한다면). 그 결과, 문헌에 보고된 대부분의 방법은...
베이지안 최적 실험 설계(BOED)는 실험의 기대 정보 이득(EIG)을 최대화하려고 합니다. 이는 likelihood estimate가 필요하며, 이는 ...
멀티모달 디퓨전 트랜스포머(MMDiTs)는 텍스트‑이미지 생성에서 텍스트와 이미지 브랜치를 별도로 유지하고, 양방향 정보 흐름을 통해 ...
Transformer 아키텍처의 부드러움은 일반화, 학습 안정성 및 적대적 견고성 측면에서 광범위하게 연구되어 왔습니다. Ho...
대규모 텍스트-이미지 확산 모델이 시각적 품질을 지속적으로 향상시키고 있지만, 그 규모가 커짐에 따라 최첨단 모델 간의 격차가 확대되고 있습니다.
대형 언어 모델(LLMs)은 특히 복잡한 작업에서 미묘하지만 치명적인 버그가 포함된 코드를 자주 생성합니다. 기존 자동 복구 방법은 일반적으로 …에 의존합니다.
Instructional video editing은 텍스트 프롬프트만을 사용하여 입력 비디오에 편집을 적용함으로써 직관적인 natural-language control을 가능하게 합니다. 빠른 진행에도 불구하고, 대부분의 m...
우리는 대형 언어 모델(LLM)의 다목적 정렬에서 지속적인 실패 모드를 연구한다: 훈련이 목표의 일부 집합에 대해서만 성능을 향상시킨다…
멀티턴 탈옥은 안전 정렬 챗봇에 대한 실제 위협 모델을 포착하며, 단일턴 공격은 단지 특수한 경우에 불과합니다. 그러나 기존 접근 방식은 …
인지 과학에서 중심적인 질문은 개념적 표현이 일반화를 지원하기 위해 공유된 매니폴드로 수렴하는지, 아니면 orthogo...
임베디드 펌웨어에서 소프트웨어 품질을 보장하는 것은 매우 중요합니다, 특히 기능 안전 표준(ISO 26262) 준수가 요구되는 안전‑중요 분야에서는 …
모호성은 대형 언어 모델(LLMs)의 자연어 이해에 지속적인 도전을 제기합니다. lexical ambiguity가 어떻게 해결될 수 있는지를 더 잘 이해하기 위해…