[Paper] 다중 대비 MRI 기반 영아 뇌 딥 세그멘테이션
자기공명영상(MRI)의 분할은 해부학적 구조를 구분함으로써 인간 뇌 발달 분석을 용이하게 합니다. 그러나 영아와 ...
자기공명영상(MRI)의 분할은 해부학적 구조를 구분함으로써 인간 뇌 발달 분석을 용이하게 합니다. 그러나 영아와 ...
최근 통합된 멀티모달 대형 언어 모델(MLLMs)은 인상적인 능력을 보여주었으며, 향상된 텍스트-투-…
단일 카메라 Mannequin-Challenge (MC) 비디오에서 high-fidelity frozen 3D scenes를 합성하는 것은 standard dynamic scene reconstruction과는 구별되는 고유한 문제이다.
Reward models는 인간 선호와 vision-language 시스템을 정렬하는 데 핵심적이지만, 현재 접근 방식은 hallucination, 약한 visual grounding 등으로 고통받고 있다...
우리는 ShadowDraw를 소개합니다. 이 프레임워크는 일반적인 3D 객체를 그림자 드로잉 구성 예술로 변환합니다. 3D 객체가 주어지면, 우리 시스템은 장면 …
표준 확산은 푸리에 계수의 무작위 크기와 무작위 위상을 가진 가우시안 노이즈를 사용해 데이터를 손상시킵니다. 무조건적이거나 …에 효과적이지만
대규모 언어 모델(LLMs)에서의 장기 컨텍스트 추론은 체인‑오브‑쓰레드(Chain‑of‑Thought, CoT) 추론을 통해 인지 능력의 향상을 입증했습니다. 훈련…
All-in-One Image Restoration (AiOIR) 작업은 종종 다양한 열화를 포함하며, 이는 강인하고 다재다능한 전략을 필요로 합니다. 그러나 대부분의 기존 접근 방식은 …
Video generation models는 빠르게 발전하고 있지만, 여전히 의미적 분기나 반복적인 고수준 작업을 요구하는 복잡한 비디오 출력에서 어려움을 겪을 수 있습니다.
최근 구조화된 텍스트 번역에 관한 연구는 문장 수준에 국한되어 있으며, 복잡한 문서 수준의 XML이나 HTML을 효과적으로 처리하는 데 어려움을 겪고 있다.
최근 몇 년간 AI 생성 이미지(AIGI)를 위한 이미지 품질 평가(IQA)가 급속히 발전했지만, 기존 방법들은 주로 초상화와 ar...
비록 diffusion models가 현재 생성 모델링에서 중심적인 위치를 차지하고 있지만, 입문서에서는 일반적으로 Euclidean 데이터를 가정하고 그들의 con...
실제 물리적 과정은 임의의 변동성을 생성하지 않는다: 그들의 신호는 compact하고 low-variability인 functional space의 부분집합에 집중한다. This ...
Large Language Model(LLM) 인퍼런스는 막대한 컴퓨팅과 에너지를 요구하여 도메인 특화 작업을 비용이 많이 들고 지속 가능하지 않게 만든다. foundation models가 계속 스케일링함에 따라…
보건 의료가 확장 가능하고 신뢰할 수 있는 clinical decision support를 위해 AI를 점점 더 활용함에 따라, 모델 추론의 신뢰성을 보장하는 것이 여전히 중요한 과제로 남아 있습니다.
Kubernetes는 소프트웨어의 빠른 배포를 촉진하는 도구입니다. 불행히도, Kubernetes를 구성하는 것은 오류가 발생하기 쉽습니다. 구성 결함은 ...
Quantum Approximate Optimization Algorithm (QAOA)는 근시일 양자 프로세서에서 조합 최적화 문제를 해결하기 위한 선도적인 접근 방식입니다. 어떻게…
Modern Large Language Models는 긴 Chain of Thoughts를 통해 인상적인 추론 능력을 달성하지만, 추론 중에 상당한 computational cost가 발생합니다.
스파이킹 뉴럴 네트워크는 이벤트 구동 연산, 희소 활성화, 그리고 하드웨어 효율성을 제공하지만, 학습은 종종 수렴이 느리고 안정성이 부족합니다. 우리는 ...
이 확장 초록은 Self-Explaining Contrastive Evidence Re-Ranking (CER)이라는 새로운 방법을 소개합니다. 이 방법은 사실 증거를 중심으로 검색을 재구성합니다 by f...
표현력이 풍부한 탐색 공간에서의 Neural architecture search (NAS)는 계산적으로 어려운 문제이지만, 자동으로 복잡한 …를 발견할 잠재력을 가지고 있다.
대형 언어 모델(Large Language Models, LLMs)이 수동적인 응답자에서 자율 에이전트로 진화함에 따라 학습 패러다임에 근본적인 전환이 필요합니다—정적…
테라헤르츠(THz) 통신과 연합 학습(FL)의 융합은 초고속 분산 학습을 약속하지만, 현실적인 광대역 …
대규모 언어 모델(LLMs)은 다양한 언어 관련 작업에서 놀라운 잠재력을 보여주지만, 그들이 더 깊은 언어적 특성을 포착하는지 여부는…