[Paper] 구조-기능 뇌 표현 학습을 위한 Multi-Scale Adaptive Graph Attention for Cognitive Insight
뇌 구조와 기능이 어떻게 상호작용하는지를 이해하는 것은 지능을 설명하는 데 핵심이며, 그러나 구조와 기능을 동시에 모델링하는 것은 구조와 기능이…
4486 posts from this source
뇌 구조와 기능이 어떻게 상호작용하는지를 이해하는 것은 지능을 설명하는 데 핵심이며, 그러나 구조와 기능을 동시에 모델링하는 것은 구조와 기능이…
Surgical video understanding은 컴퓨터 보조 수술에 필수적이지만, 기존의 surgical foundation models는 데이터 규모가 제한되어 있습니다,…
외과 수술은 본질적으로 복잡하고 위험하며, 광범위한 전문 지식과 지속적인 집중이 필요하여 변화하는 수술 중 상황을 잘 파악해야 합니다. Computer...
물질 사용 시작(SUI) 위험이 있는 청소년을 조기에 식별하는 것은 중요하지만 어려운 일입니다. 대부분의 예측 변수는 connectivity를 정적이거나 횡단적인 것으로 취급하기 때문입니다…
최근 추론 대형 언어 모델(LLM)의 발전은 주로 사전 사고에 의존해 왔으며, 여기서 추론은 최종 답변 전에 이루어집니다. 그러나 이것은 a...
효과적인 협업은 팀이 Socially Shared Regulation of Learning (SSRL)을 통해 복잡한 인지 및 감정 상태를 관리하도록 요구합니다. Physiological syn...
이 논문은 다국어 저널리즘에서 문장 수준의 텍스트 재사용을 조사하여, 재사용된 콘텐츠가 기사 내에서 어디에 나타나는지를 분석합니다. 우리는 weakly supervised …
산업에서 소프트웨어가 규모와 복잡성이 커짐에 따라, 기업이 생성하고 사용하는 엔지니어링 데이터의 양도 증가합니다. 이상적으로, 이 데이터는 f...
LLM 기반 코딩 에이전트는 에이전트 기능을 확장하는 사전 패키징된 instruction sets인 skills에 의존하지만, 컨텍스트에 삽입되는 skill content의 각 token은…
자동화된 방사선 보고서 요약은 장황한 소견을 간결한 임상 인상으로 압축하는 것을 목표로 하지만, 기존 멀티모달 모델은 종종 ...
FLEURS는 100개 이상의 언어에 대해 n-way parallel speech를 제공하지만, 북부 쿠르드어는 그 중 하나가 아니어서 자동 음성 인식 및 …에 대한 benchmarking을 제한합니다.
신경망에서 더 나은 예측 정확도와 높은 실행 성능에 대한 요구가 계속해서 증가하고 있습니다. 대규모 언어 모델(Large Language Models)의 등장과 성공은…
데이터센터는 디지털 사회에 필수적이지만, 전 세계 전력의 상당 부분을 소비하고 있으며 수요는 증가할 것으로 예상됩니다. 그들의 ...
Particle Swarm Optimization (PSO) 및 Evolutionary Algorithms (EA)와 같은 메타휴리스틱 알고리즘은 해 공간을 탐색하는 데 뛰어나지만, 메커니즘이 부족합니다…
Machine Learning (ML) 모델, 특히 foundation models의 가용성이 증가함에 따라, 이들 모델은 다양한 downstream applications에 활용될 수 있게 되었습니다, s...
해커톤은 시간 제한이 있는 협업 이벤트로, 주로 소프트웨어 제작을 목표로 합니다. 해커톤은 과거에도 연구된 바 있지만, 기존 연구는 …에 초점을 맞추었습니다.
항상 켜져 있는 엣지 카메라는 연속적인 비디오 스트림을 생성하며, 중복된 프레임이 정답 결과를 top‑k 검색에서 밀어내어 교차 모달 검색 성능을 저하시킵니다. T...
Scratch은 전 세계에서 11억 5천만 개가 넘는 프로젝트가 생성될 정도로 초보자에게 가장 인기 있는 프로그래밍 환경입니다. 전통적인 언어와 달리, 정확성은…
양자 회로를 컴파일하는 것은 양자 컴퓨팅에서 주요 병목 현상이며, 몇 년 안에 요구되는 규모를 고려하면 실행 시간이 실현 불가능할 정도로 길어질 가능성이 높습니다. 기술…
우리는 분산 의사결정 작업에 대한 세 가지 분류 체계를 고려한다: 무한 계산 및 인증서를 사용하는 경우, Balliu, D'Angelo, Fraigniaud 등이 정의한…
데이터플로우 네트워크에서 클록 게이팅 및 파워 게이팅과 같은 동적 전력 관리 전략을 도입하면 상당한 에너지 …
연합 학습(FL)에서의 백도어 공격은 대부분 합성 코너 패치나 분포 외(OOD) 패턴을 사용해 평가되며, 이는 실제 상황에서 나타날 가능성이 낮다.
현대 AI의 빠른 속도는 전통적인 산업 시스템을 방대하고 지능적이며 잠재적으로 무인 자율 운영 환경으로 급속히 변모시키고 있습니다.
비선형 계산은 다양한 정보 처리 작업에 필수적입니다. 광학 구현은 수동적인 빛 전파를 활용할 수 있기 때문에 매력적입니다.
human motion의 합성은 빠르게 발전했지만, 현실적인 hand motion과 bimanual interaction은 아직 충분히 탐구되지 않았다. Whole-body models는 종종 fine-gr…
3D human mesh estimation을 위한 라벨이 있는 데이터셋을 확보하는 것은 depth ambiguities와 monocular 이미지에서 3D geometry를 annotating하는 고유한 어려움 때문에 어렵습니다.
현대 Text-to-Image (T2I) diffusion 모델은 놀라운 의미 정렬을 달성했지만, 종종 상당한 다양성 부족으로 고통받으며 특정 결과에 수렴합니다.
조작 중 인간 손과 물체에 대한 정확한 3D 이해는 egocentric computer vision에서 여전히 중요한 도전 과제입니다. 기존 hand‑object …
시각 장면 생성(visual scene generation) 분야에서 엄청난 진전이 이루어져 이제 단일 이미지를 탐색 가능한 3D 세계로 변환하지만, 사운드 없이는 immersion이 완전하지 않습니다. 우리는 ...
재귀 네트워크는 온라인으로 적응하기 위해 Jacobian 전파가 필요하지 않습니다. 은닉 상태는 이미 순방향 패스를 통해 시간적 크레딧을 전달합니다; 즉각적인 deriva...
선형 표현 가설은 신경망 활성화가 고수준 개념을 선형 혼합으로 인코딩한다는 것을 주장한다. 그러나 superposition 하에서는 이것은 …
대규모 언어 모델에 대한 스케일링 법칙은 옵티마이저와 파라미터화에 크게 의존합니다. 기존의 하이퍼파라미터 전이 법칙은 주로 f...
우리는 ParaSpeechCLAP를 소개합니다. 이 듀얼-인코더 contrastive model은 speech와 text style captions를 공통 embedding space에 매핑하여 다양한 범위의…를 지원합니다.
AI-augmented ecosystems(여러 AI 구성 요소가 공유 데이터와 인프라를 통해 상호 작용하는 상호 연결된 시스템) 은 건축적 ...
우리는 복잡한 최적화 작업인 칩 플로어플래닝에서 매크로 배치를 위해 Vision-Language Models (VLMs)를 사용하는 것을 제안합니다. 이 작업은 최근 유망한 발전을 보여주고 있습니다.
로봇 매핑 시스템은 일반적으로 로봇 자체의 센서와 카메라를 사용하여 metric-semantic scene representations를 구축하는 접근 방식을 취합니다. 그러나 이러한 'first person'…
현대 분산 시스템은 이기종 서비스, 서로 다른 스키마 버전을 가진 REST API, GraphQL 엔드포인트, 그리고 독점적인 페이로드를 가진 IoT 디바이스를 통합합니다.
Vision-language models (VLMs)은 다양한 작업에서 인상적인 능력을 보여주었으며, 이러한 모델을 활용해 로봇 학습을 감독하려는 노력을 촉진하고 있습니다.
Flow‑GRPO는 reinforcement learning을 flow models에 성공적으로 적용하지만, 모든 단계에 걸쳐 uniform credit assignment를 사용합니다. 이는 temporal structure를 무시합니다…
우리는 오프라인 데이터로부터 정책 학습을 위한 cross-fitted debiasing device를 제안한다. 결과적인 학습 원칙의 핵심적인 결과는 sqrt N regret even for ...
Facial recognition systems는 법 집행 및 보안 분야에서 점점 더 많이 배치되고 있으며, 여기서 algorithmic decisions는 상당한 사회적 결과를 초래할 수 있습니다…
Federated Learning (FL)은 대규모 분산 데이터를 활용하면서 프라이버시를 보호할 수 있는 능력 때문에 점점 더 널리 채택되고 있습니다. 그러나, ...
심리 척도 개발은 전통적으로 광범위한 전문가 참여, 반복적인 수정, 대규모 파일럿 테스트를 거쳐 psychometric …
임의의 Δ에 대해, (k+1)(k+2) ≤ Δ 를 만족하는 최대 정수 k를 k_Δ라 하자. 우리는 정수 k < k_Δ가 주어졌을 때, 유효한 …을 계산하는 분산 LOCAL 알고리즘을 제시한다.
Generative AI의 새로운 배포는 단일 trusted server가 아니라 분산되고 heterogeneous한 edge devices 전반에 걸쳐 inference를 점점 더 실행하고 있다....
멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 입력 충실도를 확장함으로써 더 강력한 시각 이해를 달성하지만, 그 결과 발생하는 visual token의 증가로 인해 공동 …
반성적 글쓰기는 학생들의 메타인지 기술 발달을 지원하는 것으로 알려져 있지만, 학습자들은 깊은 반성에 참여하는 데 어려움을 겪어 학습을 제한한다.
매 4년마다, PISA 시험은 OECD에 의해 전 세계 청소년 학생들의 지식을 테스트하고 교육 시스템을 비교할 수 있도록 시행됩니다. H...