[Paper] Cedalion 튜토리얼: 실험실에서 일상 세계까지 멀티모달 fNIRS 및 DOT의 포괄적 분석을 위한 Python 기반 프레임워크
Functional near-infrared spectroscopy (fNIRS)와 diffuse optical tomography (DOT)은 착용형, 다중모드, 데이터 기반, AI 지원으로 빠르게 발전하고 있습니다.
4623 posts from this source
Functional near-infrared spectroscopy (fNIRS)와 diffuse optical tomography (DOT)은 착용형, 다중모드, 데이터 기반, AI 지원으로 빠르게 발전하고 있습니다.
2025년 12월 4일, Anthropic은 대규모 정성 인터뷰를 수행하기 위한 AI 도구인 Anthropic Interviewer를 출시했으며, 1,250개의 인터뷰로 구성된 공개 데이터셋도 함께 제공했습니다.
우리는 Pantagruel 모델을 공개합니다, 프랑스어 텍스트와 음성을 위한 새로운 self-supervised encoder 모델군입니다. modality-tailored 목표를 예측하는 대신에…
머신러닝 모델이 사회 기반 시설에 점점 더 많이 내재됨에 따라, 편향에 대한 감사를 수행하는 것이 점점 더 중요해지고 있습니다. 그러나 실제 세계에서는…
대규모 언어 모델(Large Language Models, LLMs)이 실제 환경에 점점 더 많이 배포됨에 따라, 정확성만으로는 충분하지 않습니다. 신뢰할 수 있는 배포를 위해서는 tr...을 유지해야 합니다.
대형 언어 모델(LLM) 라우팅은 다양한 작업에 대해 서로 다른 LLM의 특화된 강점을 활용하는 것을 목표로 합니다. 그러나 기존 접근 방식은 일반적으로 …에 초점을 맞춥니다.
Preference tuning은 pretrained language models를 인간의 quality, helpfulness, 또는 safety에 대한 judgments에 맞추어 explicit preference signals를 최적화함으로써 정렬합니다.
최근 deepfake 탐지 방법들은 조작 아티팩트를 드러내기 위해 frequency domain 표현을 점점 더 탐구하고 있으며, 이는 텍스트에서 감지하기 어려운...
Semi-supervised medical image segmentation은 라벨이 제한된 데이터 상황을 해결하기 위한 효과적인 방법입니다. 기존 방법들은 주로 프레임워크에 의존합니다.
우리는 임의의 자세를 가진 인간을 애니메이션이 가능한 다중 레이어 3D 인간 아바타로 분해하여 몸과 의복을 분리하는 새로운 프레임워크를 제안한다. 기존…
탈중앙화 금융(DeFi) 스테이킹은 DeFi 생태계 내에서 가장 두드러진 애플리케이션 중 하나이며, DeFi 프로젝트가 사용자가 토큰을 ...
희소 선형 시스템에 대한 iterative solvers의 높은 계산 비용을 관리하는 것은 scientific computing에서 알려진 도전 과제입니다. 게다가, 과학적 응용…
대규모 언어 모델을 기반으로 하는 Software engineering (SE) agents가 실무에서 점점 더 많이 채택되고 있지만, 이들은 종종 상당한 금전적 비용을 발생시킵니다. 우리는 소개…
취약점은 소프트웨어 시스템을 심각하게 위협하며, 보안 패치를 시기 적절하게 적용하는 것이 공격을 완화하는 데 필수적입니다. 그러나 소프트웨어 벤더는 ...
우리는 AutoMonitor-Bench를 소개합니다. 이는 다양한 작업에 걸쳐 LLM 기반 오작동 모니터의 신뢰성을 체계적으로 평가하도록 설계된 최초의 벤치마크입니다…
현대 소프트웨어 시스템의 복잡성이 증가함에 따라 그 행동을 이해하는 것이 점점 더 어려워지고 있으며, 이는 설명 가능성에 대한 필요성을 촉진하고 있다.
복잡한 AI 시스템의 급속한 도입은 투명성, 보안 및 규제 준수를 보장하기 위한 도구 개발을 앞서고 있습니다. 이 논문에서는...
Search-based testing은 자율 주행 시스템(ADSs)의 안전성과 신뢰성을 평가하는 데 필수적입니다. 그러나 기존 접근 방식은 종종 …
여러 상호 연결 네트워크는 complete graph topology를 기반으로 한다. 중간 규모의 네트워크는 단일 complete graph를 기반으로 할 수 있다. 그러나 대규모...
트랜스포머 기반 언어 모델의 등장은 AI 시스템이 텍스트를 처리하고 생성하는 방식을 재구성했습니다. 소프트웨어 엔지니어링(SE)에서 이러한 모델은 이제 di...
Software Bill of Materials (SBOM)는 소프트웨어 정보를 체계적으로 조직하는 기계가 읽을 수 있는 아티팩트이며, 공급망 투명성을 강화하고 …
Pharo는 의미론적 휴리스틱에 기반한 정교한 completion engine을 제공하며, 이는 lazy architecture 내에서 특정 fetcher들을 조정합니다. 이러한 휴리스틱은 ...
Distributed AI 시스템은 계산, 통신 및 배포 계층 전반에 걸쳐 중요한 메모리 관리 과제에 직면하고 있습니다. RRAM 기반 인메모리 컴퓨팅은 …
우리는 Mesh4D, 단안 4D 메시 재구성을 위한 피드포워드 모델을 제안한다. 동적 객체의 단안 비디오가 주어지면, 우리 모델은 객체의 c...
최근 Quantum Visual Fields (QVFs)는 제공된 2D 또는 3D 신호를 학습할 때 모델 압축성과 수렴 속도에서 유망한 개선을 보여주고 있습니다.
야간 색상 일정성은 저조도 노이즈와 복잡한 조명 조건 때문에 계산 사진학에서 여전히 어려운 문제입니다. 우리는 RL‑A…
이미지에서 깨끗하고 정확한 기하학을 복원하는 것은 로봇공학 및 증강현실에 필수적입니다. 그러나 기존의 geometry foundation models는 여전히 ...
우리는 online multicalibration에 대한 엄격한 하한을 증명하고, marginal calibration과의 information‑theoretic 구분을 확립합니다. 일반적인 설정에서 …
Functional grasping with dexterous robotic hands는 도구 사용 및 복잡한 조작을 가능하게 하는 핵심 역량이지만, 진행은 두 가지 pe...에 의해 제한되어 왔습니다.
Referring Expression Segmentation (RES)와 Comprehension (REC)은 각각 표현에 의해 설명된 객체를 분할하고 탐지하며, Referring Expression…
언어 모델이 점점 더 능력해짐에 따라, 사용자들은 정확한 응답뿐만 아니라 다양한 인간의 선호에 맞는 행동을 제공하기를 기대합니다.
manipulation data의 다양성, 양, 그리고 품질은 효과적인 robot policies를 학습하는 데 중요합니다. 그러나 하드웨어 및 물리적 설정 제한 때문에…
대형 언어 모델은 ‘환각’—의미적 잡음에 의해 유발되는 논리적 불일치에 시달립니다. 우리는 현재 아키텍처가 ‘Metric…’에서 작동한다고 제안합니다.
카메라 제어 생성 비디오 재렌더링 방법, 예를 들어 ReCamMaster와 같은 방법은 눈에 띄는 진전을 이루었습니다. 그러나 단일 뷰에서의 성공에도 불구하고…
인간은 물체가 interaction을 통해 어떻게 움직이거나 변할지를 손쉽게 예측할 수 있다—컵이 들어 올려지는 모습, 칼이 베이는 모습, 뚜껑이 닫히는 모습을 상상하면서.
우리는 machine learning과 artificial intelligence를 사용했습니다: 1) 뉴스와 소셜 미디어를 통해 국가별 평화 수준을 측정하기 위해, 2) on-line 도구를 개발하기 위해...
현실 세계에서 추론과 계획을 할 수 있는 에이전트는 자신의 행동 결과를 예측하는 능력이 필요합니다. world models는 이러한 …
저는 stochastic differential equations (SDEs)와 deep generative models를 통합하여 머신러닝에서 불확실성 정량화를 개선하는 새로운 프레임워크를 제안합니다.
One-shot prediction은 pretrained foundation models를 새로운 작업에 단 하나의 라벨이 있는 예시만 사용하여 빠르게 적응시킬 수 있게 하지만, 원칙적인 불확실성 정량화가 부족합니다.
우리는 textsc{MineNPC-Task}를 제시한다. 이는 사용자 제작 벤치마크이자 평가 하니스로, 메모리 인식형·혼합 주도형 LLM 에이전트를 오픈 월드 Minecraft에서 테스트하기 위한 것이다....
Large Language Models (LLMs)은 tool calling과 tool usage에서 놀라운 능력을 보여왔지만, 잘못된 tool을 선택하는 hallucinations 문제를 겪는다.
MoE3D는 깊이 경계를 선명하게 하고 기존 피드포워드 3D 모델에서 발생하는 flying-point artifacts(빨간색으로 강조된)를 완화하도록 설계된 mixture-of-experts 모듈이다.
보편적인 AI는 점점 더 엄격한 자원 제약 하에서 저지연 및 에너지 효율적인 계산을 제공하는 온‑디바이스 학습 시스템에 의존하고 있다. Liq...
주식 시장 가격 예측은 금융, 통계, 경제학이 교차하는 영역에 의존하는 중요한 학제간 연구 분야입니다. Forecas...
Large vision-language models (VLMs)은 매우 높은 성능을 가지고 있지만, 시각적 증거보다 텍스트 프롬프트를 선호함으로써 종종 환각을 일으킵니다. 우리는 이 실패 모드를 연구합니다...
본 연구에서는 Johns Hopkins Fall Risk Assessment Tool (JHFRAT)에서의 낙상 위험 예측을 추가적인 임상적으로 의미 있는 측정과 더 잘 맞추는 것을 목표로 합니다.
Entity linking(텍스트에서 모호한 언급을 지식 베이스의 엔터티에 매핑하는 작업)은 지식 그래프 구축, 질문 응답과 같은 작업에서 기본적인 단계이다.
연구자들이 문헌 검토나 가설 생성과 같은 자율 작업에 large language models를 배치할 때, 컴퓨팅 비용이 빠르게 누적됩니다. A...