[Paper] MoE3D: 3D 재구성을 위한 Mixture-of-Experts 모듈
MoE3D는 깊이 경계를 선명하게 하고 기존 피드포워드 3D 모델에서 발생하는 flying-point artifacts(빨간색으로 강조된)를 완화하도록 설계된 mixture-of-experts 모듈이다.
MoE3D는 깊이 경계를 선명하게 하고 기존 피드포워드 3D 모델에서 발생하는 flying-point artifacts(빨간색으로 강조된)를 완화하도록 설계된 mixture-of-experts 모듈이다.
보편적인 AI는 점점 더 엄격한 자원 제약 하에서 저지연 및 에너지 효율적인 계산을 제공하는 온‑디바이스 학습 시스템에 의존하고 있다. Liq...
주식 시장 가격 예측은 금융, 통계, 경제학이 교차하는 영역에 의존하는 중요한 학제간 연구 분야입니다. Forecas...
Large vision-language models (VLMs)은 매우 높은 성능을 가지고 있지만, 시각적 증거보다 텍스트 프롬프트를 선호함으로써 종종 환각을 일으킵니다. 우리는 이 실패 모드를 연구합니다...
본 연구에서는 Johns Hopkins Fall Risk Assessment Tool (JHFRAT)에서의 낙상 위험 예측을 추가적인 임상적으로 의미 있는 측정과 더 잘 맞추는 것을 목표로 합니다.
Entity linking(텍스트에서 모호한 언급을 지식 베이스의 엔터티에 매핑하는 작업)은 지식 그래프 구축, 질문 응답과 같은 작업에서 기본적인 단계이다.
연구자들이 문헌 검토나 가설 생성과 같은 자율 작업에 large language models를 배치할 때, 컴퓨팅 비용이 빠르게 누적됩니다. A...
대형 언어 모델(LLMs)은 텍스트 기반 코드 자동화를 혁신했지만, 그래프 지향 엔지니어링 워크플로우에서의 잠재력은 아직 충분히 탐구되지 않았다....
대규모 언어 모델(LLMs)의 급속한 발전은 향후 모델을 훈련하기 위해 합성 데이터를 사용하는 것에 대한 관심이 증가하고 있습니다. 그러나 이는 자기‑c…
Chain-of-thought (CoT) reasoning은 비디오 이해 작업에서 멀티모달 대형 언어 모델을 위한 강력한 도구로 부상했습니다. 그러나 그 필요성과 …
3D 환경에서의 Embodied question answering (EQA)은 종종 여러 시점에 걸쳐 분산되고 부분적으로 가려진 컨텍스트를 수집해야 합니다. Ho...
기존의 long-term personalized dialogue systems는 무한한 interaction streams와 제한된 context constraints를 조화시키는 데 어려움을 겪으며, 종종 memory에 굴복한다.
Natural Language Inference (NLI)은 자연어 이해를 위한 언어 모델을 평가하는 중요한 작업이었지만, 논리적 특성은…
복잡한 추론을 위한 대형 언어 모델(LLMs)은 높은 계산 비용과 지연 시간 때문에 종종 제한을 받으며, 자원 효율적인 소형 언어 모델(SL...
Document Question Answering (DocQA)는 주어진 문서에 근거한 질문에 답하는 데 초점을 맞추지만, 기존 DocQA 에이전트는 효과적인 도구 활용과 라…
작물 질병 분석을 위한 Visual Question Answering은 정확한 시각 이해와 신뢰할 수 있는 language generation이 필요합니다. 이 작업은 lightweight vi...
LLM 기반 에이전트 애플리케이션은 복잡하고 다단계 작업을 점점 더 자동화하고 있지만, 이들을 효율적으로 제공하는 것은 이질적인 구성 요소 때문에 여전히 어려운 과제입니다...
과학 장비를 설계할 때는 종종 계산 비용이 많이 드는 physics simulations를 사용하여 크고 매우 제한된 설계 공간을 탐색해야 합니다. 이러한...
Epilepsy는 재발성 비자극성 발작을 특징으로 하는 만성 신경학적 장애로, 전 세계적으로 5천만 명 이상에게 영향을 미치며, 상당한 위험을 초래합니다.
Epilepsy는 재발하는 비자극성 발작을 특징으로 하는 만성 신경학적 장애이며, 전 세계적으로 5천만 명 이상에게 영향을 미치고, 상당한 위험을 초래합니다.
새로운 하이브리드 최적화 접근법은 엣지 디바이스가 순전파만을 사용하여 vision-language 모델을 미세 조정할 수 있게 하며, 기존 방법보다 최대 7% 높은 정확도를 달성합니다.
프라이버시 보호 연합 평균화는 연합 학습에서 클라이언트 프라이버시를 보호하기 위한 핵심 접근 방식입니다. 본 논문에서는 이 문제를 비동기 환경에서 연구합니다.
다양한 구성에 대한 벤치마크가 제안되어 AVX / NEON intrinsic functions의 능력과 한계를 일반적인 개발 프로젝트 맥락에서 탐구합니다.
Moore's Law에 의해 트랜지스터의 차원이 나노미터 규모까지 축소되었습니다. 고급 quantum transport (QT) solvers가 정확히 …