[Paper] 비주얼 언어 모델의 인코딩 능력 평가: 비일상적 행동을 이용하여
우리는 UAIT(Uncommon-sense Action Image-Text) 데이터셋을 제안한다. 이는 시각 언어 모델의 의미 이해 능력을 테스트하기 위해 설계된 새로운 평가 벤치마크이다.
우리는 UAIT(Uncommon-sense Action Image-Text) 데이터셋을 제안한다. 이는 시각 언어 모델의 의미 이해 능력을 테스트하기 위해 설계된 새로운 평가 벤치마크이다.
복잡하고 비구조적인 환경에서 견고한 휴머노이드 하이킹을 달성하려면 반응성 프로프리오셉션에서 능동적 퍼셉션으로 전환해야 합니다. 그러나, ...
본 연구에서는 대규모 선형 계획(LP) 문제를 해결하기 위한 Primal-Dual Hybrid Gradient (PDHG) 알고리즘의 분산 구현을 제시한다.
최근 대형 언어 모델(LLMs)의 발전은 소프트웨어 엔지니어링 분야에서 광범위한 평가를 촉진했습니다. 그러나 대부분의 기존 연구는 코드 수준의 t...
본 연구는 현대 NVIDIA GPU에서 사용 가능한 주요 격리 메커니즘인 MPS, MIG, 그리고 최근의 Green Contexts를 분석하여 예측 가능한 추론 시간을 보장합니다...
Ant Colony Optimization (ACO)는 경로 계획에 널리 적용되는 대표적인 swarm intelligence 알고리즘입니다. 그러나 전통적인 ACO 방법은 종종 s...
배경: 민감한 분야에서 AI 및 ML 기반 시스템이 널리 채택되면서 그들의 공정성에 대한 심각한 우려가 제기되고 있습니다. 많은 방법들이 제안되었습니다...
인터랙티브하고 자율적인 AI 시스템의 급속한 발전은 우리가 에이전시 시대에 진입했음을 나타냅니다. 복잡한 에이전시 작업에 대한 에이전트를 훈련하고 평가하는 것은 …
대규모 언어 모델(LLMs)의 급속한 발전과 이들의 자율 에이전트 시스템에의 통합은 문서 a…에 대한 전례 없는 기회를 창출했습니다.
시각 기반 TinyML 모델로 구동되는 자율 nano-drones는 광범위한 적용 가능성 덕분에 주목받고 있는 새로운 기술입니다.
Square Kilometre Array Observatory (SKAO)는 방대한 규모와 데이터 복잡성으로 인해 전례 없는 기술적 도전에 직면해 있습니다. 이 논문은 …
우리는 OpenTinker를 소개합니다. 이는 대형 언어 모델(LLM) 에이전트의 강화 학습(RL)을 위한 인프라스트럭처로, 알고리즘 간의 관심사 분리를 중심으로 구축되었습니다.