[Paper] 대형 언어 모델 훈련에서 다운스트림 메트릭의 스케일링 특성 재검토
Large Language Models (LLMs)의 스케일링 법칙은 전통적으로 사전학습 손실과 같은 프록시 메트릭에 초점을 맞추지만, 다운스트림 작업 성능을 예측하는 것은 …
Large Language Models (LLMs)의 스케일링 법칙은 전통적으로 사전학습 손실과 같은 프록시 메트릭에 초점을 맞추지만, 다운스트림 작업 성능을 예측하는 것은 …
Retrieval-Augmented Generation (RAG)은 검색된 증거에 기반해 출력을 근거함으로써 대형 언어 모델(LLMs)의 사실성을 향상시키지만, 충실도 실패…
시각적 추론은 어려운 작업으로, 정확한 객체 그라운딩과 복잡한 공간 관계에 대한 이해가 모두 필요합니다. 기존 방법들은 두 가지 진영으로 나뉩니다: ...
회전 불변성은 UAV 항공 이미지에서 정밀한 객체 수준 분할에 필수적이며, 대상은 임의의 방향을 가질 수 있고 미세한 …
산업 유지보수는 Internet of Things와 edge computing에 의해 변혁되고 있으며, 실시간 적응형 결정을 요구하는 연속적인 데이터 스트림을 생성합니다.
우주 AI의 부상이 재난 감지, 국경 감시, 기후 모니터링 등과 같은 애플리케이션을 통해 정부와 산업을 재구성하고 있으며, …
Vision-language models (VLMs)은 원격 탐사를 위한 강력한 범용 도구로 부상하고 있으며, 다양한 작업에 걸쳐 정보를 통합하고 ...
실제 데이터셋은 종종 진화하는 데이터 분포를 특징으로 하는 시간적 동역학을 나타냅니다. 이러한 현상을 무시하면, 일반적으로 concept ...
대형 언어 모델(LLMs)은 최근 고품질의 표형 합성 데이터를 생성하는 데 놀라운 성능을 보여주었습니다. 실제로, 두 가지 주요 접근…
Image captioning은 시각 장애인을 돕고, 콘텐츠 관리 시스템을 개선하며, 인간‑컴퓨터 상호작용을 향상시키는 등 많은 분야에서 필수적입니다.
LLM 에이전트는 복잡한 인터랙티브 작업에 널리 배치되어 있지만, 프라이버시 제약으로 인해 동적 환경에서의 중앙 집중식 최적화와 공동 진화를 제한하는 경우가 많다.
이 기사에서는 LOF를 세 가지 간단한 단계, 즉 거리와 이웃, 도달 가능 거리, 최종 LOF 점수를 통해 탐구합니다. 작은 데이터셋을 사용하여 우리는 살펴봅니다.