[Paper] 언제 멈출지 학습: Adaptive Latent Reasoning via Reinforcement Learning
Latent reasoning은 Transformer 언어 모델에서 새로운 개발을 의미하며, chain-of-thought에 비해 추론 길이를 압축하는 잠재력을 보여주었습니다.
Latent reasoning은 Transformer 언어 모델에서 새로운 개발을 의미하며, chain-of-thought에 비해 추론 길이를 압축하는 잠재력을 보여주었습니다.
동기화된 오디오-비주얼 콘텐츠의 합성은 생성 AI에서 핵심 과제이며, 오픈소스 모델들은 견고한 오디오-비디오 정렬에 어려움을 겪고 있습니다.
적대적 공격은 학습 기반 3D 포인트 클라우드 모델에 중대한 위협을 가하며, 보안에 민감한 응용 분야에서 그 신뢰성을 심각하게 저해합니다.
언어 모델이 전문가 상황에서 AI 정체성을 신뢰할 수 있게 공개하지 못한다면, 사용자는 그 모델의 역량 한계를 신뢰할 수 없습니다. 이 연구는 자기 투명성...
대형 언어 모델(LLM)은 종종 바뀐 형태의 질문에 답할 때 일관되지 않은 행동을 보이며, 이는 깊은 이해보다는 표면 수준의 패턴에 의존하고 있음을 시사한다.
Illumination inconsistency는 다중 뷰 3D 재구성에서 근본적인 도전 과제입니다. 햇빛 방향, 구름 양, 그리고 그림자의 변동은 일관성을 깨뜨립니다.
이 연구는 시간적 불규칙성, 샘플링...와 같은 문제들을 해결하기 위해 다중 스케일 시간 정렬 네트워크(Multi-Scale Temporal Alignment Network, MSTAN)를 기반으로 한 위험 예측 방법을 제안한다.
Vision Language Action 모델은 대규모 사전 학습된 비전 및 언어 표현을 활용함으로써 범용 로봇 조작을 크게 발전시켰습니다…
블록체인 보안은 채굴자(운영자)가 프로토콜을 벗어나 수익을 늘리려는 selfish mining에 의해 위협받습니다. selfish mining은 악화됩니다.
Human activity recognition (HAR) from inertial sensors is essential for ubiquitous computing, mobile health, and ambient intelligence. Conventional deep models ...
Reward feedback learning (ReFL)은 인간 선호에 맞춰 이미지 생성을 정렬하는 데 효과적인 것으로 입증되었습니다. 그러나 비디오 생성으로 확장하는 데는 ...
멀티레벨 빠른 다중극 알고리즘(MLFMA)에서 근거리(P2P) 연산자는 메모리 지역성 부족으로 인해 GPU에서 성능 병목 현상이 됩니다. 이 작업은 …