ai — Page 79 | EUNO.NEWS

1개월 전 · ai

[Paper] 탐색 vs. 활용: 클리핑, 엔트로피, 그리고 Spurious Reward를 통한 RLVR 재고찰

이 논문은 검증 가능한 보상(RLVR)을 갖는 강화 학습에서 exploration‑exploitation trade‑off를 조사하며, 이는 추론 능력을 향상시키기 위한 프레임워크이다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai

[Paper] Posterior Behavioral Cloning: 효율적인 RL 파인튜닝을 위한 BC 정책 사전학습

로봇공학에서 언어에 이르기까지 다양한 분야에서 표준적인 관행은 먼저 대규모 시연 데이터셋으로 정책(policy)을 사전학습(pretrain)하고, 그 다음에 이 정책을 파인튜닝(fin... )

#research #paper #ai #machine-learning
1개월 전 · ai

[Paper] SFTok: 이산 토크나이저의 성능 격차 해소

최근 멀티모달 모델의 발전은 고해상도 이미지 생성에서 이미지 토큰화의 핵심적인 역할을 강조합니다. 이미지를 압축하여 컴팩트한 la...

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] 추론에서 움직임으로 흐르며: Egocentric Human Interaction Videos로부터 3D Hand Trajectory Prediction 학습

3D hand trajectory prediction에 관한 기존 연구들은 움직임을 의미론적 감독과 분리하는 데이터셋과 추론을 약하게 연결하는 모델에 의해 제한됩니다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] Post-Hoc Watermarking과 Language Model Rephrasing의 성능은 얼마나 좋은가?

Generation-time text watermarking은 AI 생성 콘텐츠의 추적성을 위해 텍스트에 통계적 신호를 삽입합니다. 우리는 LLM이 ...인 *post-hoc watermarking*을 탐구합니다.

#research #paper #ai #nlp
1개월 전 · ai

[Paper] 인컨텍스트 대수

우리는 토큰이 의미가 결정되는 변수인 시퀀스에서 산술을 해결하도록 트랜스포머를 학습시킬 때 발생하는 메커니즘을 조사한다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai

[Paper] 뉴스 AI를 위한 역사적 훈련 데이터의 인종 편향 영향

AI technologies는 대규모 텍스트 코퍼스를 포함하는 비즈니스 및 연구 응용 분야로 빠르게 진입했으며, 여기에는 computational journalism 연구와 뉴스가 포함됩니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai

[Paper] 멀티모달 RewardBench 2: 교차 텍스트와 이미지에 대한 Omni Reward Models 평가

보상 모델(RMs)은 대형 언어 모델(LLMs) 훈련에 필수적이지만, 이미지와 텍스트가 교차하는 시퀀스를 처리하는 옴니 모델에 대해서는 아직 충분히 탐구되지 않았다.

#research #paper #ai #nlp #computer-vision
1개월 전 · ai

[논문] LinkedOut: Video LLM에서 World Knowledge Representation을 연결하여 Next-Generation Video Recommendation 구현

Video Large Language Models (VLLMs)는 인터넷 규모 데이터에 대한 사전 학습을 통해 세계 지식을 활용한 비디오 이해를 가능하게 하며, 이미 가능성을 보여주고 있습니다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] AdaSearch: 대형 언어 모델에서 강화 학습을 통해 파라메트릭 지식과 검색의 균형 맞추기

대규모 언어 모델(LLMs)을 강화 학습(RL)을 통해 검색 엔진과 결합하는 것이 검색 에이전트를 구축하는 효과적인 접근법으로 부상하고 있다. Howe...

#research #paper #ai #nlp
1개월 전 · ai

[Paper] Cartesian-nj: e3nn을 불변 카르테시안 텐서 곱 및 수축으로 확장

Equivariant atomistic machine learning 모델은 외삽 능력과 예측 정확도 모두에서 상당한 향상을 가져왔습니다. 기반에 따라...

#research #paper #ai #machine-learning
1개월 전 · ai

[Paper] PolaRiS: 일반 로봇 정책을 위한 확장 가능한 Real-to-Sim 평가

로봇 학습 연구에 있어 중요한 과제는 로봇 정책의 성능을 정확하게 측정하고 비교할 수 있는 능력입니다. 로봇공학에서의 벤치마킹…

#research #paper #ai #machine-learning

Newer posts

Older posts