machine learning — Page 17

정렬:

2주 전 · ai · - · -

Google의 새로운 Gemini Pro 모델이 기록적인 벤치마크 점수 — 다시

!Google Gemini 이미지 출처: Jagmeet Singh / TechCrunch In B...

#Google #Gemini #LLM #large language model #benchmark scores #AI research #machine learning
2주 전 · ai · - · -

Unsloth와 Hugging Face Jobs로 AI 모델을 무료로 훈련하세요

markdown 기사 목록으로 돌아가기 !https://cdn-avatars.huggingface.co/v1/production/uploads/62d648291fa3e4e7ae3fa6e8/oatOwf8Xqe5eDbCSuYqCd.pnghttps://huggingface.co/bur...

#Unsloth #Hugging Face #free model training #LLM #open‑source AI #GPU acceleration #machine learning
2주 전 · ai · - · -

[논문] Sink-Aware Pruning for Diffusion Language Models

Diffusion Language Models (DLMs)는 반복적인 디노이징으로 인해 높은 추론 비용이 발생하여 효율적인 프루닝을 필요로 합니다. 기존 프루닝 휴리스틱은 주로 …

#research #paper #ai #machine-learning #nlp
2주 전 · ai · - · -

[논문] MARS: Margin-Aware Reward-Modeling with Self-Refinement

보상 모델링은 RLHF와 RLAIF를 포함한 현대 정렬 파이프라인의 핵심 요소이며, PPO와 TRPO를 포함한 정책 최적화 방법의 기반을 제공합니다. How...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 다중 라운드 인간‑AI 협업 및 사용자 지정 요구사항

인간이 고위험 의사결정을 위해 다중 라운드 대화형 AI에 점점 더 의존함에 따라, 이러한 상호작용이 신뢰할 수 있게 구현되도록 원칙적인 프레임워크가 필요합니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 블랙-박스 LVLM 공격의 전선을 세밀한 디테일 타깃팅으로 확장

대규모 비전-언어 모델(LVLMs)에 대한 블랙박스 적대적 공격은 그래디언트가 없고 복잡한 멀티모달 경계 때문에 어려운 과제입니다. 기존 연구는…

#research #paper #ai #machine-learning #nlp #computer-vision
2주 전 · ai · - · -

[Paper] Reverso: 효율적인 시계열 Foundation Models for Zero-shot Forecasting

시계열 파운데이션 모델을 학습하는 것이 다양한 시계열 도메인에서 제로샷 시계열 예측에 유망한 접근법임이 입증되었습니다. Insof...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 언제 저렴한 검사를 신뢰할 것인가: 약한 및 강한 검증을 통한 추론

LLM을 활용한 추론은 점점 더 넓은 검증 루프 안에서 전개됩니다. 내부적으로 시스템은 자기 일관성(self-consistency)이나 프록시 보상(proxy rewards)과 같은 저비용 검사를 사용합니다, …

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] SMAC: 견고한 오프라인-온라인 전이를 위한 Score-Matched Actor-Critics

현대의 오프라인 Reinforcement Learning (RL) 방법은 성능이 좋은 actor-critic을 찾지만, 이러한 actor-critic을 온라인에서 value-based RL 알고리즘으로 미세 조정하는…

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 안정적인 비동기성: 분산 제어 Off-Policy RL for LLMs

강화 학습(RL)은 추론 작업에서 대형 언어 모델을 개선하는 데 널리 사용되며, 비동기 RL 훈련은 ...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 언제든지 유효한 Statistical Watermarking

대규모 언어 모델(LLMs)의 확산은 기계가 생성한 콘텐츠와 인간이 작성한 텍스트를 구별할 효율적인 메커니즘을 필요로 합니다. 통계적 ...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 캐스케이드 동등성 가설: 언제 Speech LLM이 ASR→LLM 파이프라인처럼 동작하는가?

현재 speech LLM은 대체로 암시적 ASR을 수행한다: 전사본으로 해결 가능한 작업에서는 행동적으로 그리고 메커니즘적으로 단순 WhispertoL과 동등하다.

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts