[Paper] Fluent Alignment with Disfluent Judges: Lower-resource Languages를 위한 Post-training
우리는 낮은 자원 언어에 대한 사후 훈련(post‑training) 방법을 제안한다. 이 방법은 비유창(disfluent) 보상 모델에 의해 정렬되더라도 언어 모델의 유창성(fluency)을 유지한다. Preference…
우리는 낮은 자원 언어에 대한 사후 훈련(post‑training) 방법을 제안한다. 이 방법은 비유창(disfluent) 보상 모델에 의해 정렬되더라도 언어 모델의 유창성(fluency)을 유지한다. Preference…
이 논문은 바스크어에서 자동 에세이 채점(AES) 및 피드백 생성을 위한 최초의 공개 데이터셋을 소개하며, CEFR C1 수준을 목표로 합니다.
아이디어에서 임팩트까지: AI를 가속화 조종사로 활용하기. “How to Develop AI-Powered Solutions, Accelerated by AI”라는 포스트가 처음으로 Towards Data Science에 게재되었습니다.
임상 커뮤니케이션은 환자 결과에 핵심적인 역할을 하지만, 환자‑제공자 대화에 대한 대규모 인간 주석은 여전히 노동 집약적이고 일관성이 없으며, ...
ML-Enabled Systems (MLES)는 본질적으로 복잡합니다. 왜냐하면 비즈니스 목표를 달성하기 위해 여러 구성 요소가 필요하기 때문입니다. 이 경험 보고서는 sof...
프로페셔널 농구 경기, 특히 미국 프로농구(NBA)의 결과를 예측하는 것은 코치에게 점점 더 중요해지고 있다.
머신러닝(ML) 모델의 학습 및 배포는 매우 에너지 집약적이 되었습니다. 기존 최적화 노력은 주로 하드웨어에 초점을 맞추고 있습니다.
생물학적 시스템은 놀라운 형태형성 가소성을 보여주며, 단일 유전체가 지역 화학 신호에 의해 유도되는 다양한 특수화된 세포 구조를 인코딩할 수 있다.
이 논문은 암호화폐 시장을 배경으로 한 새로운 machine learning 기반 portfolio management 방법을 제안한다. 이전 연구자들은 주로 …
의료 의사결정은 위험 방정식과 규칙을 결합한 알고리즘을 자주 활용하여 명확하고 표준화된 치료 경로를 제공합니다. Symbolic r...
인간은 단순히 attribute similarity만 보는 것이 아니라 relational similarity도 본다. 사과는 둘 다 붉은 과일이기 때문에 peach와 비슷하지만, Earth도…
대형 언어 모델(LLM)의 out-of-distribution(OOD) 일반화 능력은 배포에 있어 매우 중요합니다. 이전 연구에서는 LLM의 일반화를 평가…