[Paper] IndicIFEval: 14개 인도계 언어에 대한 검증 가능한 지시 수행 평가를 위한 벤치마크
Instruction-following benchmarks는 여전히 주로 영어 중심이며, 수억 명에 달하는 인도어 사용자를 위한 중요한 평가 격차를 남기고 있습니다.
Instruction-following benchmarks는 여전히 주로 영어 중심이며, 수억 명에 달하는 인도어 사용자를 위한 중요한 평가 격차를 남기고 있습니다.
소형 언어 모델(SLM)은 비용, 지연 시간, 적응성 측면에서 매력적인 장점을 제공하지만, 지금까지 장기적인 소프트웨어…
학습된 분포의 기하학을 이해하는 것은 확산 모델을 개선하고 해석하는 데 근본적이지만, 그들의 …
Automated test generation은 소프트웨어 품질 보증에 필수적이며, coverage rate는 철저한 테스트를 보장하기 위한 핵심 metric으로 작용합니다. 최근 발전…
복잡한 medical appointment scheduling의 최적화는 다중 센터 healthcare environments에서 여전히 중요한 운영 과제로 남아 있으며, 여기서 clinical s...
Differentially private federated learning은 근본적인 긴장에 직면합니다: client data를 보호하는 privacy protection mechanisms가 동시에 정량화 가능한…
딥러닝을 활용하여 차량 라우팅 문제에 접근하는 Neural routing solvers (NRSs)는 실용적인 적용에 있어 눈에 띄는 잠재력을 보여주었습니다. By ...
프로젝트 개요 전기차 충전 솔루션 ‘차지메이트’를 운영하는 아론이 한국야쿠르트 자회사인 모빌리티와 컨소시엄을 구성해, 기후·에너지·환경부와 한국자동차환경협회가 추진하는 사업에 참여한다.
웹 검색은 이미 AI에 의해 혁신되었습니다 — 구글이 사용자에게 AI Overviews 요약 형태로 검색 결과를 얼마나 쉽게 제공하고 있는지 살펴보세요.
Test-time training (TTT)와 KV binding을 시퀀스 모델링 레이어로 사용하는 것은 일반적으로 키-값 매핑을 기억하는 온라인 메타러닝의 한 형태로 해석됩니다.
시각 강화 학습은 로봇공학에 매력적이지만 비용이 많이 듭니다 — 오프-폴리시 방법은 샘플 효율적이지만 느리고, 온-폴리시 방법은 병렬화가 잘 되지만…
우리는 모든 모달리티에서 late interaction을 위한 효율적인 multi-vector retrieval을 연구한다. late interaction은 정보 검색에서 지배적인 패러다임으로 부상했다.