evaluation

1주 전 · ai

LLM에 대한 Task-free 지능 테스트

번역할 텍스트를 제공해 주시겠어요?

#LLM #intelligence testing #evaluation #benchmark #language models
0개월 전 · ai

부풀어진 RAG 파이프라인에서 Evals 수행 방법

데이터셋 및 모델 간 메트릭 비교 ‘How to Do Evals on a Bloated RAG Pipeline’ 게시물이 처음으로 Towards Data Science에 게재되었습니다....

#RAG #retrieval-augmented generation #evaluation #model metrics #datasets #LLM #pipeline optimization #NLP
1개월 전 · ai

프로덕션에서 RAG 시스템 구축 시 배운 여섯 가지 교훈

프로덕션 RAG 시스템에서 데이터 품질, 검색 설계 및 평가를 위한 모범 사례 'The post Six Lessons Learned Building RAG Systems in Production' (프로덕션에서 RAG 시스템 구축에 대한 여섯 가지 교훈)

#retrieval-augmented generation #RAG #production systems #data quality #evaluation
1개월 전 · ai

왜 AI 정렬은 더 나은 평가에서 시작되는가

평가하지 않으면 정렬할 수 없습니다. “Why AI Alignment Starts With Better Evaluation”라는 게시물이 처음으로 Towards Data Science에 게재되었습니다....

#AI alignment #evaluation #AI safety #machine learning #LLM