[논문] APEX‑SWE
우리는 AI Productivity Index for Software Engineering (APEX‑SWE)를 소개합니다. 이는 프론티어 AI 모델이 경제적으로 가치 있는 작업을 수행할 수 있는지를 평가하기 위한 벤치마크입니다.
우리는 AI Productivity Index for Software Engineering (APEX‑SWE)를 소개합니다. 이는 프론티어 AI 모델이 경제적으로 가치 있는 작업을 수행할 수 있는지를 평가하기 위한 벤치마크입니다.
Mixture of Experts (MoE) 모델은 대형 언어 모델(LLMs)의 최신 패러다임으로 떠오르고 있습니다. 그러나 메모리 제한으로 인해 MoE 모델은 …
정확한 개체 식별은 희귀 양서류를 모니터링하는 데 필수적이지만, 침습적인 마킹은 종종 위급히 멸종 위기에 처한 종에게는 부적합합니다. 우리는…
방사선 사진(radiographs)에서 치과 질환을 진단하는 것은 진단 증거가 미묘하기 때문에 시간도 많이 걸리고 어려운 작업입니다. 기존 방법들은 …
이미지 합성 모델의 급속한 등장으로 AI 생성 이미지 탐지기의 일반화에 도전 과제가 제기됩니다. 그러나 기존 방법들은 종종 mo...
대형 언어 모델(LLM)이 디지털 플랫폼과 의사결정 시스템에 깊이 통합됨에 따라, 그들의 정치적 편향에 대한 우려가 커지고 있습니다. 반면…
Machine Learning 알고리즘은 정의, 의료 및 금융과 같은 핵심 의사결정 분야에 널리 퍼져 있어, fairness에 대한 큰 수요를 촉발했습니다.
CLASSIX 알고리즘은 데이터 클러스터링에 대한 빠르고 설명 가능한 접근 방식입니다. 원래 형태에서는 이 알고리즘이 데이터 포인트를 정렬하는 방식을 활용합니다.
연구자들은 데이터 분석을 간소화하고 데이터베이스 기반 애플리케이션 개발을 가속화하기 위해 수많은 text-to-SQL 기술을 제안했습니다. 비교를 위해...
다양하고 잠재적으로 상충되는 선호를 가진 사용자들에게 서비스를 제공하도록 대형 언어 모델(LLMs)을 정렬하는 것은 개인화 및 신뢰성 측면에서 핵심 과제이다.
조직병리학 분석은 헤마톡실린 및 에오신(H&E) 염색에 의존하지만, 형광 현미경은 보완적인 정보를 제공합니다. 형광을 변환하는…
소프트웨어 엔지니어링을 위한 Retrieval-Augmented Generation은 종종 vector similarity search에 의존하는데, 이는 주제 유사성을 포착하지만 다중 홉 …