[Paper] 저해상도 이미지 잠재 임베딩을 위한 Siamese-Driven Optimization in Image Captioning
Image captioning은 시각 장애인을 돕고, 콘텐츠 관리 시스템을 개선하며, 인간‑컴퓨터 상호작용을 향상시키는 등 많은 분야에서 필수적입니다.
Image captioning은 시각 장애인을 돕고, 콘텐츠 관리 시스템을 개선하며, 인간‑컴퓨터 상호작용을 향상시키는 등 많은 분야에서 필수적입니다.
LLM 에이전트는 복잡한 인터랙티브 작업에 널리 배치되어 있지만, 프라이버시 제약으로 인해 동적 환경에서의 중앙 집중식 최적화와 공동 진화를 제한하는 경우가 많다.
개발 지식 질문 응답(Dev Knowledge QA) 작업은 소프트웨어 개발 중 지식 탐색 질문에 자연어 답변을 제공하는 것을 목표로 합니다.
학습 중에 Transformer의 깊이를 점진적으로 늘리는 것은 학습 비용을 줄일 뿐만 아니라, MIDAS가 보여주듯 추론 성능을 향상시킬 수 있습니다.
인간의 성격을 이해하는 것은 personalized recommendation 및 mental health assessment와 같은 웹 애플리케이션에 매우 중요합니다. 기존 연구들은 성격…
AI 기반 코드 생성이 보편화됨에 따라, 연구자들은 코드 LLM의 캘리브레이션을 조사하고 있습니다—즉, 그들의 confidence scores가 충실하게 표현되는지를 보장하기 위해.
머신러닝의 보안 분야 발전에도 불구하고, rule‑based detection은 자원 집약성 때문에 Security Operations Centers에서 여전히 널리 사용됩니다.
대규모 데이터로 사전 학습된 Foundation models는 다양한 도메인에서 놀라운 zero-shot 일반화 능력을 입증했습니다. TabPFN의 성공을 기반으로 ...
문서 그림자 제거는 디지털화된 문서의 선명도를 향상시키는 데 필수적입니다. 고주파 디테일(예: 텍스트 가장자리 및 선)을 보존하는 것은 중요합니다.
이 논문은 연합 학습(FL) 환경에서 다양한 인간 선호와 대형 언어 모델(LLMs)을 정렬하는 과제에 대해 다룹니다, 여기서 st...
우리는 낮은 자원 언어에 대한 사후 훈련(post‑training) 방법을 제안한다. 이 방법은 비유창(disfluent) 보상 모델에 의해 정렬되더라도 언어 모델의 유창성(fluency)을 유지한다. Preference…
최근 몇 년간 고성능 computer vision 모델이 medical imaging에서 눈부신 성공을 거두었으며, 일부 skin lesion classification 시스템은 ...
Automatic Sign Language Recognition (ASLR)은 청각 장애인과 청인 커뮤니티 간의 격차를 메우는 중요한 분야로 부상했습니다. 그러나, 수화‑...
Multigrid methods는 partial differential equations (PDEs)의 discretization에서 발생하는 linear systems를 해결하기 위한 인기 있는 접근법이다.
본 논문에서는 공간 및 시간적 클라우드 워크로드 이동을 통해 탄소, 물, 토지 사용 발자국을 줄일 수 있는 가능성을 조사합니다. 구체적으로, 우리는 p...
이 논문은 바스크어에서 자동 에세이 채점(AES) 및 피드백 생성을 위한 최초의 공개 데이터셋을 소개하며, CEFR C1 수준을 목표로 합니다.
이 논문에서는 재사용 가능하고 CI/CD에 바로 적용할 수 있는 REST API 테스트를 생성하기 위한 LLM 기반 접근법인 RESTifAI를 소개합니다. 이 방법은 happy‑path 접근 방식을 따릅니다. 기존과 달리 …
Distributed systems를 올바르게 설계하고 구현하는 것은 상당히 어려울 수 있습니다. 이러한 시스템은 종종 formal specifications와 함께 제공되지만...
임상 커뮤니케이션은 환자 결과에 핵심적인 역할을 하지만, 환자‑제공자 대화에 대한 대규모 인간 주석은 여전히 노동 집약적이고 일관성이 없으며, ...
ML-Enabled Systems (MLES)는 본질적으로 복잡합니다. 왜냐하면 비즈니스 목표를 달성하기 위해 여러 구성 요소가 필요하기 때문입니다. 이 경험 보고서는 sof...
우리는 QSTN을 소개합니다. QSTN은 설문지 형식 프롬프트로부터 체계적으로 응답을 생성하여 인실리코 설문조사와 ann…을 지원하는 오픈 소스 Python 프레임워크입니다.
효율적인 엣지 캐싱은 지연 시간을 줄이고 현대 네트워크에서 백홀 혼잡을 완화합니다. 전통적인 캐싱 정책인 Least Recently Used (LRU)와 같은…
프로페셔널 농구 경기, 특히 미국 프로농구(NBA)의 결과를 예측하는 것은 코치에게 점점 더 중요해지고 있다.
전통적으로, multithreaded data structures는 Operating Systems(OS)의 스레드가 접근하도록 설계되었습니다. 그러나, prog...