[Paper] 노이즈와 불완전한 데이터에서 Self-Supervised Learning
많은 중요한 과학 및 공학 문제들은 관측 과정이 알려진 상황에서, noisy하고/또는 incomplete observations로부터 signal을 추정하는 것을 포함한다.
많은 중요한 과학 및 공학 문제들은 관측 과정이 알려진 상황에서, noisy하고/또는 incomplete observations로부터 signal을 추정하는 것을 포함한다.
기초 비전, 오디오 및 언어 모델은 잠재 표현을 통해 다운스트림 작업에서 제로샷 성능을 가능하게 합니다. 최근에는 비지도 학습이…
Memory-Augmented Generation (MAG)은 외부 메모리를 활용해 대규모 언어 모델을 확장하고 장기 컨텍스트 추론을 지원하지만, 기존 접근 방식은 주로 …
Quantum computing은 데이터 분석에서 변혁적인 진보를 오래전부터 약속했지만, 실용적인 quantum machine learning은 근본적인 장애물 때문에 여전히 실현되지 못하고 있습니다.
최근 텍스트-투-비디오 디퓨전 모델은 설득력 있는 비디오 시퀀스를 생성할 수 있지만, 여전히 무음 상태이며 — 의미적, 감정적, 그리고 분위기적 단서를 놓치고 있습니다.
배경: Reporting and Data Systems (RADS)는 방사선 위험 커뮤니케이션을 표준화하지만, 서술형 보고서에서 자동으로 RADS를 할당하는 것은 어려운 ...
Geo-localization은 주어진 신호의 지리적 출처를 추론하는 것을 목표로 합니다. 컴퓨터 비전 분야에서 Geo-localization은 구성에 대한 까다로운 벤치마크 역할을 해왔습니다.
대화형 AI 시스템이 일상 생활에 점점 더 통합됨에 따라, 이들은 사용자 자율성, 신뢰 및 상업적 이해관계에 대한 긴급한 우려를 제기한다.
우리는 데이터에서 생성 과정 자체에 존재했던 것보다 더 많은 것을 배울 수 있을까? 단순히 결정론적 변환을 적용하는 것만으로 새로운 유용한 정보를 만들 수 있을까?
수학에서 학생들의 실수는 종종 체계적이다: 학습자는 일관되지만 잘못된 절차를 적용하고 이를 다양한 상황에서 반복한다. 우리는 MalruleLib를 소개한다…
텍스트-이미지 디퓨전 모델에서 머신 언러닝은 전체 유용성을 유지하면서 목표 개념을 제거하는 것을 목표로 합니다. 기존 디퓨전 언러닝 방법은 일반적으로…
엔터프라이즈 검색에서, 대규모로 고품질 데이터셋을 구축하는 것은 라벨링된 데이터를 확보하기 어려워서 여전히 핵심 과제입니다. 이 문제를 해결하기 위해…
대형 언어 모델(LLMs)은 자연어 처리에서 상당한 잠재력을 보여주었지만, 다중 단계가 필요한 복잡한 일반 목적 추론은 ...
LLM 에이전트는 추론하고 도구를 사용할 수 있지만, 무제한 컨텍스트 증가와 누적 오류 때문에 장기 작업에서 종종 붕괴됩니다. 일반적인 해결책은 …
머신러닝(ML) 모델 편향을 평가하는 것은 신뢰할 수 있고 견고한 ML 시스템을 구축하는 데 핵심입니다. 반사실 공정성(CF) 감사는 편향을 측정할 수 있게 해줍니다.
machine learning models에 대한 표현력 있는 쿼리—이를 intentional data의 한 형태로 보는—는 declarative language를 사용하여 검증 및 해석을 가능하게 한다.
Diffusion language models (DLMs)는 in-context examples와 함께 일반 자연어 작업에 대해 강력한 잠재력을 보여주었습니다. 그러나 양방향 ...
Multimodal Large Language Models (MLLMs)의 instruction-following (IF) 능력을 평가하는 것은 모델이 얼마나 충실하게 … 를 엄밀히 평가하기 위해 필수적이다.
멀티 에이전트 LLM 파이프라인이 복잡해짐에 따라 기존 서빙 패러다임은 동적인 서빙 조건에 적응하지 못합니다. 우리는 agentic serving system이…
우리는 probability-domain softening operators에 기반한 sparse knowledge distillation을 위한 통합 이론적 프레임워크를 개발한다. p^{1/T}의 동등성은 …
소셜 미디어에서의 Hate speech detection은 정확도와 설명 가능성 모두에서 도전에 직면해 있으며, 특히 연구가 충분히 이루어지지 않은 Indic languages에 대해 그렇습니다. 우리는 새로운 exp...
Unified Multimodal Models (UMMs)가 cross-modal comprehension에서 눈에 띄는 성공을 거두었지만, 그들의 ... 활용 능력에는 여전히 큰 격차가 존재한다.
인간 지능의 특징은 Constructive Episodic Simulation을 통해 새로운 기술을 마스터하는 능력이며, 과거 경험을 회상하여 해결책을 종합한다.
멀티모달 의료 대형 언어 모델은 흉부 X-레이 해석에서 인상적인 진전을 보여왔지만, 공간 추론 및 …