[Paper] 개념 학습을 위한 Semantics-Aware Caching
Concept learning은 description logics에 기반한 지식 베이스에서 작동하는 감독 기계 학습(supervised machine learning)의 한 형태입니다. State-of-the-art concept learners는 종종 o…
3058 posts from this source
Concept learning은 description logics에 기반한 지식 베이스에서 작동하는 감독 기계 학습(supervised machine learning)의 한 형태입니다. State-of-the-art concept learners는 종종 o…
자동 음성 인식(ASR)은 사전 학습된 음성 및 언어 모델의 발전으로 혜택을 받았지만, 대부분의 시스템은 여전히 단일 언어 환경에 제한되어 있다.
우리는 NOBLE (Nonlinear lOw-rank Branch for Linear Enhancement)을 소개합니다. 이는 transformer linear에 비선형 저랭크 브랜치를 추가하는 아키텍처 확장입니다.
설명 가능한 인공지능(XAI)은 머신러닝 시스템의 투명성과 책임성을 향상시키고자 하지만, 대부분의 방법은 일괄적인 접근 방식을 따릅니다. 이러한 접근은 다양한 도메인과 사용자 요구에 맞추어 조정되지 않아, 실제 적용에 한계를 보입니다. 최근 연구는 모델-특정, 모델-불가지론, 모델-중립 등 다양한 범주로 XAI 기법을 구분하고, 각 기법이 제공하는 설명의 형태와 깊이를 분석합니다. 또한, 설명의 신뢰성, 해석 가능성, 그리고 사용자 신뢰와 같은 평가 기준을 제시하여, XAI 방법론의 효과를 정량화하려는 시도가 이루어지고 있습니다. 그러나 여전히 설명의 객관성, 인간 중심 설계, 그리고 윤리적 고려사항 등 해결해야 할 과제가 남아 있습니다. 앞으로는 도메인 전문가와 최종 사용자를 포함한 다중 이해관계자와의 협업을 통해, 상황에 맞는 맞춤형 XAI 솔루션을 개발하고, 실시간 피드백 메커니즘을 구축함으로써, 보다 실용적이고 책임감 있는 인공지능 시스템을 구현하는 것이 필요합니다.
Large Language Models (LLMs)은 AI의 초석이 되어 콘텐츠 생성, 검색 및 추천 시스템 등 다양한 분야에서 진보를 이끌고 있습니다...
Mathematical text understanding은 specialized entities와 그들 사이의 complex relationships 때문에 도전적인 작업입니다. 이 연구는 ...
이 연구는 스토리 포인트 추정을 위해 대형 언어 모델(LLMs)의 사용을 조사합니다. 스토리 포인트는 단위가 없고 프로젝트별로 정의되는 노력 추정치입니다.
이 에세이는 퍼지 인지 지도(FHM)의 신경 구현과 해당 평가에 관한 것이다. 먼저, 신경망이 설계되어 …
Function-as-a-Service (FaaS) 플랫폼은 확장 가능하고 비용 효율적인 실행을 제공하지만 복잡한 애플리케이션에서 지연 시간 증가와 자원 오버헤드가 발생합니다.
예측 코딩 그래프(PCG)는 최근에 도입된 예측 코딩 네트워크의 일반화 형태로, 신경과학에서 영감을 받은 확률적 잠재 변수 모델을 확장한 것입니다. 기존의 예측 코딩 네트워크는 계층적 구조를 가지고 각 레이어가 상위 레이어의 예측을 생성하고, 하위 레이어는 예측 오류를 전달하는 방식으로 동작합니다. PCG는 이러한 구조를 그래프 형태로 일반화하여, 노드가 잠재 변수와 관측 변수를 모두 포함하고, 에지(연결)가 예측 및 오류 전달 메커니즘을 나타내도록 설계되었습니다. 이를 통해 보다 복잡한 의존 관계와 비선형 상호작용을 모델링할 수 있으며, 기존의 계층적 예측 코딩 네트워크보다 유연하고 확장성이 높은 프레임워크를 제공합니다. PCG는 변분 추론과 유사한 방식으로 학습되며, 각 노드의 잠재 변수는 주변 변수들의 조건부 분포에 따라 업데이트됩니다. 또한, 그래프 구조를 활용해 다양한 도메인(예: 시계열 데이터, 이미지, 자연어)에서 효율적인 추론과 학습이 가능하도록 설계되었습니다. 이러한 특성 덕분에 PCG는 뇌의 정보 처리 메커니즘을 더 정밀하게 모사할 수 있을 뿐만 아니라, 딥러닝 모델의 해석 가능성을 높이고, 데이터 효율성을 개선하는 데에도 기여할 수 있습니다.
많은 인기 있는 Python 라이브러리들은 성능이 중요한 작업을 위해 C-extensions를 사용하여 사용자가 두 세계의 장점을 결합할 수 있게 합니다: 단순함과 …
AI가 소프트웨어 개발에 미치는 영향을 정량화하기 위해서는 견고한 AI 이전 베이스라인이 필요합니다. 이 연구는 1,155개의 유효한 만족도 데이터를 분석합니다.
Mobile agentic AI는 자원 제한이 있는 플랫폼인 edge 로봇 및 무인 항공기(UAV)와 같은 곳에 자율 기능을 확장하고 있으며, 여기서 엄격한 …
multi-modal generative models의 발전은 storytelling에서 automated media synthesis에 이르기까지 새로운 응용 분야를 가능하게 하고 있습니다. 대부분의 현재 워크로드는 간단한 ...
이 논문은 유클리드 평면에서 분산된 Look-Compute-Move 모델 하에 작동하는 N개의 자율 이동 로봇 집합에 대한 gathering problem을 연구한다.
고품질 3D 스트리밍은 다중 카메라에서 제공되며, 많은 AR/VR 애플리케이션에서 몰입형 경험을 위해 필수적입니다. 제한된 뷰 수는 종종 실제…
스케일링 imitation learning은 근본적으로 데이터 수집 효율성에 의해 제한됩니다. handheld interfaces가 확장 가능한 솔루션으로 부상했지만 …
대규모 언어 모델(LLM)의 효율적이고 안정적인 학습은 현대 머신러닝 시스템에서 여전히 핵심 과제입니다. 이 과제를 해결하기 위해 Reparamete...
우리는 Transformer 언어 모델에서 두 가지 반복적으로 나타나는 현상을 연구한다: 소수의 토큰이 몇몇 채널에서 극단적인 이상값을 보이는 대규모 활성화, ...
우리는 reasoning models에서 performative chain-of-thought (CoT)의 증거를 제공하며, 모델이 최종 답변에 대해 강하게 확신하지만 계속해서 …
AI 모델이 단순한 챗봇을 넘어 보다 복잡한 워크플로우로 발전함에 따라, 우리는 AI 시스템이 활용될 event horizon에 점점 더 가까워지고 있습니다...
비디오 이해를 위한 데이터셋이 시간 단위의 길이까지 확장되었지만, 이들은 일반적으로 자연스럽고 즉흥적인(unscripted) 상황과는 다른, 촘촘히 연결된 클립들로 구성됩니다.
우측 검열된 생존 데이터에서 이질적인 치료 효과(HTEs)를 추정하는 것은 정밀 의학 및 개인 맞춤 치료와 같은 고위험 응용 분야에서 매우 중요합니다.
특이한 통계 모델(혼합 모델, 행렬 분해, 신경망 포함)은 파라미터 비식별성 및 d... 때문에 정규 비대칭성을 위반한다.