[Paper] JUCAL: 분류 작업에서 Aleatoric와 Epistemic 불확실성을 공동 보정
우리는 훈련된 분류기 앙상블에 대한 사후 보정 불확실성을 연구한다. 구체적으로, 우리는 aleatoric(라벨 노이즈)과 epistemic(모델) 불확실성을 모두 고려한다.
우리는 훈련된 분류기 앙상블에 대한 사후 보정 불확실성을 연구한다. 구체적으로, 우리는 aleatoric(라벨 노이즈)과 epistemic(모델) 불확실성을 모두 고려한다.
실제 세계 관측으로부터 시뮬레이션 준비된 장면을 추정하는 것은 하위 계획 및 정책 학습 작업에 필수적입니다. 안타깝게도 기존 방법들은 …
Mean Field Games (MFGs)은 대규모 인구 모델에서 상호작용을 모델링하기 위한 원칙적인 프레임워크를 제공합니다: 규모가 커짐에 따라 인구 동역학은 결정론적으로 변합니다,…
Data visualization 규칙은 디자인과 인지에 대한 수십 년간의 연구에서 도출된 것으로, 신뢰할 수 있는 차트 커뮤니케이션을 보장합니다. 이전 연구에서는 대규모…
대형 언어 모델(LLMs)의 부상과 함께, 이들은 Retrieval‑Augmented Generation(RAG)과 같은 응용 분야에서 중요한 역할을 하게 되었습니다. 그러나 이러한 …
Epidemiological models는 vaccination status, mask usage, social distancing adherence와 같은 self-reported 행동 데이터를 점점 더 많이 활용하여 질병 확산을 예측한다.
현재 대규모 모델 추론을 위한 강화 학습(reinforcement learning) 목표는 주로 기대 보상(expected rewards)을 최대화하는 데 초점을 맞추고 있습니다. 이 패러다임은 도메인에 과적합될 수 있습니다.
목표: 불필요한 추론을 피하면서 대형 언어 모델(LLMs)을 활용한 의료 질문 응답(MedQA)의 효율성을 향상시키는 것.
대형 언어 모델(LLMs)은 어떻게 자신이 아는 것을 알까요? 이 질문에 답하는 것은 사전 학습 데이터가 종종 ‘블랙 박스’—즉, 알 수 없는 형태이기 때문에 어려웠습니다.
긴 시간 범위의 작업을 해결하려면 로봇이 고수준 의미 추론과 저수준 물리적 상호작용을 통합해야 합니다. Vision-language models (VLMs) ...
검증 가능한 보상을 이용한 강화 학습(RLVR)은 감독을 활용하여 추론 언어 모델(RLMs)을 훈련시키는 유망한 접근법으로 떠오르고 있다.
우리는 [Goel et al. 2017]에서 소개한 적대적 주입 모델에서의 온라인 학습을 연구한다. 여기서 라벨이 붙은 예시들의 스트림은 주로 i.i.d. 방식으로 추출된다…
전문가 주석에 대한 의존은 오랫동안 인공지능을 생물의학에 적용하는 데 있어 주요 속도 제한 단계였습니다. While supe...
Retrieval-augmented generation (RAG)은 외부에서 검색된 문서에 기반해 생성 과정을 조건화함으로써 대형 언어 모델(LLMs)을 향상시키지만, 검색의 효과는…
에지 기반 표현은 시각적 이해를 위한 기본적인 단서이며, 초기 시각 연구에 뿌리를 두고 오늘날에도 여전히 중심적인 원리입니다. 우리는 이…
대형 언어 모델(LLMs)은 인간이 정보를 접근하는 방식에 중요한 역할을 합니다. 핵심 사용은 서면 요청을 이해하는 데 의존하지만, 우리의 이해…
본 연구에서는 대형 언어 모델(LLM)의 출력을 유한 알파벳에서 추출된 무한한 기호 시퀀스를 생성하는 정보원으로 간주합니다.
Large language models은 복잡한 사회‑기술 시스템에 배치되고 있으며, 이는 현재 alignment 실천의 한계를 드러냅니다. 우리는 …
뉴질랜드에서 AI‑기반 “Prompted Playlist” 기능을 처음 테스트한 후 https://techcrunch.com/2025/12/10/spotify-tests-more-personalized-ai-powered-pr...
LLM 기반 애플리케이션은 대형 언어 모델을 복잡한 작업 실행을 위한 핵심 추론 구성 요소로 활용함으로써 소프트웨어 생태계를 빠르게 재구성하고 있습니다. Th...
LLM 기반 다중 에이전트 시스템(MAS)이 복잡한 작업에 점점 더 많이 배치됨에 따라, 그 신뢰성을 보장하는 것이 시급한 과제가 되었습니다. MAS가 ...
내가 사용해 본 모든 AI 트레이딩 어시스턴트는 같은 문제를 가지고 있다: 기억상실. 당신이 Claude에게 금 거래를 분석해 달라고 요청하면, 그것은 탄탄한 분석을 제공한다 — London…
운영 기술이 정보 기술과 점점 통합됨에 따라, 침입 탐지 시스템에 대한 필요성이 더욱 중요해지고 있습니다. 이 논문은 ...
개발자라면, 거의 확실히 여러분의 machine에 half‑finished projects를 위한 graveyard 역할을 하는 folder가 있을 겁니다. 여러분도 그런 것들을 알고 있겠죠: 예전에 시작했지만…
전체 AI 타임라인 — 2017년 원본 Transformer부터 ChatGPT, GPT‑4, Claude, Gemini, LLaMA, Mistral, DeepSe...까지 모든 Large Language Model을 추적합니다.
대규모 언어 모델을 안전‑중요 시스템 엔지니어링에 도입하는 것은 신뢰성, 추적 가능성, 그리고 확립된 검증과의 정렬에 의해 제약받는다.
!https://9to5google.com/wp-content/uploads/sites/4/2026/02/wispr-flow-android-3.png?w=1200 Android에서 Voice‑to‑text는 Pixel을 사용할 경우 정말 좋으며, ...
피지컬 AI 기업 ‘리얼월드’, 업스테이지와 ‘독자 AI 파운데이션 모델’ 생태계 합류
배경: 한 회사가 구직자들에게 질문에 답하는 video를 제출하도록 요청했을 때, 300개의 응답 대부분이 “섬뜩할 정도로 유사했다”고 워싱턴 포스트가 보도했다.
기업에서 AI의 가치를 보는 데 제한 요인은 모델 인텔리전스가 아니라, 에이전트가 조직 내에서 어떻게 구축되고 운영되는가입니다. 우리는 최근에 intr...
LangChain의 2026 State of Agent Engineering 보고서에 따르면 1,300명 이상의 응답자 중, 품질이 프로덕션 에이전트 배포에 대한 가장 큰 장벽이라고 답했습니다. 32%의 팀이 i...
자율 코딩 에이전트는 GitHub에 풀 리퀘스트를 제출함으로써 소프트웨어 개발에 점점 더 많이 기여하고 있지만, 이러한 기여가 어떻게...
markdown 2026년 1월 29일 Ajeet Mirwani 아메리카 프로그램 리드, Google Developer Experts
문제: 사용자를 위해 USDC를 관리하는 자율 에이전트를 고려한다. 가드레일 없이: - 에이전트가 transfer500, wallet_address를 호출한다 — 해당 지갑이 신뢰할 수 있는가? Is th...
배경: Claude Code 생태계는 빠르게 진화하고 있으며, 그 명명 규칙은 혼란스러울 수 있습니다. 많은 구성 요소 중에서 Agent Skills는 종종 …
표현 유사성 메트릭은 일반적으로 모든 유닛을 매칭하도록 강제하여, 신경 표현에서 흔히 나타나는 노이즈와 이상치에 취약하게 만든다. 우리는 …
personal health data를 관리하는 것은 오늘날 파편화되고 기관 중심적인 healthcare ecosystem에서 큰 도전 과제입니다. 개인은 종종 의미 있는 통제권을 갖지 못합니다.
AI 시스템이 우리 일상에 점점 더 얽히게 되면서, 시급한 질문이 제기됩니다: 문화적 민감성이 도덕적 co...
!Awesome AI Agent Papers 2026의 표지 이미지https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-u...
이 브리프는 runtime-adaptive, performance-enhanced vector engine을 제시하며, edge AI acceleration을 위한 low-resource, iterative CORDIC-based MAC unit을 특징으로 합니다.
강화 학습 파인튜닝은 이미지 및 분자 분야에서 원하는 특성으로 생성 확산 모델을 유도하는 데 효과적인 것으로 입증되었습니다. Graph...
당신의 AI 에이전트는 뛰어나지만 텍스트를 쓸 수 있는 사람을 무조건 신뢰합니다. 이메일을 읽고, 웹훅을 처리하며, API를 호출하고, 응답을 초안 작성하고, 데이터를 관리합니다. 그러나 i...
Moltbook: AI‑구동 소셜 네트워크와 그 보안 파급 효과 지난 한 달 동안, AI 에이전트만으로 운영되는 소셜 네트워크가 인터넷의 상상력을 사로잡았다.
왜 Default Memory가 규모에 따라 실패하는가 OpenClaw의 내장 메모리는 간단합니다: 1. MEMORY.md에 추가한다. 2. 전체 파일을 모든 프롬프트에 주입한다. ~5…에서는 잘 작동한다.
표지 이미지: Where Intelligence Meets Connection: My Journey Through the India AI Impact Summit 2026 https://media2.dev.to/dynamic/image/width=1000,height=42...
나는 정중한 친구들에게 형편없는 아이디어를 제시하는 것이 지겨워졌다. 다들 아는 대로, 최신 “혁신적인” 개념을 공유하면 모두가 고개를 끄덕인다. “멋지다.” “인터…'.
개요 대부분의 AI‑에이전트 패턴에 대한 설명은 유용하기엔 너무 추상적이거나 정확하기엔 너무 단순화되어 있습니다. 이 가이드는 기술적으로 p...
소개 대부분의 AI 에이전트는 매 세션마다 동일한 컨텍스트를 다시 로드함으로써 토큰을 소모합니다. 메모리 파일은 시작 시 유용하지만, 한 번 사용하면 부담이 됩니다.