[Paper] 공유 자율성 패러다임에서 신념 및 정책 학습의 엔드투엔드 최적화
Shared autonomy systems는 사용자 의도를 추론하고 적절한 assistance levels를 결정하기 위한 원칙적인 방법이 필요합니다. 이는 인간…
Shared autonomy systems는 사용자 의도를 추론하고 적절한 assistance levels를 결정하기 위한 원칙적인 방법이 필요합니다. 이는 인간…
Open-set object detection (OSOD)은 객체를 위치시키면서 추론 시에 알려지지 않은 클래스들을 식별하고 거부합니다. 최근 OSOD 모델들은 벤치마크에서 좋은 성능을 보이고 있습니다.
우리는 역 PDE 문제를 위해 함수 공간에서 데이터 효율적이며 물리 인식을 갖춘 생성 프레임워크를 제안한다. 기존의 플러그‑앤‑플레이 diffusion posterior samplers …
Diffusion Large Language Models (DLLMs)은 Auto‑Regressive 모델에 대한 매력적인 대안을 제공하지만, 높은 디코딩 비용으로 인해 배포가 제한됩니다. In ...
Astronomical imaging은 실용적인 관측 제약 하에서 여전히 noise‑limited 상태이며, 표준 calibration pipelines는 주로 structured artifacts와 …
Prompt agents는 최근 자동 프롬프트 최적화를 위한 유망한 패러다임으로 등장했으며, 정제를 순차적 의사결정 문제로 프레이밍합니다.
2026년 1월 29일 Ajeet Mirwani – 아메리카스 프로그램 리드, Google Developer Experts Google 블로그 저자 페이지 https://developers.googleblog.com/search/?author=Ajeet+Mirw...
본 논문은 자율주행 차량을 위해 diffusion-based adaptive lookahead planner (IRL-DAL)를 활용한 새로운 역강화학습 프레임워크를 제안한다. Train...
언어 모델을 기반으로 한 자율 AI 과학자들의 급속한 발전에도 불구하고, 출판용 일러스트레이션을 생성하는 일은 여전히 노동 집약적인 병목 현상이다…
우리는 diffusion models의 샘플링에 partial differential equations에서 유도된 physics-based guidance를 추가하는 guided stochastic sampling 방법을 도입합니다.
Muon optimizer는 matrix-level gradient(또는 momentum) orthogonalization을 수행함으로써 large language models의 pre‑training에서 강력한 경험적 성능을 입증했습니다.
최근 language identification 및 generation에 관한 연구들은 이러한 작업을 달성할 수 있는 엄격한 statistical rates를 확립했습니다. 이러한 연구들은 일반적으로 …
대규모 audio-language 모델은 점점 더 raw speech inputs를 기반으로 작동하여, voice assistants, education 등과 같은 분야에서 보다 원활한 통합을 가능하게 합니다.
Vision-language 모델은 도메인 쉬프트 하에서 성능 저하가 발생하여 실제 적용 가능성을 제한합니다. 기존 테스트-타임 적응 방법은 computati...
모델 비교와 보정된 불확실성 정량화는 종종 매개변수에 대한 적분을 필요로 하지만, 복잡하고 다중…
Vision-language models (VLMs)은 표준 비디오 이해 벤치마크에서 인상적인 성능을 보여주지만, 단순 추론 작업에서는 체계적으로 실패한다…
우리는 변분 프레임워크를 제안하여 transformer layers를 token embeddings에 작용하는 optimization algorithm의 반복으로 해석합니다. 이 관점에서, self-...
번역할 텍스트를 제공해 주시겠어요? 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.
최근 몇 년간, 대형 언어 모델(LLMs)은 정보 검색에서 급속한 진전을 이루었지만, 기존 연구는 주로 텍스트나 정적 멀티...
왜 신경망이 폭발하는가 — 훈련에 도움이 되는 간단한 해결책 일부 신경망, 특히 RNN은 폭풍 속에서 배를 조종하는 것처럼 느껴질 수 있다, 왜냐하면 작은 c...
회사는 플러그인을 사용하여 ‘클로드에게 작업을 수행하는 방식, 어떤 도구와 데이터를 사용할지, 중요한 워크플로를 처리하는 방법, 그리고 SLA가 무엇인지’를 알려줄 수 있다고 말합니다.
멀티에이전트 시스템은 전문화를 통해 복잡한 작업을 해결하는 데 가능성을 보여주었지만, 여러 에이전트를 동시에 파인튜닝하는 데는 두 가지 주요 과제가 있다: (...
기존의 멀티모달 대형 언어 모델들은 긴 비디오 이해를 위해 주로 uniform sampling과 single-turn inference에 의존하고 있어, 그 능력을 제한한다…
Language models (LMs)은 토큰 시퀀스를 기반으로 학습되지만, 사용자는 텍스트를 통해 LMs와 상호작용합니다. 이러한 불일치로 인해 partial token problem이 발생합니다, ...
밀집된 픽셀 단위 주석은 의료 이미지 세그멘테이션에서 여전히 골드 스탠다드이지만, 비용이 많이 들고 확장성을 제한합니다. 반면에, 많은 d...
최근 멀티모달 대형 언어 모델(MLLMs)의 의료 진단에 대한 언어적 역량에도 불구하고, 우리는 최첨단 MLLM조차도 중요한 …
대규모 언어 모델(Large Language Models) 기반 Deep search agents는 다단계 검색, 추론, 장기 과제 실행에서 강력한 역량을 입증했습니다.
AI 개발 속도가 너무 빨라서 약간 압도당한다면, 당신만 그런 것이 아닙니다. 이 분야는 너무 빠르게 움직이고 있어, 그 안에 깊이 관여하고 있는 사람들조차도…
Chain-of-Thought (CoT)가 Large Language Models (LLMs)의 성능을 크게 향상시키지만, 명시적인 추론 체인은 상당한 계산을 요구한다...
우리는 JobResQA를 소개합니다. 이는 HR‑specific tasks에서 LLMs의 Machine Reading Comprehension (MRC) 능력을 평가하기 위한 multilingual Question Answering 벤치마크입니다.
번역할 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다.
Anthropic 블로그 게시물에서: 최근 AI 모델들의 사이버 역량에 대한 평가에서, 현재 Claude 모델은 이제 네트워크에 대한 다단계 공격을 성공시킬 수 있습니다…
Large Language Models (LLMs)은 Software Engineering 연구와 실무에서 점점 더 중요해지고 있으며, Automated Bug Fixing (ABF)은 그들의 주요 응용 분야 중 하나입니다.
혼돈을 확대하지 않으면서 agentic systems를 확장하는 방법에 대한 힘들게 얻은 교훈, core agent types의 taxonomy 포함. 게시물 “Why Your Multi-Agent System is Fa...”
Agentic AI 시스템은 도구를 통해 작동하고, 길고 확률적인 상호작용 트레이스를 따라 행동을 진화시킵니다. 이러한 설정은 행동이 …
Gemini가 내 open tabs에 대한 모든 질문에 답하고 새로운 console을 사줄 수 있을까?
새로운 종류의 하이퍼파라미터 연구 ‘On the Possibility of Small Networks for Physics-Informed Learning’ 포스트가 처음으로 Towards Data Science에 게재되었습니다....
1년도 채 안 되어 Model Context Protocol MCP는 AI 에이전트를 외부 데이터에 연결하는 표준이 되었다. 그 약속은 간단했다: LLM에 real‑...
AI 환경은 빠르게 변합니다. BuildrLab(https://buildrlab.com/)에서는 매일 AI‑first 소프트웨어를 구축하고 있기 때문에, 생태계에서 일어나는 변화를 면밀히 주시합니다.
markdown 2026년 1월 16일 에이전틱 AI 세계에서, 도구를 호출하는 능력은 자연어를 실행 가능한 소프트웨어 행동으로 변환합니다. 지난 달 우리는…
개요: 컴퓨터에게 글자만을 주고 다른 어떤 것도 주지 않으며 글쓰기를 이해하도록 가르치는 것을 상상해 보세요. 연구자들은 텍스트를 한 글자씩 처리하는 간단한 모델을 구축했습니다.
주제: 자두 블랙 포레스트를 재배하는 방법에 대한 인포그래픽 만들기 참여 방법 1. FLUX.2 flex를 사용하여 단일 창의적인 인포그래픽을 만들고 스크…
결정을 구조화하고, 효율적인 옵션을 식별하며, 오해를 일으키는 가치 메트릭을 피하는 방법. 이 글은 “Multi-Attribute Decision Matrices, Done Right”라는 포스트에서 처음 소개되었습니다.
딥러닝 모델의 성능은 효율적인 커널 구현에 크게 좌우되지만, 특수 가속기에 대한 고성능 커널을 개발하는 것은 ...
Early-exit neural networks는 충분한 confidence가 달성될 때 intermediate predictions를 허용함으로써 inference latency를 줄이는 데 인기를 얻고 있습니다. Howev...
최근 개발자와 엔지니어 사이에서 ‘클로드봇Clawdbot’이란 AI 비서 앱이 열광적 반응을 얻고 있다. PC에서 작동하는 이 AI 비서 앱은 사용자와 메신저 앱으로 소통하고, 알아서 컴퓨터 작업을 수행한다. 애플의 맥미니가 최적의 기기로 지목되면서 판매 급증 현상을 보일 정도로 인기다...
생성형 AI 스타트업 포티투마루42Maru, 대표 김동환가 지난 29일부터 이틀간 소노캄 비발디에서 열린 ‘2026 연합 심포지엄’에서 의료·헬스케어 산업의 미래 비전과 실행 전략을 발표했다. 강원대학교 빅데이터메디컬융합학과와 데이터사이언스학과가 공동 주최한 이번 행사는 의료 데이터 활...