[Paper] 모멘텀 SVGD-EM을 이용한 가속된 최대 주변 가능도 추정
Maximum marginal likelihood estimation (MMLE)은 자유 에너지 함수형의 최적화로 공식화될 수 있다. 이러한 관점에서, Expectation‑Maximisation…
Maximum marginal likelihood estimation (MMLE)은 자유 에너지 함수형의 최적화로 공식화될 수 있다. 이러한 관점에서, Expectation‑Maximisation…
우리는 혼합 오디오 스트림으로부터 두 명의 상호작용하는, 같은 위치에 있는 참가자들의 완전한 3D facial animations을 생성하는 어려운 과제에 도전합니다. 기존에 …
문제 우리는 AI 에이전트 API 비용에 월 $198을 지출하고 있었습니다. 예상했던 LLM 호출에서 발생한 비용이 아니라, 잊혀진 에이전트 ...
최근 3D Gaussian Splatting (3DGS)의 발전은 reconstruction fidelity와 computational efficiency의 균형에 초점을 맞추게 되었다. 본 연구에서는...
우리는 OfficeQA Pro를 소개합니다. 이는 대규모이면서 이질적인 문서 코퍼스에 대한 근거가 있는 다문서 추론을 수행하는 AI 에이전트를 평가하기 위한 benchmark입니다. 코퍼스...
최근 통합 멀티모달 모델(UMMs)의 발전은 텍스트-이미지(T2I) 생성에 크게 기여했으며, 특히 Chai의 통합을 통해…
템플릿이 없는 애니메이션 가능한 헤드 아바타는 피사체의 캡처에서 직접 표현 의존적인 얼굴 변형을 학습함으로써 높은 시각적 충실도를 달성할 수 있습니다, av...
AI 에이전트는 지난 1년 동안 소프트웨어 엔지니어링에 놀라울 정도로 능숙해졌으며, 이는 주로 추론 능력의 향상 덕분입니다. 이는 d...
open-world visual recognition에서 신뢰성을 보장하려면 모델이 interpretable하고, fair하며, distribution shifts에 robust해야 합니다. 그러나 현대 vision sys...
Streaming video understanding은 종종 시간에 민감한 시나리오를 포함하고, 모델은 지원 시각 증거가 나타나는 정확한 시점을 답해야 합니다: 답변…
TL;DR - 유출된 정보에 따르면 Google이 제작자 아바타를 표시하는 옵션을 추가할 수 있다고 합니다.
Large language models (LLMs)은 종교 지식 질문에 유창하게 답변할 수 있지만, 종종 환각을 일으키고 출처를 잘못 인용하는데, 이는 특히 …
최적화 알고리즘을 선택하려면 문제 인스턴스 전반에 걸쳐 후보들을 비교해야 하지만, 배포 시의 계산 예산은 종종 벤치마크 단계에서 알 수 없습니다.
이 보고서는 코펜하겐에서 열린 ALICE 2026 워크숍에서 우리 그룹(SymBa)의 작업을 문서화한 것입니다. Nils Aall Barricelli의 선구적인 연구에 영감을 받아…
attention mechanism의 이차 복잡도와 Key-Value (KV) cache의 상당한 메모리 footprint는 심각한 계산 및 메모리 문제를 야기합니다…
구조화된 시퀀스 정보가 신경 시스템에서 어떻게 표현되고 일반화될 수 있는지를 이해하는 것은 음향 입력에서 …로의 전이를 모델링하는 데 핵심이다.
왜 AI 검색 벤치마킹이 중요한가 거의 10년 동안 나는 “우리 현재 AI 설정이 최적화되었는지 어떻게 알 수 있나요?”라는 질문을 받아왔습니다. 솔직한 답변은? 많은…
중환자실(ICU)에서 정확하고 해석 가능한 사망 위험 예측은 전자 의료 기록의 불규칙한 시간적 구조 때문에 여전히 중요한 과제입니다.
다중 선택 배낭 문제(MCKP)는 널리 실용적인 응용 분야를 가진 고전적인 조합 최적화 문제입니다. 이 논문은 중요한 …
OpenAI가 Promptfoo를 인수합니다. Promptfoo는 기업이 AI 시스템 개발 중에 취약점을 식별하고 해결하도록 돕는 AI 보안 플랫폼입니다. 일단…
소개: LLM의 도전 과제 대형 언어 모델 LLMs ChatGPT와 같은 LLM은 놀랍습니다—글을 쓰고, 코드를 작성하고, 질문에 답할 수 있습니다. 그러나 때때로 h...
Guardian Protocol Framework 버전 1.0 – 공개 초안
지난달, AI 에이전트가 소프트웨어 유지보수자를 비판하는 글을 발표했습니다. 그것은 GitHub PR을 열었지만 거절당했고, 그 후 그 사람을 비난하는 블로그 글을 썼습니다.
소개 프롬프트 엔지니어링은 종종 지나치게 복잡하게 느껴지지만, 몇 가지 간단한 습관만으로도 대부분의 개선을 이끌어낼 수 있습니다. 80/20 규칙을 적용하면, 작은…
고위험 의료 진단에서의 설명 가능성 의료 진단과 같은 고위험 상황에서는 사용자가 컴퓨터 비전 모델이 …
Large language models (LLMs)은 소프트웨어 엔지니어링 분야를 변화시켰습니다. 최근에는 실제 세계의 문제들을 해결하기 위해 수많은 LLM-based agents가 개발되었습니다.
두 에이전트 검토 패턴: AI 에이전트가 자체 출력물을 검증하면 안 되는 이유 30‑day 정도 지나면 AI 에이전트 시스템에서 나타나는 미묘한 실패 모드가 있다.
새로운 AI agent의 첫 날은 day zero처럼 느껴져서는 안 됩니다. 하지만 대부분의 팀에게는 그렇습니다. 에이전트는 context도, history도, learned preferences도 없습니다. It asks obvi...
2월 20일, Anthropic은 Claude Code에 내장된 AI‑powered vulnerability scanner인 Claude Code Security를 출시했으며, 이는 인간처럼 코드베이스를 논리적으로 분석합니다.
소개 클로드는 2주 동안 Firefox에서 22개의 취약점을 발견했으며, 그 중 14개는 고위험(high‑severity) 취약점이다. 사람들은 종종 모델 능력(model capability)에 초점을 맞추지만, ...
권한 부풀림 문제 제가 거의 모든 AI 에이전트 배포에서 90일 이상 운영되는 경우에 보는 패턴이 있습니다: 에이전트는 읽기 전용(read‑only)으로 시작했지만...
개요 Show HN: Joy — AI 에이전트를 위한 오픈 트러스트 네트워크, AI‑to‑AI 보칭. 에이전트는 다른 에이전트를 보증하여 행동을 위임할 수 있습니다. 프로젝트를 읽어보세요: HN 스레드:...
대부분의 AI agents는 작업을 완료하지 못해서 실패하는 것이 아니라, 언제 멈춰야 할지 몰라서 실패합니다. 종료 조건이 없는 loop는 위험 요소입니다.
머신 번역 인포그래픽
첫 AI 에이전트 워크플로우 구축: 실용 가이드 (프레임워크 필요 없음) 모두가 AI 에이전트에 대해 이야기하고 있습니다. LangChain, CrewAI, AutoGen — 프레임워크는…
최근 AI 에이전트에 대해 배우기 시작했고 제 경험을 공유하고 싶었습니다. 처음에는 AI 에이전트가 ChatGPT, Gemini와 같은 AI 애플리케이션에 불과하다고 생각했습니다.
표지 이미지: “The Future of Large Language Models – Beyond Hallucinations Post‑OpenAI's Groundbreaking Paper” https://media2.dev.to/dynamic/image/wid...
HelixCipher
AI 에이전트를 일련의 방에서 탈출하도록 도전하면 어떤 일이 일어날까요? 맞춤 설계된 일곱 개의 방을 탐색하고 탈출하도록 훈련된 AI Warehouse 에이전트 알버트를 만나보세요.
나는 LLM에 상담하고 있지 않다. 여기 내가 GPT나 일반적인 LLM을 어떤 일에 사용하면서 겪는 문제를 말한다, 비록 LLM이 효과적으로 수행할 수 있더라도. 나는 구체적으로 말할 것이다.
질문: 저는 우리 회사를 포함해 AI를 활용해 생산성이 높은 기업들이 있다는 것을 알고 있습니다. 하지만 AI 회의론자들은 실제 연구를 요구하고, 이용 가능한 모든 연구는…
소개 50개 이상의 AI 구현을 분석한 결과, 프로젝트를 반복적으로 실패하게 만드는 동일한 패턴을 발견했습니다. 흔히 저지르는 실수는 “우리는 ~해야 한다”는 식으로 시작하는 것입니다.
내가 만든 모든 AI 에이전트는 설정에 한 줄을 추가하기 전까지 같은 실수를 반복했어요. 확실하지 않을 경우, 컨텍스트를 outbox.json에 기록하고 중지하세요. 그게 전부입니다—
모든 시스템 뒤에 숨은 보이지 않는 노동 당신이 신뢰하는 모든 시스템은 당신이 절대 만나지 못할 누군가에 의해 형성되었습니다. 설립자가 아니라, 언론을 끌어들인 엔지니어도 아닙니다.
Escalation Rules가 중요한 이유: AI agent가 edge case에 직면하고 Escalation Rule이 정의되지 않으면 단순히 추측하게 됩니다. 이는 심각한 문제를 초래할 수 있습니다, 예를 들어…
Week in AI: 로컬‑퍼스트 AI의 부상과 그 중요성. 실제로 업무에 영향을 미치는 AI 개발을 매주 요약한 다이제스트.
숨겨진 AI 시스템, 트렁케이션이라고 불리는 것. 모든 주요 AI 작문 도구인 ChatGPT, Claude, Gemini, Copilot은 시스템 수준의 동작을 실행하여 조용히 당신의 콘텐츠를 잘라냅니다.
GrahamTheDev라는 개발자가 아직 처리 중인 내 빌드 로그에 댓글을 남겼다. 그는 “blackboarding with LLMs”라는 기술을 설명했으며, 나는 실제…