[논문] SkillRT: 효율적인 실행을 위한 스킬 컴파일
LLM 에이전트는 재사용 가능한 구성 단위로서 스킬을 점점 더 많이 채택하고 있습니다. 스킬은 다양한 에이전트 플랫폼 전반에 걸쳐 공유되지만, 현재 시스템은 이를 …
LLM 에이전트는 재사용 가능한 구성 단위로서 스킬을 점점 더 많이 채택하고 있습니다. 스킬은 다양한 에이전트 플랫폼 전반에 걸쳐 공유되지만, 현재 시스템은 이를 …
스스로 깨진 benchmark, 황은 팟캐스트에 나와 AGI가 달성되었다고 말했다. 이틀 후, 그의 경쟁자는 유일한 테스트에서 0.37 %를 기록했다.
연합 학습(Federated Learning, FL)은 원시 데이터를 공유하지 않고 조직 간 협업 훈련을 가능하게 하지만, 통계적 이질성(비 i.i.d.) 때문에 방해받는다.
# PolyGlotFake 데이터셋을 Kaggle에 미러링하기 안녕하세요, 여러분! 이번 글은 두 개의 데이터셋을 Kaggle에 미러링하는 것에 관한 지난 글의 후속입니다. 여러분은…
!GEEKhttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2F...
‘God Mode’ 문제와 AI 에이전트, 그리고 표준 OAuth가 충분하지 않은 이유에 대한 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gr...
우리는 스케치 기반 팩터 감소와 Nesterov 가속 투영 그래디언트 알고리즘(NPGA)을 GPU 가속과 함께 개발하여, 이중 가속된 …
Zero everything. AI는 이미 당신의 Mac에 설치되어 있습니다. Apple은 macOS와 함께 이를 제공합니다. apfel은 터미널이나 코드에서 AI와 대화할 수 있는 방법을 제공할 뿐입니다.
이 제출물은 DEV April Fools Challenge를 위해 만들어졌습니다. 대부분의 멀티‑에이전트 시스템은 에이전트가 협력하도록 설계되지만, BlackSwanX는 그들을 싸우게 합니다. BlackSwanX는 adv...
우리는 오류-게이트형 Hebbian 규칙인 PCA(EGHR-PCA)가 가우시안 입력 하에서 Oja의 서브스페이스 규칙과 동등한 삼인자 학습 규칙임을 보여주며, 이것이 시스템…
발표 개요 구글은 최신 오픈웨이트 모델인 Gemma 4를 발표했습니다. 이번 모델은 고급 추론과 에이전트 기반 워크플로우를 위해 특수 설계되었으며, Apache 2.0 라이선스로 제공돼 누구나 활용할 수 있습니다. Gemma 4는 첫 버전 출시 이후 4억 회 이상 다운로드되었고...
정렬 프레임워크: 예측에서 이행까지 핵심 원칙은 사전적 정렬입니다. 먼저 수확하고 나서 급히 판매하려고 하는 대신, AI를 사용합니다...
그래프 신경망(GNN)은 다양한 실제 시나리오에서 파생된 그래프 데이터셋에 대한 학습에 널리 사용됩니다. 매우 큰 그래프에서의 학습은 필요...
개요 나는 서부 캐나다에서 지역 food hub를 운영하는 채소 농부이다. 나는 개발자는 아니지만 시스템이 어떻게 작동하는지에 대해 많은 시간을 생각한다,…
Beyond the Blast: AI를 활용한 하이퍼 퍼스널라이즈 미디어 리스트 Intro: 완벽한 스토리 각도를 만들기 위해 몇 시간을 투자했습니다. 이제, 당신은 지루하고 오류가 발생하기 쉬운 작업에 직면합니다.
우리는 구조적으로 최적화된 유전체 표면으로 구성된 파장‑다중화된 대규모 병렬 회절 정보 저장 플랫폼을 소개한다.
Agent A가 Agent B에게 “이것을 프로덕션에 배포해라”고 요청할 때, 누가 Agent A가 그 요청을 할 권한이 있는지 확인합니까? 누가 Agent B가 …
개요: Agent Development Kit ADK SkillToolset은 AI 에이전트가 필요에 따라 도메인 전문 지식을 로드할 수 있도록 하는 progressive disclosure architecture를 도입합니다.
파트 3 – AI 검증 시리즈 이것은 우리 AI 검증 시리즈의 파트 3입니다. - 파트 1: 세 개의 AI가 우리 제품을 분석했습니다. 모두 진실 필터를 통과하지 못했습니다 →https://de...
개요 구글은 최신 세대의 오픈‑웨이트 AI 모델인 Gemma 4의 출시를 발표했습니다. 이전 Gemini 모델은 Go…
우리는 EventHub를 제안한다, 비용이 많이 드는 active sensors의 ground truth annotations 없이도 deep-event stereo networks를 훈련할 수 있는 새로운 프레임워크이며, 대신에 s...
Generative inverse와 forward rendering을 real‑world scenarios에 확장하는 것은 기존 synthetic data의 제한된 realism과 temporal coherence 때문에 병목 현상이 발생합니다.
우리는 ModMap을 제시한다, 이는 3D anomaly detection 및 segmentation을 위한 본래 multiview 및 multimodal 프레임워크이다. 기존 방법들이 뷰를 독립적으로 처리하는 것과 달리...
Pretrained Vision Transformers (ViTs)와 같은 DINOv2 및 MAE는 다양한 다운스트림 작업에 적용할 수 있는 일반적인 이미지 특징을 제공합니다. 예를 들어 retriev...
언어 모델(LMs)은 도메인 특화 작업을 위해 새로운 학습 가능한 어휘 토큰으로 점점 확장되고 있습니다. 예를 들어, 생성형 추천에서의 Semantic-ID 토큰과 같이…
고품질 3D avatar 모델링은 충실도와 일반화 사이의 중요한 트레이드오프에 직면합니다. 한편, multi-view studio data는 high-fidelity mo...
다양한 유효한 답변이 가능한 프롬프트가 주어졌을 때, 이를 포괄적으로 생성하는 것이 다양한 사용자를 만족시키는 첫 번째 단계이다....
훈련이 필요 없는 Vision-Language Navigation (VLN) 에이전트는 기반 모델에 의해 구동되어 지시를 따르고 3D 환경을 탐색할 수 있습니다. 그러나 기존 접근 방식은...
최근 스트리밍 비디오 이해 방법은 긴 비디오 스트림을 처리하기 위해 복잡한 메모리 메커니즘에 점점 더 의존하고 있습니다. 우리는 이러한 추세에 도전하여 간단한 …
Neural network field theory는 네트워크 아키텍처와 그 파라미터에 대한 밀도로 정의된 필드들의 통계적 앙상블로서 field theory를 공식화합니다. 우리는 …
RAG와 컨텍스트 윈도우에 대한 진실 – 트위터에서는 듣지 못합니다. 개발자 공간의 모든 사람들은 LLM의 컨텍스트 윈도우를 maxing out 하는 것이 그들의 applica...
이중 확률 행렬은 잔차 스트림 전반에 걸친 학습된 혼합을 가능하게 하지만, 이중 확률 행렬 집합(버크호프 다면체)을 정확히 매개변수화하는 것은…
기존 비디오 객체 제거 방법은 객체 뒤의 콘텐츠를 inpainting하고 그림자 및 반사와 같은 외관 수준의 아티팩트를 수정하는 데 뛰어납니다....
Softmax는 Transformer 모델의 Multi-Head Attention (MHA) 블록에서, 특히 저정밀도 추론 상황의 작은 모델에서 계산 병목 현상이 될 수 있습니다.
최근 멀티모달 대형 언어 모델은 통합 텍스트 및 이미지 이해와 생성에서 강력한 성능을 달성했지만, 이러한 고유 능력을 확장하는…
검증 가능한 보상을 이용한 강화 학습(RLVR)은 사후 훈련된 대형 언어 모델에 대한 표준 패러다임이 되었다. Group Relative Policy Optimi...
Long-horizon conversational agents는 일관된 추론을 위해 지속적인 메모리가 필요하지만, 통제되지 않은 축적은 시간적 붕괴와 잘못된 기억 전파를 초래한다…
Agentic AI는 투자자의 역할을 분석 실행에서 감독으로 전환합니다. 우리는 약 5…인 agentic strategic asset allocation pipeline을 제시합니다.
규제 문서는 LLM 기반 시스템이 반드시 준수해야 하는 법적 구속력 있는 의무를 담고 있습니다. 그러나 조밀하고 계층적으로 구조화된 법률 텍스트를 mac...
Agent skills는 절차적 지식과 실행 가능한 리소스를 구조화한 패키지로, 에이전트가 추론 시점에 동적으로 로드하며, 신뢰할 수 있는 메커…
Microsoft AI, 이 기술 대기업의 연구소는 텍스트, 음성 및 이미지를 생성할 수 있는 세 가지 Foundational AI 모델의 출시를 발표했습니다. New Foundational M...
프롬프트에서 정보를 처리하는 대형 언어 모델(Large Language Models, LLMs)의 방식을 이해하는 것은 여전히 중요한 과제이다. 이 ‘블랙 박스’를 밝히기 위해, attention vi...
인재 채용은 많은 산업에서 중요한 동시에 비용이 많이 드는 과정이며, 높은 채용 비용과 긴 채용 주기를 동반합니다. 기존 talent recommendation system...
Multi-Agent Systems의 문제 대부분의 Multi-Agent Systems는 개별 agents가 어리석어서 실패하는 것이 아니라, agents 간의 handoffs가 깨졌기 때문에 실패한다....
Retrieval-Augmented Language Models (RALMs)는 지식 집약적인 작업에서 상당한 잠재력을 보여주었지만, 여전히 성능에 취약합니다.
클라우드 컴퓨팅은 확장 가능한 자원 프로비저닝을 가능하게 하지만, 동적인 워크로드 변화는 종종 과다 프로비저닝으로 인한 비용 상승을 초래합니다. 머신 러닝 (ML) a...
번역할 텍스트를 제공해 주시겠어요? 해당 내용이 없으면 번역이 불가능합니다.
자동차 비유: AI 에이전트를 자동차와 같이 생각해 보세요: - 엔진 = LLM Claude, GPT, Gemini. 원시적인 힘. 구축 비용이 많이 듭니다. - 하네스 = 에이전트 프레임워크 Claude...