AMEX의 에이전틱 커머스 스택 내부: 인텐트 계약과 단일 사용 토큰이 AI 거래를 강제하는 방법
American Express Amex는 AI 에이전트가 사용자를 대신해 쇼핑하고 결제할 수 있는 시스템을 구축하고 있지만, 현재는 자체 결제 네트워크 내에서만 가능하며, …
American Express Amex는 AI 에이전트가 사용자를 대신해 쇼핑하고 결제할 수 있는 시스템을 구축하고 있지만, 현재는 자체 결제 네트워크 내에서만 가능하며, …
최근 large language models의 발전으로 인해 사용자 대신 개방형 환경에서 점점 더 높은 자율성을 가지고 실행되는 소프트웨어 시스템(예: agents)의 부상이 일어나고 있습니다.
1세기 넘게 전력망은 단일 통계 가정에 의존해 왔습니다: 부하 다양성(load diversity), 수백만 개의 상관관계 없는 수요가…
Siri의 대규모 Google 업그레이드: 아이폰 팬들이 기다리는 것 Siri가 더 똑똑해지고 있지만—충분할까?…
Speculative decoding은 작은 draft model을 사용해 후보 토큰을 제안하고, 더 큰 target model이 이를 검증함으로써 대형 언어 모델(LLM) 추론을 가속화합니다.
Speculative decoding은 작은 draft model을 사용해 candidate token을 제안하고, 더 큰 target model이 이를 검증함으로써 large language model (LLM) inference를 가속화합니다.
지역 사회경제 통계의 일관성을 보장하는 것은 국가 통계 기관의 핵심 과제입니다. 전통적인 검증 도구인 range …
복합재료는 구성요소, 플라이, 라미네이트, 구조 등에 걸친 결합 메커니즘에 의해 지배되는 강한 계층적 및 이방성 특성을 나타낸다…
강화 학습(RL)의 상당한 발전에도 불구하고, 모델 성능은 알고리즘 및 하이퍼파라미터 구성에 매우 민감하게 남아 있으며, while ge...
Rural thematic road network construction은 농업 기계의 movement trajectory images에서 topological 도로 구조를 추출하는 것을 목표로 합니다. 그러나 이 ta...
전통적인 이미지 품질 평가(IQA) 방법은 평균 의견 점수(MOS)에 의존하는데, 이는 수집에 많은 자원이 필요하고 해석 가능한…
Cross-language code clone detection (X-CCD)은 의미적으로 동등한 프로그램이 서로 다른 언어로 작성되었을 때 표면적인 유사성이 거의 없기 때문에 어려운 과제이다.
과학자들은 점점 더 센서 기반 데이터에 의존하고 있지만, 원시 스트림을 엣지‑투‑클라우드 연속체 전반에 걸쳐 인사이트로 전환하는 것은 여전히 어렵습니다. 프로비저닝...
딥 뉴럴 네트워크가 효과적으로 최적화되었는지를 이해하는 것은 여전히 어려운 과제이며, 학습이 매우 비볼록(nonconvex)한 환경에서 이루어지고 표준 메트릭이…
과학자들은 점점 더 sensor-based data에 의존하고 있지만, 원시 스트림을 edge-to-cloud continuum 전반에 걸쳐 인사이트로 변환하는 것은 … 때문에 여전히 어렵습니다.
비디오는 여러 프레임에 걸쳐 행동을 포착하는 능력에서 독특합니다. 따라서 오랫동안 행동 인식은 전형적인 task였습니다.
인간과 AI 시스템 간의 업무 배분 방식을 결정하는 것은 조직 설계에서 핵심적인 과제이다. 대부분의 접근 방식은 이를 이분법적 선택으로 간주한다, ye...
확률적 값에는 Shapley values와 semivalues가 포함되며, 이는 블랙박스 모델의 행동을 데이터 포인트에 귀속시키기 위한 model-agnostic 프레임워크를 제공합니다.
Large language models는 복잡한 추론에 뛰어나지만, 그들의 중간 단계들을 평가하는 것은 여전히 어려운 과제입니다. 비록 process reward models가 단계별 …
대규모 분석 데이터베이스에서 Text-to‑SQL은 복잡한 스키마를 탐색하고, 모호한 쿼리를 해결하며, 실제 데이터에 기반한 결정을 내리는 것을 요구합니다. 대부분의 현재…
Blind face restoration은 심각한 손상 상황에서 매우 ill-posed한 문제이며, 이 경우 identity‑critical 세부 정보가 손상된 입력에서 누락될 수 있습니다. Same‑identity refer…
대규모 언어 모델(LLM) 에이전트가 고립된 도구 사용자에서 협조적인 팀으로 진화함에 따라, 강화 학습(RL)은 개별 행동뿐만 아니라 …
우리는 변환기와 상태공간 모델(state-space model, SSM) 블록을 통합한 하이브리드 이미지 복원을 위한 모듈식 프레임워크를 제안하며, 런타임 효율성을 개선하는 데 초점을 맞춥니다...
현대의 퍼저는 구조화된 입력을 생성하기 위해 Large Language Models(LLMs)를 점점 더 많이 사용하지만, LLM 기반 퍼징은 프롬프트 초기화와 샘플링에 민감합니다.
비디오에서 human pose와 appearance를 정확하게 복원하는 것은 scene reconstruction의 필수 요소이며, motion capture, motion prediction 등에 적용됩니다.
Automatic speech recognition (ASR) 시스템은 이음증(dysarthric) 및 기타 비정형 음성에 대해 여전히 취약합니다. 최근 audio-language 모델은 개선 가능성을 제시합니다.
선형 복잡도 attention 메커니즘은 quadratic bottleneck을 극복하기 위해 Softmax attention에 대한 유망한 대안을 제공하지만, 이러한 모델을 training하는 것은 fr...
Diffusion 모델은 최근 초고해상도를 포함한 이미지 복원 작업에서 강력한 성능을 보여주었습니다. 그러나 이들의 큰 모델 크기와 iter…
Language models (LMs)은 고위험, 다중 에이전트 환경에서 점점 더 많이 사용되고 있으며, 지시를 따르고 가치 정렬을 유지하는 것이 중요합니다. Mos...
대규모 실제 데이터(RWD)에서 도출된 증거는 규제 평가와 의료 의사결정에 점점 더 큰 영향을 미치고 있습니다. Administrative claims pr...
Vision-language 모델은 안과학에 상당한 가능성을 가지고 있지만, 그 개발은 여전히 s...인 대규모 고품질 이미지-텍스트 데이터셋에 달려 있습니다.
SemEval-2026 Task 10은 음모론 탐지에 초점을 맞추고 있습니다. 구체적으로, 목표는 Reddit 댓글이 음모론 신념을 표현하고 있는지를 감지하는 것입니다. 우리의 제출...
SemEval-2026 Task 9은 다국어 편향 감지에 초점을 맞추고 있습니다. 구체적으로, 이는 다국어, 다문화 및 다이벤트 ...
2009년에 출시된 인기 있는 voxel 기반 비디오게임인 Minecraft는 여러 개의 독특한 분야를 포함하고 있습니다. 그 중 하나가 'parkour'이며, 이는 세계를 탐험하는 데 중점을 둔 게임플레이입니다.
Continual learning 시스템은 새로운 지식을 습득하는 플라스티시티와 기존 지식을 유지하는 스테이빌리티 사이의 근본적인 긴장을 안고 있다. 우리는 …
최첨단 Large Language Models (LLMs)은 함수 수준에서 코드 생성에 뛰어납니다. 그러나 규모를 확대할 때 출력 품질이 크게 감소합니다...
소프트웨어 엔지니어링은 점점 더 불확실성 하에서 코드, 현장 데이터, 그리고 사회기술적 프로세스의 신호를 활용해 고위험 의사결정을 내리는 작업을 포함합니다. R...
Federated Learning (FL)은 분산 머신러닝에서 탈중앙화된 시스템 전반에 걸쳐 협업 모델 훈련을 가능하게 함으로써 큰 주목을 받고 있습니다.
Dynamic Vision Sensors (DVS)는 뛰어난 dynamic range와 low power consumption을 보여주어, Internet of Video Thing에서 edge applications에 이상적입니다.
신경망은 점점 더 비미분 가능한 구성 요소(스파이킹 뉴런, quantized layers, discrete routing, blackbox simulators 등)를 포함하고 있으며, 여기서 backprop…
스파이킹 신경망(SNNs)은 이벤트 기반 연산 및 시간 필터링 능력 때문에 엣지 센싱에 유망합니다. 그러나 표준 리키 i...
OpenClaw 표지 이미지: 이것이 무엇이며 왜 모두가 이것에 대해 이야기하고 있나요? https://media2.dev.to/dynamic/image/width=1000,height=500,fit=cover,gravity=auto,form...
최근 공격은 behavioural unlearning of large language models가 내부 흔적을 남겨 adversarial probes에 의해 복구될 수 있음을 보여준다. 우리는 이러한 …
질문: 오랜 슬래시닷 독자 앤 스와크스는 “방 안의 다른 사람들을 방해하지 않기 위해, 혹은 청력이 그리 좋지 않아서”라는 이유로 YouTube의 subtitles를 자주 사용합니다....
소개 안녕하세요 GitHub 커뮤니티, 👋 현재 agentic AI architectures를 구축하고 convex optimization에 많이 참여하고 있는 사람으로서, l...
Enterprise AI 팀은 벽에 부딪히고 있습니다 — 모델이 추론을 못해서가 아니라, 그 아래의 워크플로우가 에이전트를 위해 설계되지 않았기 때문입니다. 작업이 ...
Flow matching (FM)은 간단한 prior에서 복잡한 data distribution으로 샘플을 이동시키는 time-dependent vector field를 학습합니다. 그러나 고차원에서는 …
우리는 HyCOP를 소개한다. 이는 단순 모듈(advection, diffusion, learned closures, bound…)을 조합하여 파라메트릭 PDE 솔루션 연산자를 학습하는 모듈식 프레임워크이다.