[Paper] 차세대 CAPTCHA: 인지 격차를 활용한 확장 가능하고 다양한 GUI-에이전트 방어
GUI 기반 에이전트의 급속한 진화로 인해 기존의 CAPTCHA가 구식이 되었습니다. 이전 벤치마크인 OpenCaptchaWorld와 같은 것들은 기준선을 설정했지만…
3058 posts from this source
GUI 기반 에이전트의 급속한 진화로 인해 기존의 CAPTCHA가 구식이 되었습니다. 이전 벤치마크인 OpenCaptchaWorld와 같은 것들은 기준선을 설정했지만…
시계열 데이터는 금융 및 기후 과학과 같은 다양한 분야를 지원하지만, 그 급격한 성장으로 인해 저장 및 계산에 부담이 가중됩니다. 데이터셋 압축은 이를 완화할 수 있습니다.
우리는 신경의 콤팩트하게 지원되는 무어 복합체를 이용해 풍부 군집(ample groupoids)의 호몰로지를 연구한다. (A)를 위상 아벨 군(topological abelian group)이라 하자. (n ge 0)에 대해 (C_n(mathcal G;A)) …
프라이버시는 patient‑provider trust를 유지하는 인간의 권리입니다. Clinical notes는 환자의 개인적인 취약성과 개성을 포착하며, 이는 …
Computer-use agents (CUAs)는 지난 1년 동안 엄청난 진전을 이루었지만, 여전히 사용자의 원래 의도와 벗어나는 misaligned actions를 자주 만들어냅니다.
우리는 Next Concept Prediction (NCP)이라는, Next Token Prediction (NTP)을 기반으로 한 생성적 사전학습 패러다임을 제안한다. NCP는 이산적인 개념을 예측한다 that spa...
Transformer 아키텍처는 시계열 예측에서 강력한 베이스라인을 확립했지만, 일반적으로 균일하고 독립적인 위치 인코딩에 의존합니다.
세계 모델은 행동 조건부 p...를 통해 에이전트가 환경 역학을 추론하도록 함으로써 구현된 지능의 초석으로 부상했습니다.
회귀 신경망(NN)은 일반적으로 평균 제곱 예측 오차를 최소화함으로써 학습되며, 이 오차는 이상치와 데이터 오염에 매우 민감합니다.
MIT, Apache-2.0, BSD-3-Clause와 같은 관용 라이선스가 오픈소스 AI를 지배하고 있으며, 이는 모델, 데이터셋, 코드와 같은 아티팩트를 자유롭게 사용할 수 있음을 나타냅니다,…
자율주행 차량 및 산업용 IoT와 같은 안전이 중요한 애플리케이션은 딥 뉴럴 네트워크를 활용한 의미 기반 통신(SemCom) 시스템을 도입하여 redu...
LLM 기반 도구들은 소프트웨어 개발 작업을 빠른 속도로 자동화하고 있지만, 다양한 아키텍처 선택이 … 평가할 엄밀한 방법이 없습니다.
현대의 딥 뉴럴 네트워크(DNN) 애플리케이션은 맞춤형 작업을 위한 엄격한 지연 시간 요구 사항을 갖는 추론 파이프라인에 여러 DNN 모델을 통합합니다. T...
이 논문은 다중 모드 Genetic Algorithm과 Graph Neural Network를 하이브리드하여 timetabling optimization에 미치는 영향을 조사한다. Graph Neural Net...
Tensor는 현대 인공지능(AI) 시스템의 가장 기본적이고 필수적인 데이터 구조입니다. Tensor의 자연스러운 특성, 특히 메모리‑c...
Federated learning (FL)은 자원 제한이 있는 Internet of Things (IoT) 환경에서 널리 채택되는 분산 학습 패러다임입니다. 이러한 장치들은 일반적으로...
Compute Express Link (CXL) 3.0 및 그 이후 버전은 클러스터의 컴퓨트 노드가 하드웨어 캐시 일관성을 통해 데이터를 공유하고 캐시 라인 단위로 공유할 수 있게 합니다.
GPU 가속 데이터 분석에서, CPU에서 GPU로의 데이터 전송 오버헤드는 데이터가 GPU 메모리 용량을 초과하여 규모가 커질 때 성능 병목이 된다.
유럽 방위청(European Defence Agency)의 개정된 Capability Development Plan(CDP)은 우선 순위로 지상 전투 능력 향상을 위해 병사들의 장비를 강화하는 것을 식별합니다.
대규모 언어 모델은 latency attacks라는 새로운 중대한 위협에 직면하고 있습니다. LLM inference는 본질적으로 비용이 많이 들기 때문에, 약간의 지연이라도 tr...
Adaptive learning systems는 성과 지표를 기반으로 콘텐츠 전달을 최적화하지만, 신경다양성을 특징짓는 동적인 주의 변동을 무시한다…
Vision-Language Models (VLMs)를 edge devices에 배포하는 것은 resource constraints와 distribution shifts 하에서 performance degradation라는 문제에 직면합니다. While test-...
Planning은 현대 에이전트 시스템이 복잡하고 long‑horizon 과제를 탐색하는 데 있어 핵심 역량이 되었지만, 기존 접근 방식은 주로 …에 의존한다.
Chain-of-Thought 추론은 멀티모달 대형 언어 모델(MLLMs)의 해석 가능성을 높이기 위해 널리 사용되지만, 생성된 ...의 충실도는 아직 충분히 보장되지 않는다.