[Paper] Three-Step Nav: 제로샷 비전-언어 내비게이션을 위한 계층적 글로벌-로컬 플래너
멀티모달 대형 언어 모델(MLLMs)을 사용함으로써 알려지지 않은 환경에서의 비전 기반 내비게이션에 대한 획기적인 진전이 이루어졌습니다. 이러한 모델은 ...
멀티모달 대형 언어 모델(MLLMs)을 사용함으로써 알려지지 않은 환경에서의 비전 기반 내비게이션에 대한 획기적인 진전이 이루어졌습니다. 이러한 모델은 ...
우리는 Python에서 Blender 기반 procedural 3D 생성을 위한 라이브러리인 ProcFunc를 소개합니다. ProcFunc는 사용하기 쉬운 Python 함수들의 라이브러리를 제공하며, 이는 …
우리는 Hyper Input Convex Neural Networks (HyCNNs)를 소개한다. 이는 볼록 함수를 학습하도록 설계된 새로운 신경망 아키텍처이다. HyCNNs는 원칙을 결합한다.
소형 언어 모델(SLM)은 확장 가능한 배포를 위한 계산 효율성을 제공하지만, 종종 더 큰 모델이 보여주는 추론 능력에 미치지 못합니다…
Vision-language models (VLMs)은 정적인 시각 이해에서 강력한 성능을 보여왔지만, 여전히 동적인 공간 추론을 요구하는 상황에서는 어려움을 겪고 있습니다.
Alternating Direction Method of Multipliers (ADMM)는 구조화된 볼록 최적화에 널리 사용되는 방법이며, 실제 성능은 크게 …에 달려 있다.
Learning curves는 supervised learning에서 기본적인 primitive로, 알고리즘의 performance가 더 많은 data와 함께 어떻게 개선되는지를 설명하고 정량적인 …
이 논문은 100 GHz 이하의 밀리미터파(mm-wave) 발진기와 서브테라헤르츠(sub-THz) 분야에서의 최근 발전을 간결하면서도 포괄적으로 검토한다.
우리는 유한 깊이·유한 폭 트랜스포머 모델에서 멀티레이어 퍼셉트론(MLP) 블록을 포함한 토큰들의 레이어별 진화가 경로별 수렴을 이룸을 증명한다 …
이 논문은 전통적인 Gradient Boosting 프레임워크를 향상시킨 Multiple Additive Neural Networks (MANN) 방법론을 확장하고 설명한다, 활용하여...
단일 참조 이미지에서 목표 개념을 합성하는 것은 diffusion-based personalized text-to-image generation에서 어려우며, 특히 스티커 …에 대해.
Mixture-of-Experts (MoE) 모델은 입력당 소수의 전문가 모델만 활성화함으로써 높은 용량과 효율적인 추론 비용을 제공합니다. 그러나 Mo...
Patient portals는 이제 개인에게 전자 건강 기록(EHRs)에 직접 접근할 수 있게 해 주지만, 접근만으로는 환자가 이를 이해하거나 행동으로 옮길 수 있다는 보장은 없습니다.
우리는 UAPAR, Uncertainty-Aware Pedestrian Attribute Recognition 프레임워크를 제안한다. 우리가 알기로는 이것이 최초의 EDL 기반 불확실성 인식 f...
우리는 KAYRA를 소개합니다. KAYRA는 임상 세포유전학 실험실의 운영 제약 내에서 작동하는 엔드‑투‑엔드 핵형 분석 시스템입니다. KAYRA는 …
대형 언어 모델(LLMs)은 사전 학습 단계에서 대부분의 사실 지식을 다음 토큰 예측을 통해 습득합니다. 이후의 사후 훈련 단계에서는…
생성 AI(genAI) 시스템이 high-stakes decision-making에 사용될 때, 권장되는 역할은 인간 의사결정을 대체하기보다 지원하는 것입니다. 그러나,…
수천 개에 달하는 기록된 언어들 중 다수는 공통된 특징 구성을 공유하여, 유형학적으로 매우 드문 경우(예: object‑verb‑subject)부터 시작하는 스펙트럼을 형성한다.
우리는 HalluCiteChecker를 소개합니다. 이는 과학 논문에서 허위 인용을 감지하고 검증하기 위한 툴킷입니다. AI assistant technologies가 변혁을 일으킨 동안…
이 논문은 제한된 자원 하에서 수색 및 구조(SAR) 시나리오에 의해 동기가 부여된 무인 항공기(UAV) 임무를 위한 계층적 의사결정 프레임워크를 제시한다.
나는 Random Cloud 방법을 제안한다. 이는 훈련이 필요 없는 neural architecture search 접근법으로, stochastic 방식을 통해 최소한의 feedforward network topologies를 발견한다…
우리는 로봇 개체가 물리적으로 시뮬레이션된 2D 환경에 존재하고, 잠재적인 …를 만나기 위해 탐색해야 하는 Spatially Embedded Evolutionary Algorithm을 제시한다.
Transformer 기반 아키텍처는 전역 의미 인식에서 지배적인 패러다임을 확립했지만, 근본적으로 깊은 제약에 얽매여 있습니다.
지속 학습(continual learning) 설정에서 우리는 모델이 새로운 작업을 학습할 만큼 충분히 plastic하고, 이전에 학습된 능력을 방해하지 않을 만큼 충분히 stable하기를 요구한다.
Stargate 개요 Stargate는 OpenAI의 장기적인 노력으로, AGI의 혜택을 광범위하고 신뢰성 있게 전 세계에 제공하기 위해 필요한 컴퓨트 기반을 구축하는 것입니다.
Sensory‑First Intelligence: 뇌‑영감 신경 아키텍처에 대한 Agent‑Driven 접근법 오늘날 인공지능에서 지배적인 접근 방식은 scaling —...
이 논문은 text-only data를 활용하여 speech recognition을 개선하는 효율적인 방법을 조사하며, 빠른 ...을 촉진하는 encoder-dominated models에 초점을 맞춥니다.
다음은 MIT Schwarzman College of Computing과 IBM이 공동으로 발표한 내용입니다. IBM과 MIT는 오늘 MIT‑IBM Computing Research의 출범을 발표했습니다.
TL;DR: 3년짜리 ChatOn AI Assistant Premium Plan을 사용해 보세요—코드 CHAT30으로 정가 $119.99에서 $59.50으로 할인 중입니다. 연간 $20 이하에 해당합니다. Ov...
!https://www.androidauthority.com/wp-content/uploads/2024/08/Google-logo-white.jpg TL;DR - 미국 국방부가 제미니를 클래스...에 활용하고 있는 것으로 알려졌습니다.
문제 병렬 AI 코딩은 두 에이전트가 각각 자신만의 현실 버전을 유지하기 시작할 때까지는 마법처럼 느껴진다. 한 에이전트는 채팅 기록에서 규칙을 기억하고, ...
기대 깨기 우리는 도구 사용을 최대화하면 최대 이점을 얻는다고 가정하는 경향이 있습니다: AI를 더 많이 사용하면 더 큰 가치를 얻는다. 그러나 그 가정은 … 때문에 무너집니다.
소개 오랫동안 인공지능의 발전은 스케일링 법칙과 밀접하게 연결되어 왔으며, 모델 크기, 데이터셋 크기 및 컴퓨트 파워를 증가시키면…
액션 플랜 개요 Artificial intelligence는 cybersecurity를 재구성하고 있습니다. 방어자가 vulnerabilities를 식별하고, automate remediation을 수행하는 데 도움이 되는 동일한 기능들...
!AI 버그 슬레이어 🐞https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploa...
자신감 있게 저지른 실수—또는 말하자면 거짓말—은 c...
대부분의 사람들은 공부용 음악을 재생목록 문제로 생각합니다. 그들은 lo‑fi 믹스를 열고 몇 곡을 건너뛰며 분위기가 맞길 바랍니다. 개발자, 작가, 학생들에게는…
2026년 4월 14일
블룸버그 터미널의 복잡성 증가: 유명한 난해함으로 인해 블룸버그 터미널은 오랫동안 집착에 가까운 헌신을 불러일으켰다. 트레이더들 사이에서…
업데이트 2026년 4월 28일 – 18:33 UTC 우리는 Claude.ai에 접근하지 못하게 하는 문제와 인증 상승을 초래하는 문제를 해결하기 위해 계속 작업하고 있습니다...
재귀적이거나 루프된 언어 모델은 최근 잠재 상태에 걸쳐 동일한 모델 계산을 반복적으로 정제함으로써 새로운 스케일링 축으로 부상했습니다. 이를 통해 모델의 깊이를 ...
실제 세계 데이터 시각화(DV)는 네이티브 환경 기반, 크로스 플랫폼 진화, 그리고 사전적인 의도 정렬을 필요로 합니다. 그러나 기존 벤치마크는 …
출력 수준 감독(output-level supervision)만으로 사후 학습(post-training) 중에 추론 모델(reasoning models)을 새로운 작업에 적응시키는 것이 검증 가능한 보상(verifiable rewards) 기반 강화 학습(RLVR) 하에서 정체됩니다.
Identity teacher forcing (ITF)는 혼돈적인 동역학 시스템에 대한 결정론적 순환 대리 모델의 안정적인 학습을 가능하게 하며, 동역학 시스템에 대해 매우 효과적이었다.
분포론적 및 신경망 접근 방식은 자연어 의미론에 거의 전적으로 기존 선형 대수, 즉 벡터, 매트릭스, 텐서 등을 기반으로 구축되어 왔습니다.
Continual offline reinforcement learning (CORL)은 시간에 따라 수집된 데이터셋으로부터 일련의 작업을 학습하면서 이전에 학습한 작업에 대한 성능을 유지하는 것을 목표로 합니다.
접촉 변동성, 센싱 불확실성 및 외부 교란은 그립 실행을 확률적으로 만든다. 기대 품질 목표는 꼬리 결과를 무시하고 종종 …
선호 기반 정렬 방법, 특히 인간 피드백을 활용한 강화 학습(RLHF)은 인간 주석자의 판단을 사용하여 대규모 언어 모델을 형성합니다.