[논문] SCOPE: 선택적 컨포멀 최적화된 쌍별 LLM 판단
대규모 언어 모델(LLMs)은 비용이 많이 드는 인간 선호 라벨을 대체하기 위해 쌍별 평가에서 판사 역할을 점점 더 많이 사용되고 있습니다. 실용성에도 불구하고, LLM j...
대규모 언어 모델(LLMs)은 비용이 많이 드는 인간 선호 라벨을 대체하기 위해 쌍별 평가에서 판사 역할을 점점 더 많이 사용되고 있습니다. 실용성에도 불구하고, LLM j...
최근 몇 년간, neural architectures가 discrete algorithms를 실행하는 학습 능력을 이해하려는 관심이 증가하고 있으며, 이는 종종 ...
NLP를 사용하여 실제 학습자 언어를 분석하면 자동화된 평가 및 피드백 도구를 구축하는 데 도움이 됩니다. 또한 개발에 대한 새롭고 광범위한 통찰을 제공합니다.
이미지와 비디오에서 이상을 감지하는 것은 산업 검사, computer-assisted diagnosis 등 여러 실제 문제에 필수적인 작업입니다.
진정한 풀뿌리 활동과 자동화된 인플루언스 작전 사이의 구분이 무너지고 있다. 정책 논의가 bot farms에 초점을 맞추는 동안, 별개의 위협이…
Memory-efficient backpropagation (MeBP)은 1GB 미만의 메모리로 모바일 디바이스에서 대규모 언어 모델(LLMs)의 1차 미세조정을 가능하게 했습니다. 그러나...
이 논문은 Spectral-Interpretable and -Enhanced Transformer (SIEFormer)라는 새로운 접근법을 제시하며, 스펙트럴 분석을 활용하여 어텐션을 재해석합니다.
본 논문에서는 다양한 bio-inspired 모델들의 구조적 및 기능적 차이를 보다 잘 이해하기 위해 통합 프레임워크를 제시합니다. 우리는 liq...
Jhana advanced concentration absorption meditation (ACAM-J)는 의식과 인지 처리에 깊은 변화를 일으키며, 이들의 연구를 …
대형 언어 모델(LLMs)이 어떻게 그리고 왜 실패하는지를 이해하는 것이 모델이 빠르게 진화하고 정적 평가가 뒤처지는 상황에서 핵심 과제가 되고 있다. While a...
자율주행 기술이 광범위한 채택을 향해 발전함에 따라, 다양한 환경 조건에서 안전한 운영 임계값을 결정하는 것이 중요해지고 있다.
Recaptioning: 멀티모달 모델을 위한 고품질 설명 설계 🚀 멀티모달 AI에서는 종종 “Garbage In, Garbage Out” 문제에 직면합니다: 스크랩된 im...
설명 가능한 AI (XAI) 연구 커뮤니티는 수많은 기술적 방법을 제안했지만, 설명 가능성을 시스템으로 배포하는 것은 여전히 어려운 과제입니다: Interactive ex...
markdown !Apple AI research illustration https://9to5mac.com/wp-content/uploads/sites/6/2025/07/machine-learning-research.jpg?quality=82&strip=all&w=1600 한 팀…
Dynamic Memory Sparsification DMS NVIDIA 연구원들은 Dynamic Memory Sparsification DMS를 도입했으며, 이 기술은 대규모…
번역할 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다.
범용 로봇에 대한 오랜 비전은 자연어 지시를 이해하고 실행하는 능력에 달려 있습니다. Vision-Language-Action (VLA...
Visual illusions은 전통적으로 multi-view consistency와 같은 spatial manipulations에 의존합니다. 이번 연구에서는 새로운 Progressive Semantic Illusions, a novel …
통합 모델은 단일 아키텍처 내에서 멀티모달 이해와 생성을 모두 처리할 수 있지만, 일반적으로 반복 없이 단일 패스로 작동합니다…
Context distillation은 언어 모델이 인-컨텍스트 지식을 파라미터에 내재화하도록 합니다. 우리 연구에서는 On-Policy Context Distillation을 제안합니다 (...).
Diffusion Transformers를 이용한 실시간 비디오 생성은 3D self-attention의 2차 비용 때문에 병목 현상이 발생하며, 특히 실시간 환경에서…
Self-supervised learning (SSL)은 라벨이 없는 시계열 데이터로부터 학습하기 위한 강력한 패러다임이다. 그러나 masked autoencoders (MAEs)와 같은 인기 있는 방법들은 …
Diffusion large language models (DLLMs)은 여러 토큰을 병렬로 디코딩함으로써 빠른 텍스트 생성을 가능하게 할 잠재력을 가지고 있습니다. 그러나 실제로는, 그들의 i...
관찰된 현상을 상징적이고 해석 가능한 공식으로 설명하는 것은 과학의 근본적인 목표이다. 최근 대형 언어 모델(LLMs)이 등장했다.
우리는 등거리 군 작용에 수직인 방향으로 투사된 잡음이 포함된 Langevin dynamics를 연구한다. 이 수학적 모델은 새로운 통찰을 제공하기 위해 도입되었다.
표준 벤치마크에서 낮은 word error rates를 달성한 speech recognition systems라도, 실제 배포 환경에서 짧고 high-stakes utterances에 대해서는 종종 실패한다.
데이터 믹싱 — 서로 다른 도메인의 데이터를 어떤 비율로 섞을지 결정하는 것 — 은 언어 모델(LMs) 훈련에서 일차적인 관심사이다. 기존의 믹싱 방법...
Supervised fine-tuning (SFT)은 계산 효율성이 높지만 강화 학습(RL)에 비해 일반화 성능이 종종 떨어집니다. 이 차이는 주로…
AI 모델은 textual reasoning에서 state-of-the-art 결과를 달성했지만, spatial 및 relational structures에 대한 추론 능력은 여전히 중요한 문제로 남아 있다.
고품질 3D 텍스처 생성은 현재 주류 멀티‑뷰 디퓨전 파이프라인에 내재된 뷰‑불일치(view‑inconsistency) 때문에 근본적인 과제로 남아 있습니다. ...
AI coding agents는 소프트웨어 개발에 점점 더 기여하고 있지만, 모바일 개발에 대한 그들의 영향은 실증적인 주목을 거의 받지 못했습니다. 이 ...
Tokenomics: 모든 AI 상호작용 비용을 낮추다 헬스케어에서의 진단 인사이트, 인터랙티브 게임에서의 캐릭터 대화, 그리고 자율적인 …
Multi-agent systems는 복잡한 현실 세계 문제를 해결하기 위해 여러 전문화된 language models를 점점 더 조정하고 있으며, 종종 이를 shared context에서 호출합니다.
GeForce NOW, 화면을 게이밍 머신으로 변신시킨다 2026년 2월 12일 — GeForce NOW 커뮤니티 https://blogs.nvidia.com/blog/author/geforcenowcommunity/ !Amazon F...
연구 미리보기: GPT‑5.3‑Codex‑Spark > Cerebras와 협력하여 만든 더 작고 실시간 코딩 모델.
이진 분류 시스템에서 decision thresholds는 model scores를 행동으로 변환합니다. 적절한 thresholds를 선택하는 것은 t의 특정 분포에 의존합니다.
무료 영국 억양 생성기: 온라인에서 진짜 영국 목소리를 만들어내는 현실적인 AI 텍스트‑투‑스피치. MP3 오디오를 무료로 생성하고 다운로드하세요. 사용 방법은…
에지 디바이스의 급증으로 인해 실시간으로 악성코드를 탐지하면서 엄격한 컴퓨...
아마도 당신은 AI 빌더이거나 CISO일 수도 있습니다. 당신은 방금 개발 팀을 위해 AI 에이전트 사용을 승인했습니다. 데이터 유출, prompt와 같은 위험을 알고 있습니다.
'2026년 1월 29일
중국 AI 스타트업 Zhupai z.ai가 GLM‑5를 발표했습니다. GLM‑5는 Zhupai의 GLM 시리즈에서 최신 대형 언어 모델(LLM)이며, MIT 오픈‑소스 라이선스 하에 출시되었습니다.
기사 목록으로 돌아가기
소개 AI agents는 오늘날 기술 분야에서 점점 더 두드러지고 있으며, 그 모멘텀은 둔화될 기미가 없습니다. 이들은 이제 필수적인…
LLM 비용의 실제 요인 1. 모델을 호출하는 빈도 이것은 명백해 보이지만, 빈도는 빠르게 누적됩니다. 루프 안에서의 추가 호출, 불필요한 va...
좌절스러운 사라짐: Claude 세션이 컨텍스트를 잃는 이유와 해결 방법 저는 최근에 Claude와 씨름하며 comp를 만들려고 하면서 좌절스러운 오후를 보냈습니다.
현재 신경 시스템에서 메모리에 대한 현재 접근 방식은 similarity-based retrieval에 의존한다: query가 주어지면 가장 representationally similar한 stored state를 찾는다. This as...
두 상 흐름에서의 계면 역학은 운동량, 열, 그리고 물질 전달을 지배하지만, 실험적으로 측정하기는 여전히 어렵습니다. 고전적인 기법들은 침입성…
최근 robot learning의 최근 발전은 인간 수준의 역량에 접근할 수 있는 유능한 플랫폼에 대한 큰 관심을 불러일으켰습니다. 이러한 관심은 …