[Paper] AI 챗봇의 광고? 대형 언어 모델이 이해 상충을 어떻게 탐색하는가
오늘날의 large language models (LLMs)은 reinforcement learning과 같은 방법을 통해 사용자 선호에 맞추도록 훈련됩니다. 그러나 모델들은 점점 d...
오늘날의 large language models (LLMs)은 reinforcement learning과 같은 방법을 통해 사용자 선호에 맞추도록 훈련됩니다. 그러나 모델들은 점점 d...
스티어링 벡터를 대형 언어 모델(LLMs)에 적용하는 것은 효율적이고 효과적인 모델 정렬 기술이지만, 이에 대한 해석 가능한 설명이 부족합니다…
AI 에이전트는 당신의 받은편지함을 자동화할 수 있을지도 모르지만, 삶의 다른 일상적인 측면을 자동화할 수 있을까요? 매일의 온라인 작업은 현실적이면서도 아직 해결되지 않은 테스트를 제공합니다.
대형 언어 모델(LLMs)은 매개변수에 사실 지식을 기억하는 데 어려움을 겪을 수 있으며, 이는 종종 환각을 일으키고 지식‑
대규모 언어 모델(LLMs)은 놀라울 정도로 복잡한 작업을 수행할 수 있지만, 이러한 능력이 사전 학습 중에 어떻게 나타나는지에 대한 세밀한 세부 사항은 여전히 충분히 이해되지 않고 있다.
우리는 최근 Kleinberg와 Mullinathan [KM24]가 도입한 모델인 language generation in the limit를, differentia의 제약 하에서 연구를 시작한다.
과학은 현재 quality assurance에 대해 두 가지 옵션을 제공하지만, 둘 다 충분하지 않다. Journal gatekeeping은 integrity와 contribution을 모두 검증한다고 주장하지만 실제로는 …
Prompt injection attacks는 실제 응용 분야 전반에 걸쳐 심각한 보안 위험을 초래합니다. 점점 더 많은 관심을 받고 있지만, 커뮤니티는 …
이전 연구에 따르면, 신경망 기반 노드 임베딩은 동일한 파라미터로 같은 데이터셋을 학습시켜도 서로 다른 결과를 반환한다는 것이 입증되었다, ju...
검증 가능한 보상을 이용한 강화 학습(RLVR)은 수학과 같은 형식적 영역에서 대형 언어 모델(LLM)의 추론 능력을 크게 향상시켰다…
Federated learning (FL)은 분산된 항공우주 함대 전반에 걸쳐 프라이버시를 보호하는 예측 유지보수를 가능하게 하지만, gradient communication overhead가 제약을 가한다.
Topological Data Analysis (TDA)는 데이터의 형태를 설명하는 도구를 제공하지만, 위상학적 특징을 딥러닝 파이프라인에 통합하는 것은 여전히 도전 과제이다.
검증 가능한 보상을 이용한 강화 학습(RLVR)으로 구동되는 대규모 추론 모델(LRMs)에서 상당한 진전이 있었음에도 불구하고, 이 패러다임은 근본적으로 …
Symbolic regression (SR)은 데이터에서 수학적 표현식을 발견하는 것을 목표로 하며, 이 작업은 전통적으로 조합적 …을 통해 Genetic Programming (GP)으로 해결됩니다.
Dock 기반 bike-sharing 시스템은 자전거 공급과 이용자 수요 사이에 공간적 불균형을 보이며, 이는 종종 야간 트럭 기반 재배치를 통해 해결됩니다. Th...
극한 엣지 애플리케이션을 위해, 이산 시간 신호에서 event detection 및 classification을 위한 단 몇십 개의 artificial neurons으로 구성된 최소 네트워크.
끈기와 신념, 반란의 영원한 이야기가 중심 무대로 떠오르며, Samson: A Tyndalston Story가 GeForce NOW에 합류합니다 https://www.nvidia.com/en-us/geforce-now/ li...
벤치마크 문제는 최적화 알고리즘에 대한 이해를 높이는 중요한 도구입니다. 알고리즘은 종종 벤치마크에서 좋은 성능을 목표로 하기 때문에, 편향 …
텍스트-투-이미지 생성은 기본 diffusion 모델을 중심으로 여러 모델을 포함하는 diffusion 워크플로우를 실행합니다. 기존 서빙 시스템은 각 워크플로우를 …
이 논문은 내부 Gaussian noise가 깊은 feedforward 신경망의 성능에 미치는 영향을 조사하며, noise injection의 역할에 초점을 맞춘다.
우리는 고전적인 Multi-Armed Bandit 설정을 고려하여 다양한 탐색 휴리스틱이 만드는 탐색/활용(tradeoffs)을 이해한다. 많은 탐색 h...
에이전트는 LLM 기반 컴포넌트로, 강력하고 임의적인 방식으로 환경을 변형시킬 수 있습니다. 프로덕션 환경에서 에이전트 실행에 대한 보장을 추출하는 것은…
시공간 신경 역학 및 진동 동기화는 생물학적 정보 처리에 널리 관여하며 이를 지원하는 것으로 가설이 제시되어 왔습니다.
NP-난이도 조합 최적화 문제, 예를 들어 차량 경로 문제(VRP)와 같은 고성능 메타휴리스틱을 설계하는 것은 여전히 중요한 도전입니다.
모태펀드 장기·스케일업 투자 업계 간담회 중소벤처기업부가 9일 한국벤처투자에서 모태펀드 운용사·투자기업·전문가 등과 함께 ‘모태펀드 장기·스케일업 투자 업계 간담회’를 개최했습니다.
Transformer의 Self-attention은 동적인 피연산자를 생성하여 기존 Compute-in-Memory (CIM) 가속기를 비용이 많이 드는 비휘발성 메모리(NVM)로 강제합니다.
산업 예측은 종종 다중 소스 비동기 신호와 다중 출력 목표를 포함하고, 배포에서는 예측 사이의 명시적인 트레이드오프가 필요합니다.
개요: 소비자 SSD의 비용이 급격히 상승했으며, 이는 최근 RAM 부족 현상을 반영합니다. 1년 전에는 이미 높게 느껴졌던 가격이 이제는 몇 배로 상승했습니다....
Large Chunk Test-Time Training (LaCT)는 긴 컨텍스트 3D 재구성에서 강력한 성능을 보여왔지만, 완전한 플라스틱 추론 시간 업데이트는 여전히 취약...
Exact relevance certification은 좌표 구조화된 의사결정 문제에서 최적 행동을 결정하는 데 필요한 좌표가 무엇인지 묻는다. The tractable fa...
모션 제어 비디오를 생성하는 것은—사용자가 지정한 행동이 자유롭게 선택된 시점에서 물리적으로 타당한 장면 동역학을 구동하도록—두 가지 능력을 요구한다.
생성형 인공지능(AI)의 급속한 성장으로 전례 없는 계산 요구가 발생했으며, 이는 에너지 발자국의 상당한 증가를 초래하고 있다.
Pluralistic alignment는 대형 언어 모델(Large Language Models, LLMs) 개발에서 중요한 최전선으로 부상했으며, reward models(RMs)는 핵심 메커니즘으로 작용합니다.
우리는 TC‑AE를 제안한다. 이는 ViT 기반의 딥 압축 오토인코더 아키텍처이다. 기존 방법들은 일반적으로 잠재 표현의 채널 수를 증가시킨다.
3D Gaussian Splatting (3DGS)은 빠른 새로운 시점 합성에 혁신을 가져왔지만, 불투명도 기반의 공식화는 표면 추출을 근본적으로 어렵게 만든다. U...
robot learning을 확장하려면 실제 환경에서 풍부하고 장기적인 상호작용을 포함한 인간 데이터가 필요할 가능성이 높습니다. 이러한 데이터를 수집하기 위한 기존 접근법은…
훈련 데이터의 선택이 AI 모델에 어떤 영향을 미치는가? 이 질문은 interpretability, privacy, 그리고 basic science에 있어 중심적인 중요성을 가진다. 그 핵심은 …
본 논문에서는 비동기 Q…에 의해 생성된 Polyak‑Ruppert 평균 반복에 대한 고차원 central limit theorem의 수렴 속도를 유도한다.
Propositional Linear Temporal Logic (LTL)은 소프트웨어, 네트워크 등에서 바람직한 요구사항 및 보안·프라이버시 정책을 지정하기 위한 인기 있는 형식이다.
신경망의 복잡성이 증가함에 따라 자원 제한이 있는 장치에서 분산 머신러닝을 배포하는 것이 어려워집니다. Split learning (SL)은 …
Multiple Instance Learning (MIL)은 컴퓨터 병리학에서 기가픽셀 전체 슬라이드 이미지(WSI) 분류를 위한 지배적인 프레임워크입니다. 그러나 현재 MIL…
공간 이해는 인간 수준 지능의 근본적인 초석입니다. 그럼에도 불구하고 현재 연구는 주로 도메인 특화 데이터에 초점을 맞추고 있습니다…
고급 원자로의 Real-time supervisory control은 물리적 센서가 위치한 지점을 포함한 plant‑wide thermal‑hydraulic 상태를 정확히 예측해야 합니다.
교육 분야에서 인공지능(AI)에 대한 논쟁은 종종 교육을 점점 더 자동화되거나 위임될 수 있는 모듈식·절차적인 작업으로 묘사한다…
GROMACS는 고전 분자 동역학(MD)의 사실상 표준이다. 거의 양자 수준의 정확성을 MD 전반에 걸쳐 추구하는 AI 기반 interatomic potentials의 부상이…
임상 전문성은 의료 지식을 습득하는 것뿐만 아니라 재사용 가능한 진단 패턴을 만들어내는 경험을 축적함으로써 향상됩니다. 최근 LLMs 기반 ...
대규모 언어 모델(LLMs)이 민감한 사용자 데이터로 점점 더 많이 학습됨에 따라, 언어 학습에서 프라이버시의 근본적인 비용을 이해하는 것이 필수적이 된다…
대형 언어 모델(LLMs)이 정적 챗봇에서 autonomous agents로 진화함에 따라, 주요 취약점 영역은 최종 출력에서 intermediate …