[Paper] JUST-DUB-IT: Joint Audio-Visual Diffusion을 통한 비디오 더빙
Audio-Visual Foundation Models는 사운드와 시각 콘텐츠를 공동으로 생성하도록 사전 학습된 모델로, 최근 다중‑...
Audio-Visual Foundation Models는 사운드와 시각 콘텐츠를 공동으로 생성하도록 사전 학습된 모델로, 최근 다중‑...
프루닝에서, Lottery Ticket Hypothesis는 큰 네트워크가 희소 서브네트워크, 즉 winning tickets를 포함하고 있으며, 이들은 별도로 훈련되어 t...와 일치하도록 할 수 있다고 제시한다.
추론 지향 대형 언어 모델(LLMs)은 Chain-of-Thought (CoT) 프롬프트를 통해 눈부신 진전을 이루었지만, 여전히 근본적인 한계가 있다.
행렬 함수인 제곱근, 역제곱근, 그리고 직교화는 신경망 훈련을 위한 사전조건화된 gradient methods에서 핵심적인 역할을 합니다.
기존 에이전트 안전 벤치마크는 binary accuracy를 보고하며, early intervention과 post-mortem analysis를 혼동합니다. step 8에서 violation을 표시하는 detector는 …
Full-image relighting은 대규모 구조화된 paired data를 수집하기 어려운 점과 물리적 … 때문에 여전히 도전적인 문제로 남아 있다.
Pancreatic ductal adenocarcinoma (PDAC), 가장 치명적인 고형 악성 종양 중 하나로, 종종 늦은 단계에서 수술이 불가능한 상태로 발견됩니다. 선행 연구들의 회고적 검토는 …
대형 언어 모델(LLMs)은 복잡한 추론 작업에서 최첨단(state-of-the-art) 성능을 제공하지만, 추론(inference) 비용 때문에 대규모 배포가 제한됩니다. 작은 언어…
Multi-objective optimization은 경쟁하는 목표들을 가진 문제들을 해결하는 것을 목표로 하며, 종종 문제에 대한 black-box 접근만 가능하고 제한된 측정 예산을 가지고 있다.
Test-time scaling은 소프트웨어 엔지니어링(SWE) 작업에서 Large Language Model(LLM) 에이전트의 능력을 향상시키기 위해 널리 채택되었습니다. 그러나, the sta...
현재 generative video models는 text and image prompts로부터 새로운 콘텐츠를 생성하는 데 뛰어나지만, 기존 pre-recorded videos를 편집하는 데 중요한 격차를 남겨두고 있습니다, ...
Creative image generation은 새로운 고품질 이미지를 생산하고 경계를 확장하려는 필요에 의해 주도되는 매력적인 연구 분야로 부상했습니다.
대형 언어 모델(LLMs)은 질문 응답 및 진단을 포함한 의료 벤치마크에서 강력한 성능을 입증했습니다. 임상에서의 활용을 가능하게 하기 위해…
Quantization은 대규모 언어 모델(Large Language Model, LLM) 훈련의 연산(compute) 및 메모리 효율성을 크게 향상시켰습니다. 그러나 기존 접근 방식은 여전히 acc…
에너지는 이제 중요한 ML 컴퓨팅 자원입니다. 에너지 소비를 측정하고 추세를 관찰하는 것이 귀중한 첫 번째 단계이지만, 정확하게 이해하고 …
high-performance optical lenses를 설계하는 것은 surface curvatures, glass choices, element thickness 등과 같은 고차원이며 엄격히 제한된 공간을 탐색하는 것을 포함합니다…
대규모 언어 모델(Large Language Model, LLM) 애플리케이션을 평가하는 것은 전통적인 소프트웨어 테스트와 다릅니다. 왜냐하면 출력이 stochastic하고, high-dimensional하며, 민감하기 때문입니다.
AI 에이전트 추론은 추론 중심의 데이터센터 미래를 주도하고 있으며, 컴퓨팅을 넘어 메모리 용량, 메모리 대역폭 및 hig...
현대 소프트웨어 아키텍처는 적응형이고 확률적이며 상황에 의존적인 추론을 하는 자율 에이전트를 지원하는 데 어려움을 겪으며, 시스템 통합…
최근 연구에서는 Multi-Agent Reinforcement Learning (MARL)을 통해 LLM 협업을 최적화하는 방법을 탐구했습니다. 그러나 대부분의 MARL 파인튜닝 접근 방식은 사전...
AI 연구는 전통적으로 알고리즘 성능을 우선시해 왔으며, 예를 들어 머신 러닝에서 정확도를 최적화하거나 자동 계획에서 실행 시간을 최적화하는 것이 포함됩니다. 떠오르는...
인공지능의 급속한 부상은 에너지 소비의 지속 불가능한 증가를 초래했습니다. 이는 뉴로모픽 컴퓨팅 및 ph... 분야의 발전을 촉진했습니다.
Belief Propagation (BP)은 확률 그래프 모델에서 분산 추론을 위한 강력한 알고리즘이지만, 실제 환경에서는 금세 실행이 불가능해진다.
다중목표 진화 알고리즘(Multi-Objective Evolutionary Algorithms, MOEAs)은 다중목표 최적화 문제(Multi-Objective Optimisation Problems, MOOPs)를 해결하는 데 효과적인 것으로 입증되었습니다. 그러나 그들의 성능은 b...