[Paper] 3D Generative Model을 재활용한 Autoregressive Layout Generation
우리는 LaviGen을 소개한다. 이 프레임워크는 3D 생성 모델을 재활용하여 3D 레이아웃 생성을 수행한다. 텍스트로부터 객체 레이아웃을 추론하는 기존 방법과 달리 …
우리는 LaviGen을 소개한다. 이 프레임워크는 3D 생성 모델을 재활용하여 3D 레이아웃 생성을 수행한다. 텍스트로부터 객체 레이아웃을 추론하는 기존 방법과 달리 …
UAV 비전-언어 내비게이션(VLN)은 에이전트가 자기 중심적인 관점에서 복잡한 3D 환경을 탐색하면서 모호한 다단계 지시를 따르는 것을 요구한다.
대기 안개는 야생동물 이미지의 품질을 크게 저하시켜, animal detection, tracking 등 보존에 필수적인 computer vision 응용 프로그램을 방해합니다.
느리거나 메타안정적인 거동을 보이는 Stochastic dynamical systems는 장시간 스케일에서 고차원 주변 공간의 알려지지 않은 low-dimensional manifold 위에서 진화한다.
머신러닝(ML) 결과를 투명하고 사용자 친화적인 방식으로 설명하는 것은 설명 가능한 인공지능(XAI)의 도전적인 과제로 남아 있습니다. In t...
대규모 언어 모델(LLMs)은 다양한 출처의 정보를 추론할 수 있는 능력 때문에 소분자 약물 설계를 가속화할 잠재력이 있습니다…
대부분의 자동 정리 증명 접근 방식은 형식 증명 시스템에 의존하지만, 비공식 정리 증명은 대규모 언어 모델과 더 잘 맞을 수 있다...
이 논문은 다양한 정중함 및 무례함 정도를 가진 사용자 프롬프트에 대한 대형 언어 모델(Large Language Models, LLMs)의 반응을 탐구한다. Politeness Theory에 따르면...
AI 지원 비디오 제작이 점점 실용화됨에 따라, 명령 기반 비디오 편집은 생성되거나 촬영된 영상의 정교화를 위해 필수적이 되었습니다…
베트남의 법률 텍스트의 복잡성은 대중이 정의에 접근하는 데 상당한 장벽을 제시합니다. Large Language Models는 유망한 해결책을 제공하지만…
수중 이미지는 빛의 흡수와 산란으로 인해 색 왜곡, 저대비, 흐릿한 디테일 등 심각한 퇴화를 겪는 경우가 많습니다.
기존의 다중위험 감수성 매핑(MHSM) 연구는 종종 공간적으로 균일한 모델에 의존하고, 위험을 독립적으로 다루며, 제한된 표현을 제공한다.
Vision Language models (VLMs)은 다양한 벤치마크에서 강력한 성능을 보여왔지만, 종종 모달리티 우위(modality dominance) 현상을 겪으며, 여기서 …
최근 언어 모델의 발전은 자연어 이해(NLU)를 크게 향상시켰습니다. 널리 사용되는 벤치마크는 대형 언어…
시각‑언어 모델(VLMs)에서의 추론은 최근 다양한 다운스트림 작업에 걸친 폭넓은 적용 가능성 때문에 큰 주목을 받고 있습니다. 그러나,…
회의 플랫폼 Zoom은 Sam Altman의 인간 ID 검증 회사인 World와 파트너십을 발표했으며, 회의에 참석하는 사람들이 실제로…
Image geolocalization은 전통적으로 retrieval‑based place recognition 또는 geometry‑based visual localization pipelines를 통해 해결되어 왔습니다. Recent advance…
우리는 HILBERT (HIerarchical Long-sequence Balanced Embedding with Reciprocal contrastive Training)를 제안한다. 이는 문서 학습을 위한 cross‑attentive 멀티모달 프레임워크이다.
Reinforcement learning은 large multi-modal models에서 video reasoning을 발전시켰지만, 지배적인 파이프라인은 대부분 on-policy self-exploration에 의존하여 성능이 plateau…
검증 가능한 보상을 사용하는 강화 학습(RLVR)은 일반적으로 중간 추론에 대한 제약을 두지 않고 결과 보상을 최적화합니다. 이는…
Time-to-Collision (TTC) 예측은 충돌 방지에 있어 중요한 과제로, 정확한 시간 예측과 지역 및 전역적인 ...
의사결정자들은 작물 재배, 산불 관리, 물·에너지 배분, 그리고 기상 극한에 대비하기 위해 일기예보에 의존합니다. 오늘날 이러한 예보는 …
본 논문은 토큰 프루닝(token pruning)이라는 압축 기법을 통해 적응된 최신 다국어 대형 언어 모델(LLM)의 체계적인 벤치마크를 제시한다.
대규모 언어 모델은 신뢰성이 중요한 환경에 점점 더 많이 배치되고 있지만, 토큰 확률, 엔트로피와 같은 출력 수준의 불확실성 신호는 …
AP Computer Science Principles (CSP) 과정을 수강하는 중학생들은 일반적으로 웹 리소스(예: 튜토리얼, Q&A 사이트)를 활용하여 ...
소프트웨어 엔지니어링 연구는 지난 수십 년 동안 산출물과 참여 모두에서 급격한 성장을 경험했습니다. 그러나 이 분야의 능력에 대한 우려는 여전히 지속됩니다.
코드 생성은 사용자 요구 사항으로부터 실행 가능한 프로그램을 자동으로 생산하는 것을 의미합니다. 최근 연구자들은 corr...
Adapter 기반 방법은 대규모 언어 모델(Large Language Models, LLMs)의 지속적 학습(continual learning, CL)을 위해 순차적으로 저랭크 업데이트를 학습함으로써 비용 효율적인 접근법이 되었다.
카메라 유출 한국 매체 ETNews가 MacRumors를 통해 https://www.macrumors.com/2026/04/16/iphone-18-pro-variable-aperture-camera-production/ 에서 애플이…라고 보도했습니다.
대형 언어 모델(LLMs)은 복잡한 작업을 해결하기 위해 점점 더 chain-of-thought (CoT) 추론에 의존하고 있다. 그러나 추론 트레이스가 모두 기여하도록 보장하는 것은…
최근 연구들은 작은 aligned 모델을 proxy 로 사용하여 더 큰 base (unaligned) 모델의 생성을 안내하는 test-time alignment 방법을 제안했습니다. T...
분산 딥러닝에서 훈련 시간의 정확한 예측은 resource allocation, cost estimation, 그리고 job scheduling에 매우 중요합니다. 우리는 f...
TL;DR: MacBook Neo는 Apple에서 품절이며 배송 날짜가 5월로 미뤄졌지만, 여전히 Amazon에서 사상 최저가인 $589.99에 구매할 수 있습니다. https://zd...
우리는 German sign language (DGS) fairy tales에 대한 sentiment analysis를 위한 dataset과 model을 제시한다. 먼저, 우리는 세 가지 수준의 ...
Uber의 새로운 반품 기능 Uber는 금요일에 고객이 집을 나가지 않고도 구매한 물품을 반품할 수 있는 새로운 기능을 출시했습니다. 반품 기능은…
개요: Anthropic은 금요일에 Claude Design을 출시한다고 발표했습니다. 이는 사용자가 프로토타입, 슬라이드 등과 같은 시각 자료를 만들 수 있게 하는 실험적 제품입니다.
나는 30마일을 달렸고, 이것이 가장 정확한 Smartwatch이다. Apple, Samsung, Google, Garmin, 그리고 $80 와일드카드가 정면 대결을 펼친다....
익명의 독자가 월스트리트 저널의 보고서를 인용합니다: 필리핀과 고첨단 산업 허브를 설립하기 위한 합의는 트럼프 행정부…
새로운 Mac https://mashable.com/category/macbook 을(를) 구매하는 계산이 공식적으로 바뀌었습니다. $599 MacBook https://mashable.com/category/m…
소개는 보통 암묵적인 가정을 동반합니다: 많은 양의 라벨된 데이터가 필요하다는 것. 동시에, 많은 모델은 데이터에서 구조를 발견할 수 있습니다.
YouTube는 특정 순간을 공유하는 방식을 바꾸고 있습니다.
복잡한 구조를 더 단순한 하위 구조로 분해하는 것은 광범위한 응용 분야를 가진 강력한 기법입니다. 우리는 decomp…의 계산을 연구합니다.
OLED 업그레이드 개요: 업계 소식통에 따르면, Apple은 올해 말 OLED 디스플레이를 탑재한 iPad mini와 MacBook Pro 모델을 출시할 계획이라고 밝혔습니다.
죄송하지만, 번역하려는 텍스트를 제공해 주셔야 합니다. 해당 기사나 요약의 내용을 복사해서 알려주시면 한국어로 번역해 드리겠습니다.
TL;DR - T‑Mobile은 무료 기내 Wi‑Fi 분야에서 선두주자였습니다.
ASUS RT‑BE82U 듀얼‑밴드 Wi‑Fi 7 라우터 – 딜. 업그레이드를 원한다면…
!IOD_Map https://www.iceye.com/hs-fs/hubfs/_DATA_AND_MISSIONS/Open%20Data/IOD_Map.jpg?width=960&height=540&name=IOD_Map.jpg Open SAR 데이터 맵 브라우저 사용 가능한 항목 탐색
Swarm protocols은 스웜이라고 불리는 피어‑투‑피어 시스템을 지정하고 구현하며 검증하기 위해 최근에 도입된 formalism이다. 스웜은 분산…