[Paper] ASTRO: 동역학 기반 궤적 롤아웃을 통한 적응형 스티칭
오프라인 강화 학습(RL)은 사전 수집된 데이터셋으로부터 에이전트가 최적 정책을 학습하도록 합니다. 그러나, 최적이 아닌 및 단편적인 데이터를 포함하는 데이터셋은...
오프라인 강화 학습(RL)은 사전 수집된 데이터셋으로부터 에이전트가 최적 정책을 학습하도록 합니다. 그러나, 최적이 아닌 및 단편적인 데이터를 포함하는 데이터셋은...
머신러닝 모델은 진단, 날씨 예측, NLP, 자율 주행 등과 같은 분야에서 좋은 성능을 보이지만, 그들의 제한된 불확실성 처리...
우리는 SuperIntelliAgent를 소개합니다. 이는 학습 가능한 작은 diffusion model(learner)과 고정된 large language model을 결합한 agentic learning framework입니다.
자동화된 취약점 패치는 소프트웨어 보안에 필수적이며, 최근 Large Language Models(LLMs)의 발전은 자동화된 …에 대한 유망한 역량을 보여줍니다.
우리는 LFM2, 효율적인 온‑디바이스 배포와 강력한 작업 능력을 위해 설계된 Liquid Foundation Models 패밀리를 소개합니다. 하드웨어‑인‑루프 아키텍처를 사용하여…
Split learning은 모델을 분산 디바이스에서 학습시켜 데이터 공유를 피함으로써 데이터 프라이버시 문제를 해결하는 방법으로 잘 알려져 있습니다, 따라서 데이터 공유를 초래하는…
이란의 중소기업(SMEs)은 점점 더 Telegram을 활용하여 판매를 진행하고 있으며, 실시간 참여가 전환에 필수적입니다. 그러나, dev...
우리는 learning-augmented 설정에서, $n$개의 offline 정점과 $n$개의 online 정점을 갖는 random arrival order model에서 online unweighted bipartite matching 문제를 연구한다.
우리는 Hierarchical AI-Meteorologist를 소개합니다. 이는 LLM-agent 시스템으로, 계층적 forecast reasoning과 weather를 활용하여 설명 가능한 weather reports를 생성합니다. ...
현대 리테일에서는 의류, 식료품, 화장품, 냉동식품 등 다양한 제품이 제공되면서 수요를 예측하기 어렵고, ...
Knowledge‑enhanced text generation은 내부 또는 외부 지식 소스를 활용하여 생성된 텍스트의 품질을 향상시키는 것을 목표로 합니다. While language models have...
이 연구는 “Machines that Can Remember”를 구축하는 도전을 탐구하며, 장기 기억을 효율적인 초장기 컨텍스트 모델링 문제로 정의합니다. W...