[Paper] 진보의 대가: Algorithmic Efficiency와 AI Inference 비용 감소
언어 모델은 최근 몇 년간 고급 벤치마크에서 엄청난 진전을 보였지만, 이러한 진전의 대부분은 더 비용이 많이 드는 모델을 사용함으로써만 가능했습니다.
언어 모델은 최근 몇 년간 고급 벤치마크에서 엄청난 진전을 보였지만, 이러한 진전의 대부분은 더 비용이 많이 드는 모델을 사용함으로써만 가능했습니다.
Inverse heat problems는 관측되거나 알려진 열 확산 거동을 기반으로 재료의 thermophysical properties를 추정하는 것을 말합니다. Inverse heat problems는…
이 논문은 두 층 신경망을 이용한 모듈러 덧셈 학습에서 activation functions의 역할을 연구한다. 우리는 먼저 sharp expressivity gap을 확립한다: si...
오프라인 강화 학습(RL)은 사전 수집된 데이터셋으로부터 에이전트가 최적 정책을 학습하도록 합니다. 그러나, 최적이 아닌 및 단편적인 데이터를 포함하는 데이터셋은...
머신러닝 모델은 진단, 날씨 예측, NLP, 자율 주행 등과 같은 분야에서 좋은 성능을 보이지만, 그들의 제한된 불확실성 처리...
우리는 SuperIntelliAgent를 소개합니다. 이는 학습 가능한 작은 diffusion model(learner)과 고정된 large language model을 결합한 agentic learning framework입니다.
자동화된 취약점 패치는 소프트웨어 보안에 필수적이며, 최근 Large Language Models(LLMs)의 발전은 자동화된 …에 대한 유망한 역량을 보여줍니다.
우리는 LFM2, 효율적인 온‑디바이스 배포와 강력한 작업 능력을 위해 설계된 Liquid Foundation Models 패밀리를 소개합니다. 하드웨어‑인‑루프 아키텍처를 사용하여…
Split learning은 모델을 분산 디바이스에서 학습시켜 데이터 공유를 피함으로써 데이터 프라이버시 문제를 해결하는 방법으로 잘 알려져 있습니다, 따라서 데이터 공유를 초래하는…
이란의 중소기업(SMEs)은 점점 더 Telegram을 활용하여 판매를 진행하고 있으며, 실시간 참여가 전환에 필수적입니다. 그러나, dev...
우리는 learning-augmented 설정에서, $n$개의 offline 정점과 $n$개의 online 정점을 갖는 random arrival order model에서 online unweighted bipartite matching 문제를 연구한다.
우리는 Hierarchical AI-Meteorologist를 소개합니다. 이는 LLM-agent 시스템으로, 계층적 forecast reasoning과 weather를 활용하여 설명 가능한 weather reports를 생성합니다. ...