[Paper] LFM2 기술 보고서
우리는 LFM2, 효율적인 온‑디바이스 배포와 강력한 작업 능력을 위해 설계된 Liquid Foundation Models 패밀리를 소개합니다. 하드웨어‑인‑루프 아키텍처를 사용하여…
우리는 LFM2, 효율적인 온‑디바이스 배포와 강력한 작업 능력을 위해 설계된 Liquid Foundation Models 패밀리를 소개합니다. 하드웨어‑인‑루프 아키텍처를 사용하여…
Split learning은 모델을 분산 디바이스에서 학습시켜 데이터 공유를 피함으로써 데이터 프라이버시 문제를 해결하는 방법으로 잘 알려져 있습니다, 따라서 데이터 공유를 초래하는…
이란의 중소기업(SMEs)은 점점 더 Telegram을 활용하여 판매를 진행하고 있으며, 실시간 참여가 전환에 필수적입니다. 그러나, dev...
Direct Preference Optimization (DPO)은 다양한 분야에서 널리 사용되는 인간 피드백을 통한 강화 학습(RLHF) 방법입니다. 최근 연구는 증가…
우리는 learning-augmented 설정에서, $n$개의 offline 정점과 $n$개의 online 정점을 갖는 random arrival order model에서 online unweighted bipartite matching 문제를 연구한다.
우리는 Hierarchical AI-Meteorologist를 소개합니다. 이는 LLM-agent 시스템으로, 계층적 forecast reasoning과 weather를 활용하여 설명 가능한 weather reports를 생성합니다. ...
멀티모달 이해, 생성 및 재구성 표현을 단일 토크나이저에 통합하는 것은 통합 모델을 구축하는 데 있어 핵심 과제로 남아 있습니다. Previo...
초보 사용자와 전문가 사용자는 task-oriented dialogues에서 서로 다른 체계적인 선호도를 가지고 있습니다. 그러나 이러한 선호도에 맞추는 것이 실제로 사용자 …
현대의 large language models는 multimodal이 되어 텍스트와 이미지와 같은 다양한 데이터 형식을 분석합니다. fine-tuning은 이러한 multimodal을 적응시키는 데 효과적입니다.
Despite recent progress in multilingual speech processing, African languages remain under-represented in both research and deployed systems, particularly when i...
현대 리테일에서는 의류, 식료품, 화장품, 냉동식품 등 다양한 제품이 제공되면서 수요를 예측하기 어렵고, ...
Program synthesis는 입력‑출력 예시와 같은 사양 집합을 따라 컴퓨터 프로그램을 생성하는 과정입니다. It can be modeled a...