[Paper] KLong: 극도로 긴‑시간 지평 작업을 위한 LLM 에이전트 훈련
이 논문은 극히 긴 시간 범위 작업을 해결하도록 훈련된 오픈소스 LLM 에이전트인 KLong을 소개한다. 원리는 먼저 트래젝토리를 통해 모델을 콜드스타트하는 것이다.
이 논문은 극히 긴 시간 범위 작업을 해결하도록 훈련된 오픈소스 LLM 에이전트인 KLong을 소개한다. 원리는 먼저 트래젝토리를 통해 모델을 콜드스타트하는 것이다.
Instruction‑following language models는 도움이 되고 안전하도록 훈련되지만, 그들의 안전 행동은 온건한 fine‑tuning 하에서는 악화될 수 있고, ad… 아래에서 더욱 악화될 수 있다.
대규모 언어 모델(LLM)은 점점 더 긴 코드 컨텍스트에 대한 추론이 필요한 소프트웨어 엔지니어링 작업을 지원하고 있지만, 다양한 입력에 따라 그 견고성은 아직 충분히 검증되지 않았다.
매일 운전자는 내비게이션 앱을 확인하지만, 도착했을 때 주차 공간이 없다는 것을 알게 된다. 결국 주차를 하고 걸어갈 때까지는...
피드백이 task structure보다 더 빨리 흡수될 때, 학습자는 진실보다 피드백을 선호하게 된다. 두 시간 척도(two‑timescale) 모델은 이러한 feedback‑truth 관계를 보여준다.
Latent space models은 고차원 이산 데이터 매트릭스, 예를 들어 전자 건강 기록(EHRs)의 patient-feature 매트릭스 등을 분석하는 데 널리 사용됩니다.
LLM 기반 에이전트는 복잡한 권한 정책이 필요한 상황에서 점점 더 많이 배치되고 있습니다: 고객 서비스 프로토콜, 승인 워크플로우, 데이터 액세스...
대형 언어 모델(LLMs)은 생물학 벤치마크에서 강력한 성능을 보이며, 초보자들이 이중용도 실험실 기술을 습득하는 데 도움을 줄 수 있다는 우려를 불러일으키고 있습니다. Ye...
Machine unlearning은 훈련된 모델에서 특정 데이터 포인트를 제거하는 것을 목표로 하며, 종종 ‘perfect retraining’을 모방하려고 합니다. 즉, …
Single-cell RNA sequencing (scRNA-seq) 데이터는 강력하고 재현 가능한 통계적 구조를 보여준다. 이는 대규모 foundation 모델 개발을 촉진하였다.
다중 가설 검정과 거짓 발견율(FDR) 제어는 통계적 추론에서 기본적인 문제이며, 유전체학, 약물 분야 등에 널리 적용됩니다.
본 연구에서는 공정 k‑center 문제의 근사 난이도를 연구한다. 여기서 데이터 포인트는 그룹으로 분할되며, 과제는 …