[Paper] RunAgent: 자연어 계획을 제약 기반 실행으로 해석
인간은 목표가 있는 계획을 실행함으로써 문제를 해결하지만, 대형 언어 모델(LLMs)은 구조화된 워크플로 실행에 여전히 신뢰할 수 없습니다. 우리는 RunAgent를 제안합니다.
인간은 목표가 있는 계획을 실행함으로써 문제를 해결하지만, 대형 언어 모델(LLMs)은 구조화된 워크플로 실행에 여전히 신뢰할 수 없습니다. 우리는 RunAgent를 제안합니다.
배경: 환자용 의료 챗봇은 retrieval-augmented generation (RAG)을 기반으로 하여 접근 가능하고 근거 있는 건강 정보를 제공하기 위해 점점 더 많이 홍보되고 있다.
다중언어 음성 클로닝에 사용되는 스피커 인코더는 오디오가 어떤 스크립트로 발화되었든 동일한 화자를 동일하게 처리해야 합니다. Off-the-shelf...
온라인 플랫폼, influence operations, 그리고 political rhetoric에서는 종종 pro-social sentiment(예: advocacy, helpfulness, co…)을 포함한 혼합된 감정을 유도한다.
Large language models (LLMs)은 금융 시나리오에 점점 더 많이 적용되고 있습니다. 그러나 이들은 불법 활동을 조장하는 것을 포함한 해로운 출력을 생성할 수 있습니다.
Large language model (LLM) agents는 일관된 personalization을 위해 long-term user memory가 필요하지만, 제한된 context windows가 evolving preferences를 추적하는 것을 방해한다.
강화 학습(RL)은 추론, 에이전시 능력 및 alignment을 위해 대형 언어 모델(LLM)의 사후 훈련에 필수적이 되었습니다. Success...
현실적인 장기 생산성 작업은 사용자별 computer environments에 크게 좌우되며, 그곳에 작업 컨텍스트의 대부분이 저장되고 조직됩니다...
Surprisal theory는 인간의 처리 노력과 다가오는 언어 단위의 예측 가능성을 연결하지만, 실증 연구는 종종 단위 개념을 충분히 정의하지 않는다.
대규모 멀티모달 모델(LMMs)을 위한 표준 사후 학습 레시피는 선별된 데모에 대해 supervised fine-tuning(SFT)을 적용한 뒤 reinforcement learning을 수행합니다.
교실 상호작용에 대한 연구는 오랫동안 large‑scale observation과 in‑depth ethnographic work 사이로 나뉘어 왔습니다. 우리는 이 meth…에 매핑하는 framework를 제안합니다.
대규모 언어 모델(LLMs)은 Table Question Answering을 발전시켰으며, 대부분의 질의는 정보를 추출하거나 간단한 집계로 답할 수 있습니다. 그러나...
최근 연구에 따르면 방대한 영어 웹 코퍼스를 고품질 하위 집합으로 필터링하면 학습 효율성이 크게 향상된다고 합니다. 그러나 high‑res…
수많은 메타과학 연구와 기타 이니셔티브가 오픈 사이언스 관행의 보편성을 모니터링하기 시작했으며, 이는 ‘d…’를 이해하는 것이 더 중요할 때입니다.
Large Language Models (LLMs)은 도시 분석에서 인간 인식을 대체하는 프록시로 점점 더 많이 사용되고 있지만, persona prompting이 …
문장의 syntactic structure는 단어들 사이의 syntactic dependencies를 나타내는 edges가 있는 tree로 표현될 수 있다. 그 구조가 star일 때, 그것은 …
Diffusion large language models (dLLMs)은 병렬 디코딩(parallel decoding)과 양방향 컨텍스트(bidirectional context)를 제공하지만, 최첨단(state-of-the-art) dLLMs는 경쟁력을 위해 수십억 개의 파라미터(parameters)가 필요합니다.
소형 언어 모델(SLM)은 확장 가능한 배포를 위한 계산 효율성을 제공하지만, 종종 더 큰 모델이 보여주는 추론 능력에 미치지 못합니다…
Patient portals는 이제 개인에게 전자 건강 기록(EHRs)에 직접 접근할 수 있게 해 주지만, 접근만으로는 환자가 이를 이해하거나 행동으로 옮길 수 있다는 보장은 없습니다.
대형 언어 모델(LLMs)은 사전 학습 단계에서 대부분의 사실 지식을 다음 토큰 예측을 통해 습득합니다. 이후의 사후 훈련 단계에서는…
수천 개에 달하는 기록된 언어들 중 다수는 공통된 특징 구성을 공유하여, 유형학적으로 매우 드문 경우(예: object‑verb‑subject)부터 시작하는 스펙트럼을 형성한다.
우리는 HalluCiteChecker를 소개합니다. 이는 과학 논문에서 허위 인용을 감지하고 검증하기 위한 툴킷입니다. AI assistant technologies가 변혁을 일으킨 동안…
이 논문은 text-only data를 활용하여 speech recognition을 개선하는 효율적인 방법을 조사하며, 빠른 ...을 촉진하는 encoder-dominated models에 초점을 맞춥니다.
재귀적이거나 루프된 언어 모델은 최근 잠재 상태에 걸쳐 동일한 모델 계산을 반복적으로 정제함으로써 새로운 스케일링 축으로 부상했습니다. 이를 통해 모델의 깊이를 ...
실제 세계 데이터 시각화(DV)는 네이티브 환경 기반, 크로스 플랫폼 진화, 그리고 사전적인 의도 정렬을 필요로 합니다. 그러나 기존 벤치마크는 …
분포론적 및 신경망 접근 방식은 자연어 의미론에 거의 전적으로 기존 선형 대수, 즉 벡터, 매트릭스, 텐서 등을 기반으로 구축되어 왔습니다.
선호 기반 정렬 방법, 특히 인간 피드백을 활용한 강화 학습(RLHF)은 인간 주석자의 판단을 사용하여 대규모 언어 모델을 형성합니다.
대형 언어 모델(LLMs)은 감정적으로 민감한 인간‑AI 애플리케이션에서 점점 더 많이 사용되고 있지만, emotion recognition이 내부적으로 어떻게 이루어지는지는 거의 알려져 있지 않다.
머신 생성 텍스트(MGT) 탐지는 모델별 지문에 의존하기보다 생성 모델 전반에 걸쳐 구조적으로 불변인 신호를 식별하는 것을 필요로 합니다.
전통적인 손실 함수에는 cross-entropy, contrastive, triplet, supervised contrastive loss가 포함되며, 사전 학습된 언어 모델을 미세 조정하는 데 사용됩니다 ...
Patient simulators는 복잡하고 민감한 환자 상호작용에 대한 확장 가능한 노출을 제공함으로써 정신 건강 교육에서 주목받고 있습니다. 우울증을 시뮬레이션…
인도네시아 마켓플레이스 리뷰는 표준 어휘와 속어, 지역 차용어, 숫자 약어, 그리고 이모지를 혼합하여 어휘 기반 감성 도구를 신뢰하기 어렵게 만든다.
효율적인 Transformer 구성 요소와 선형 시퀀스 모델링 블록을 결합한 하이브리드 시퀀스 모델은 순수 Transformer에 대한 유망한 대안이지만 ...
Large language models (LLMs)은 점점 더 많이 배포되고 있지만, 그 출력은 사용자가 질문을 표현하는 일상적인 비적대적 변형에 매우 민감할 수 있습니다.
대규모 언어 모델(LLMs) 기반 애플리케이션, 예를 들어 multi-agent simulations는 에이전트 간 인구 다양성을 필요로 합니다. 우리는 널리 퍼진 실패를 식별합니다.
이 논문은 출처의 신뢰성이 터키어 증거 형태에 영향을 미치는지와 대형 언어 모델(LLMs)이 이러한 민감성을 추적하는지를 조사한다. 우리는 ...
Long-context reasoning은 대형 언어 모델(LLMs)의 핵심 역량으로, 장문 문서 이해, 요약, 그리고 c...
한국 기상 예보관을 위한 실용적인 (멀티모달) 대형 언어 모델 어시스턴트 개발은 다차원적인, exper...
On-device Small Language Models (SLMs)는 모바일 사용자에게 완전 오프라인, 프라이빗 AI 경험을 약속합니다(클라우드 의존 없음, 데이터가 기기를 떠나지 않음). 하지만 …
LLM-guided evolutionary search는 자동 알고리즘 발견을 위한 유망한 패러다임으로 부상했지만, 대부분의 시스템은 검색 진행 상황을 주로 e...을 통해 추적합니다.
소개 2020/2021년에 OpenAI가 GPT‑2를 출시했을 때를 기억하시나요? 그 가능성을 이해하려면 이를 가능하게 한 기술을 살펴볼 필요가 있습니다: G...
대형 언어 모델(LLMs)은 일상적인 사용부터 고위험 기업 및 정부 애플리케이션에 이르기까지 텍스트 생성 작업에 점점 더 많이 활용되고 있습니다, 포함…
우리는 현대 morphological data만을 사용해 훈련된 neural models가 historical records와 일치하는 cross-lingual lexical structure를 복원할 수 있는지를 조사한다.
우리는 cross-lingual transfer learning과 unsupervised clustering을 결합하여 저자원 Bantu 언어에서 형태론적 특징을 발견하는 방법을 제시한다.
긴, 명시적인 chains-of-thought (CoT)는 복잡한 추론 작업에서 효과적인 것으로 입증되었지만, 추론 과정에서 이를 생성하는 데 비용이 많이 듭니다. Non-verbal reasoning...
대규모 코퍼스에서 파인튜닝을 위해 작은 고품질 서브셋을 선택하는 것은 코퍼스가 수천만 개의 데이터 포인트로 확대됨에 따라 점점 더 중요해지고 있으며, 이는 f...
OpenClaw와 같은 자율 에이전트 시스템은 긴 컨텍스트 입력과 다중 턴 추론으로 인해 상당한 효율성 문제를 야기합니다. 이는 prohi...
대형 언어 모델(LLMs)은 추론을 잘하지만, 길고 잡음이 많은 문맥에 묻혀 있을 때 결정적인 증거를 놓치는 경우가 종종 있습니다. 우리는 HiLight, Evidence Emph...