[Paper] DocDancer: 에이전시 문서 기반 정보 탐색을 향하여
Document Question Answering (DocQA)는 주어진 문서에 근거한 질문에 답하는 데 초점을 맞추지만, 기존 DocQA 에이전트는 효과적인 도구 활용과 라…
Document Question Answering (DocQA)는 주어진 문서에 근거한 질문에 답하는 데 초점을 맞추지만, 기존 DocQA 에이전트는 효과적인 도구 활용과 라…
작물 질병 분석을 위한 Visual Question Answering은 정확한 시각 이해와 신뢰할 수 있는 language generation이 필요합니다. 이 작업은 lightweight vi...
최근 언어 모델(LMs)의 발전은 다양한 소프트웨어 엔지니어링 작업에서 큰 진전을 이끌어냈습니다. 그러나 기존 LMs는 여전히 ...
우리는 현실적인 뉴스 환경에서 재무 허위 정보를 평가하기 위한 대형 언어 모델용 벤치마크인 RFC Bench를 소개합니다. RFC Bench는 단락 수준에서 작동합니다…
Language models는 수학 문제 해결부터 open-domain question answering에 이르기까지 다양한 작업에서 효과적이 되었습니다. 그러나 여전히 실수를 저지릅니다, ...
우리는 기존 토론을 기반으로, 원래는 reply trees 구조로 되어 있는 다자간 대화를 생성하기 위한 플랫폼인 LLMberjack을 소개합니다. 이 시스템은…
대규모 언어 모델(LLMs)은 사전 학습(pre‑training) 동안 방대한 양의 파라메트릭 지식을 인코딩합니다. 세계 지식이 변화함에 따라 효과적인 배포는 점점 더 …
사용자를 대신해 그래픽 인터페이스와 상호작용하는 GUI agents는 실용적인 AI assistants를 위한 유망한 방향을 나타냅니다. 그러나 이러한 agents를 훈련하는 것은…
언어 모델은 종종 의미적 관련성과 무관하게 입력의 특정 위치에 있는 정보를 사용하는 경향을 보입니다. 위치 편향은 …
최근 사람들은 고통을 겪으며 개방형(open) 및 지식 집약적(knowledge-intensive) 작업에서 LLMs의 신뢰성 격차를 점점 더 인식하게 되었고, 따라서 검색 기반(search-augmented)…
대형 언어 모델(LLMs)에서 발생하는 환각을 완화하기 위해, 우리는 프롬프트에 의해 유발되는 오류에 초점을 맞춘 프레임워크를 제안합니다. 우리의 방법은 체인 스타일 k...
대형 멀티모달 모델(LMMs)은 체인‑오브‑소트(Chain‑of‑Thought, CoT)를 통해 비디오 추론에서 인상적인 능력을 보여주었습니다. 그러나 그들의 추론의 견고성은…