[Paper] ArkTS-CodeSearch: 오픈소스 ArkTS 데이터셋, 코드 검색용
ArkTS는 OpenHarmony 생태계의 핵심 프로그래밍 언어이지만, ArkTS 코드 인텔리전스에 대한 연구는 공개 데이터셋과 평가가 부족하여 제약을 받고 있다.
ArkTS는 OpenHarmony 생태계의 핵심 프로그래밍 언어이지만, ArkTS 코드 인텔리전스에 대한 연구는 공개 데이터셋과 평가가 부족하여 제약을 받고 있다.
강화 학습(RL)을 통한 사후 훈련은 테스트 시 스케일링을 통해 대형 언어 모델(LLMs)의 추론 능력을 크게 향상시켰습니다. 그러나, 확장하는 th...
강화 학습(RL)은 대형 언어 모델(LLM)의 파인튜닝에 있어 핵심이 되었으며, 근접 정책 최적화(PPO)는 사실상 표준 방법으로 자리 잡고 있습니다.
현대의 대규모 언어 모델(LLMs) 훈련은 특정 행동을 유도하도록 설계된 알고리즘과 데이터셋의 실질적인 뷔페가 되었으며, 이를 통해 …
헤드라인을 생성하는 것부터 뉴스 조작에 이르기까지, Large Language Models (LLMs)은 일반적으로 최종 출력물을 기준으로 평가되며, 안전성 가정 하에 ...
대형 언어 모델은 종종 폐쇄형 질문 응답(closed-book question answering)에서 자신의 지식 한계를 인식하는 데 어려움을 겪으며, 그 결과 자신감 있는 환각(hallucinations)을 발생시킵니다. While decompose...
대형 언어 모델(LLMs)의 급속한 성장은 단일 GPU 하드웨어의 발전 속도를 앞질러, 모델 규모가 메모리 용량에 점점 더 제한받게 만들고 있습니다.
진정한 self-evolution은 에이전트가 lifelong learners로서 새로운 경험을 내재화하여 미래 문제를 해결하도록 요구한다. 그러나 이를 엄밀하게 측정하는 것은 ...
Omni-modal Large Language Models (Omni-LLMs)는 오디오‑비디오 이해 작업에서 강력한 능력을 입증했습니다. 그러나 이들은 긴 멀티모달…
대화형 음성에 대한 자동 음성 인식(ASR)은 대규모이며 잘 주석된 다중 화자 diarization 데이터의 제한된 가용성 때문에 여전히 도전적입니다.
현재 LLM 안전에 대한 접근 방식은 알려진 위협을 식별하고 가드레일을 통해 차단하는 취약한 고양이와 쥐 게임에 근본적으로 의존합니다. 우리는 …를 주장한다.
원본은 2023년에 작성되었습니다. 여기 재게시되었습니다. 토크나이저는 GPT‑4(https://openai.com/gpt-4)와 같은 생성 AI 모델의 필수 구성 요소이며, ...