[Paper] 긴 형태 음향 인코딩을 이용한 세그멘탈 어텐션 디코딩
우리는 attention-based encoder-decoder (AED) 모델이 장시간 acoustic encodings와 근본적으로 호환되지 않는 문제를 다룹니다. AED 모델은 분할된 발화에 대해 학습됩니다.
우리는 attention-based encoder-decoder (AED) 모델이 장시간 acoustic encodings와 근본적으로 호환되지 않는 문제를 다룹니다. AED 모델은 분할된 발화에 대해 학습됩니다.
오늘날 언어 모델에 대한 많은 연구는 대규모 범용 모델에 초점을 맞추고 있습니다. 그러나 많은 NLP 파이프라인은 잘 정의된, sm...
이 논문은 이미지 기반 일본어 다학문 다중모달 이해 벤치마크인 JMMMU‑Pro와 확장 가능한 Vibe Benchmark Construction을 소개한다, ...
네팔어는 3천200만 명이 넘는 사람들이 사용하는 저자원 언어로, 복잡한 문법 때문에 자연어 처리(NLP)에서 계속해서 도전 과제에 직면하고 있습니다…
이 튜토리얼(https://tum-nlp.github.io/low-resource-tutorial)은 다국어 및 low-resource 환경에서 작업하는 NLP 실무자, 연구자 및 개발자를 위해 설계되었습니다.
이 논문은 PolyPersona라는 generative framework를 소개한다, 이는 multiple domains에 걸쳐 persona‑conditioned survey responses를 합성하기 위한 것이다.
대형 언어 모델(LLMs)은 프로그램과 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 overwrite-based mutations에 의존한다…
대규모 언어 모델(LLMs)은 프로그램 및 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 덮어쓰기 기반 변이를 의존한다…
알츠하이머병(AD)은 인지 능력에 부정적인 영향을 미치는 진행성 신경퇴행성 질환이다. 언어와 관련된 변화는 자동으로 ...
개인화는 LLM이 개별 사용자 선호와 요구에 맞추는 데 필수적이 되고 있습니다. 그러나 현재 접근 방식은 종종 계산 비용이 많이 듭니다.
우리는 인터랙티브 인텔리전스(Interactive Intelligence)를 소개한다. 이는 성격에 맞춘 표현, 적응형 상호작용, 그리고 자기 진화가 가능한 새로운 디지털 휴먼 패러다임이다.
법과학자들은 몸값 전화, 비밀 녹음, 자살 편지 의혹, 혹은 익명 ...에 대한 경우에 알 수 없는 화자나 작가를 식별해야 할 때가 많다.