[Paper] OpenLID-v3: 밀접하게 관련된 언어 식별의 정밀도 향상 -- 경험 보고서
언어 식별(LID)은 웹 데이터에서 고품질 다국어 데이터셋을 구축하는 데 필수적인 단계입니다. 기존 LID 도구(예: OpenLID 또는 GlotLID)…
언어 식별(LID)은 웹 데이터에서 고품질 다국어 데이터셋을 구축하는 데 필수적인 단계입니다. 기존 LID 도구(예: OpenLID 또는 GlotLID)…
템플릿-프리 레트로합성 방법은 작업을 블랙박스 시퀀스 생성으로 간주하여 학습 효율성을 제한하고, 반면 세미-템플릿 접근법은 경직된…
Binary Neural Networks (BNNs)는 가중치를 제한함으로써 전통적인 풀프리시전 신경망에 비해 낮은 복잡도와 에너지 효율성을 제공하는 대안이다.
대규모 언어 모델(LLMs)은 비용이 많이 드는 인간 선호 라벨을 대체하기 위해 쌍별 평가에서 판사 역할을 점점 더 많이 사용되고 있습니다. 실용성에도 불구하고, LLM j...
최근 몇 년간, neural architectures가 discrete algorithms를 실행하는 학습 능력을 이해하려는 관심이 증가하고 있으며, 이는 종종 ...
NLP를 사용하여 실제 학습자 언어를 분석하면 자동화된 평가 및 피드백 도구를 구축하는 데 도움이 됩니다. 또한 개발에 대한 새롭고 광범위한 통찰을 제공합니다.
이미지와 비디오에서 이상을 감지하는 것은 산업 검사, computer-assisted diagnosis 등 여러 실제 문제에 필수적인 작업입니다.
진정한 풀뿌리 활동과 자동화된 인플루언스 작전 사이의 구분이 무너지고 있다. 정책 논의가 bot farms에 초점을 맞추는 동안, 별개의 위협이…
Memory-efficient backpropagation (MeBP)은 1GB 미만의 메모리로 모바일 디바이스에서 대규모 언어 모델(LLMs)의 1차 미세조정을 가능하게 했습니다. 그러나...
이 논문은 Spectral-Interpretable and -Enhanced Transformer (SIEFormer)라는 새로운 접근법을 제시하며, 스펙트럴 분석을 활용하여 어텐션을 재해석합니다.
본 논문에서는 다양한 bio-inspired 모델들의 구조적 및 기능적 차이를 보다 잘 이해하기 위해 통합 프레임워크를 제시합니다. 우리는 liq...
Jhana advanced concentration absorption meditation (ACAM-J)는 의식과 인지 처리에 깊은 변화를 일으키며, 이들의 연구를 …