[Paper] 톨킨의 『호빗』에서 감정 톤 정량화: 대화 감성 분석 with RegEx, NRC-VAD, and Python
이 연구는 J. R. R. Tolkien의 《The Hobbit》(1937)에서 대화의 감정적 어조를 컴퓨테이셔널 텍스트 분석을 이용해 분석한다. 대화는 정규 표현식으로 추출되었다.
이 연구는 J. R. R. Tolkien의 《The Hobbit》(1937)에서 대화의 감정적 어조를 컴퓨테이셔널 텍스트 분석을 이용해 분석한다. 대화는 정규 표현식으로 추출되었다.
현대 LLM 사전 학습은 방대한 양의 compute와 training data를 소비하며, 다양한 모델의 scaling behavior, 혹은 scaling laws가 핵심 구분 요소가 된다.
Transport 기반 방법은 대규모의 깨끗한 데이터셋으로부터 생성 모델을 구축하는 주요 패러다임으로 부상했습니다. 그러나 많은 과학 및 엔지니어링…
Symbolic regression은 데이터를 직접 사용하여 지배 방정식을 발견하는 강력한 도구이지만, 잡음에 대한 민감성 때문에 그 적용 범위가 제한됩니다. Thi...
본 논문은 인간 게임플레이 데이터를 사용하지 않고도 제어 가능하고 다양한 플레이어 행동을 가능하게 하는 reinforcement learning 프레임워크를 소개한다. 기존...
우리는 무한 노름에서 (mathbb{R}^d)의 (좌표별) 최대 함수의 스무딩 설계를 고려한다. LogSumExp 함수 (f(x)=ln!left(sum_{i=1}^{d}exp(x_i)right)) ...
Go의 핵심 인프라 채택이 증가함에 따라 체계적인 취약점 탐지의 필요성이 커지고 있지만, 기존의 symbolic execution 도구들은 Go 바이너리에서 어려움을 겪고 있다.
LabelFusion은 텍스트 분류를 위한 퓨전 앙상블로, 전통적인 트랜스포머 기반 분류기(예: RoBERTa)와 하나 이상의 Larg...
우리는 FACTS Leaderboard를 소개합니다. 이는 온라인 리더보드 스위트와 연관된 일련의 벤치마크로, 언어 모델의 능력을 포괄적으로 평가합니다.
Retrieval-Augmented Generation (RAG) 시스템은 초기 검색에서 연결 사실(bridge fact)을 놓칠 경우 다중 홉 쿼리에서 종종 실패합니다. 기존의 교정 접근 방식은 …
대형 언어 모델(LLMs)은 인도에서 고위험 임상 응용 분야에 점점 더 많이 배치되고 있습니다. 많은 이러한 환경에서, 인도 언어 사용자는 freque...
시간이 흐르는 것을 정확하게 측정하는 것은 많은 애플리케이션에 필수적입니다. 그러나 Intel SGX와 같은 Trusted Execution Environments (TEEs)에서는 시간 소스가 …
대규모 언어 모델(LLM) 기반 코드 어시스턴트는 생성 AI의 강력한 응용 분야로 부상했으며, 코드 생성에서 인상적인 역량을 보여주고 있습니다...
싱글-브리지 블록체인 솔루션은 크로스체인 커뮤니케이션을 가능하게 합니다. 그러나 이들은 중앙집중화와 단일 장애 지점 위험과 연관되어 있습니다. 이…
Bayesian inference는 자연 에이전트의 정보 처리에 대한 원칙적인 설명을 제공합니다. 그러나 신경 메커니즘이 이를 어떻게 수행하는지는 아직 해결되지 않은 질문으로 남아 있습니다.
맥락: 프라이버시 법률은 소프트웨어 시스템이 개발되는 방식을 변화시켜 실무자들이 구현을 업데이트하도록 요구하고 있습니다. 구체적으로, EU ...
Data center (DC) 인프라스트럭처는 컴퓨팅 용량에 대한 증가하는 수요를 지원하는 백본 역할을 합니다. 인간을 결합하는 전통적인 설계 방법론...
데이터 센터(DC) 인프라는 컴퓨팅 용량에 대한 증가하는 수요를 지원하는 백본 역할을 합니다. 인간을 결합한 전통적인 설계 방법론은…
DeepSeek-V3.2-Exp는 긴 컨텍스트 시나리오에서 추론 지연 시간을 크게 줄이는 sparse attention 메커니즘을 도입합니다. 전체 throughput은…
대형 언어 모델(LLMs)은 점점 더 동적인 conversational 인터페이스 역할을 하며, 인간과 같은 대화를 모방하는 multi-turn interactions를 지원합니다.
딥러닝(DL) 기반 취약점 탐지 방법은 벤치마크 데이터셋에서 강력한 성능을 보여왔지만, 실제 현장에서의 효과는 아직 충분히 검증되지 않았다.
우리 연구에서는 인간이 빠르게 학습한다는 생각이 오해라는 것을 명시적으로 암시하지 않는다. 학습 과정은 시간이 걸린다. 아기들은 움직이는 것을 배우기 시작한다.
Effective code retrieval는 필수적이며, natural language와 code snippets를 모두 이용한 하이브리드 방식으로 코드를 검색하는 중요한 패러다임이 되었습니다. N...
Clustered Federated Learning (CFL)은 데이터 이질성을 해결하고 대규모 분산 IoT 환경에서 프라이버시를 보장하는 강력한 접근법으로 부상했습니다.