[Paper] Large Language Models와 설득 전략을 활용한 승리 논증 탐지
주장적인 텍스트에서 설득을 감지하는 것은 인간 커뮤니케이션을 이해하는 데 중요한 함의를 가진 도전적인 과제입니다. 이 연구는 r...
4613 posts from this source
주장적인 텍스트에서 설득을 감지하는 것은 인간 커뮤니케이션을 이해하는 데 중요한 함의를 가진 도전적인 과제입니다. 이 연구는 r...
대형 언어 모델(LLMs)은 진화적 탐색을 위한 강력한 연산자로 부상했지만, 효율적인 탐색 스캐폴드 설계는 여전히 즉흥적이다. While prom...
우리는 여러 속성을 가진 LTLf 합성을 연구하며, 모든 속성을 만족시키는 것이 불가능할 수 있습니다. 속성의 부분집합을 열거하는 대신, 우리는 …을 계산합니다.
최근 video models의 발전은 특히 long video understanding에서 엄청난 진전을 보여주었습니다. 그러나 현재 benchmarks는 주로 ...
대형 언어 모델(LLMs)은 출력에 대한 자신감을 언어화함으로써 사용자가 느끼는 신뢰를 높일 수 있습니다. 그러나 기존 연구에 따르면 LLM은 종종 o...
본 논문에서는 3D 인간 동작과 2D 인간 비디오의 생성이 본질적으로 결합되어 있음을 발견한다. 3D 동작은 설득력 있는 …
오늘날 가장 강력한 비디오-언어 모델(VLM)은 여전히 독점적이다. 가장 강력한 오픈-웨이트 모델은 독점 VLM에서 생성된 합성 데이터에 의존하거나, effecti...
Adaptive video streaming은 지난 몇 년간 비디오 스트리밍을 개선하는 데 기여했습니다. 비트레이트, 비디오 품질 등과 같은 코딩 성능 목표 사이의 균형을...
Talking head generation은 가상 현실(VR)에서, 특히 다중 턴 대화를 포함하는 사회적 시나리오에서 점점 더 중요해지고 있습니다. 기존 접근 방식은…
다중 에이전트 다중 팔 밴딧(MA-MAB) 맥락에서 공정성은 종종 결과로 환원됩니다: 복지를 극대화하고, 불평등을 감소시키며, 혹은 효용을 균형 있게 만드는 것 등.
시각 관찰로부터 물리적 행동을 추론하는 것은 물리적 세계에서 machine intelligence를 발전시키기 위한 기본적인 능력이다. 이를 달성하려면...
대형 언어 모델(LLMs)은 놀라운 능력을 달성했지만, 안전 가드레일을 우회하도록 설계된 적대적 “jailbreak” 공격에 여전히 취약합니다.
리소스가 제한된 엣지 디바이스에 Python 기반 AI 에이전트를 배포하는 것은 런타임 최적화 과제를 제시한다: I/O 지연을 가리기 위해 높은 thread count가 필요하다.
조건부 언어 모델에 대한 내재적 평가 지표인 perplexity나 bits-per-character와 같은 지표는 단일 언어 및 다국어 설정 모두에서 널리 사용됩니다....
LLM에서 선택적인 지식 삭제는 GDPR 준수와 모델 안전성에 필수적이지만, 현재의 unlearning 방법은 행동 억제를 실제...
Multi-agent systems (MAS)는 여러 에이전트를 조정함으로써 복잡한 추론을 가능하게 하지만, 다단계 실행 및 반복적인 … 때문에 높은 inference latency가 발생하는 경우가 많다.
재료의 광전자 구조를 연구하려면 pseudo-hermitian Hamiltonian의 가장 작은 고유쌍 수천 개까지 계산해야 할 수 있습니다.
대규모 언어 모델(LLMs)은 자연어 작업 전반에 걸쳐 인상적인 성능을 달성했으며 실제 응용 프로그램에 점점 더 많이 배치되고 있습니다. Despit...
Large language models는 코드 생성 및 디버깅에 점점 더 많이 사용되고 있지만, 그들의 출력에는 여전히 버그가 포함될 수 있으며, 이는 training data에서 비롯됩니다. Dist...
AI agent frameworks의 부상은 agent skills를 도입했으며, 이는 instructions와 executable code를 포함하는 modular packages로, agent capabilities를 dynamically extend합니다.
15년 넘게 개발 중임에도 불구하고, 트랜잭션 처리량은 블록체인이 직면한 주요 과제 중 하나이며, 일반적으로 한계가 ...
인공지능 분야에서 실수 파라미터 단일 목표 최적화는 중요한 방향이다. 차등 진화(Differential Evolution, DE)와 Co...
현재 IDE 내 AI 코딩 도구는 일반적으로 시간 소모가 큰 수동 프롬프팅과 컨텍스트 관리에 의존하는 반면, 개발자를 예측하는 사전 대응형 대안은 …
복잡한 매개변수 의존성을 이해하는 것은 다양한 분야에 걸친 소프트웨어 시스템의 효과적인 구성 및 유지 관리에 필수적입니다 - 컴퓨터-
Distributed linearly separable computation은 대규모 분산 시스템에서 기본적인 문제이며, linearly separable function의 계산을 필요로 합니다.
클라우드 컴퓨팅과 사물인터넷(IoT)의 급속한 성장으로 계산 자원의 상호 연결이 크게 증가하여 환경을 조성하고 있다.
Artificial intelligence (AI)는 이미지 분석을 자동화하고 임상 연구를 가속화함으로써 의료 영상 분야를 변혁시킬 잠재력이 있습니다. 그러나 연구는 …
과학 및 엔지니어링 분야는 종종 데이터 부족과 엄격한 실행 가능성 요구사항으로 어려움을 겪습니다: 모델은 유창한 텍스트뿐만 아니라 …도 생성해야 합니다.
본 연구는 MCEMOL (Multi-Constrained Evolutionary Molecular Design Framework)을 제안한다. 이는 규칙 기반 진화를 통합한 분자 최적화 접근법이다.
IoT와 엣지 컴퓨팅의 빠른 통합은 특히 의료 분야를 포함한 다양한 영역을 혁신했으며, 실시간 데이터 공유와 원격 모니터링을 가능하게 합니다.
Neuromorphic computers는 비동기식, compute‑m…을 활용하여 다양한 computational kernels의 속도와 효율성을 크게 향상시킬 잠재력을 가지고 있습니다.
코드된 다항식 집계(CPA)는 마스터가 각 항을 개별적으로 디코딩하지 않고도 다항식 평가값들의 가중 합계를 직접 복구할 수 있게 합니다.
Federated learning (FL)은 원시 사용자 데이터를 공유하지 않고 협업 모델 훈련을 가능하게 하지만, 기존 시뮬레이션은 종종 비현실적인 데이터 파티션에 의존한다.
연결된 디바이스와 프라이버시 민감 애플리케이션의 확산은 분산형 패러다임인 Federated Learning (FL)의 채택을 가속화했습니다...
헬스케어, 금융, 과학 연구와 같은 분야에 걸친 조직과 기업은 점점 더 collective intelligence를 추출해야 할 필요가 있다...
Vision-Language-Action (VLA) 작업은 복잡한 시각 장면에 대한 추론과 동적인 환경에서 적응형 행동을 실행하는 것을 요구한다. 최근 연구들은 …
Transformer 기반 언어 모델은 종종 수학적 추론 벤치마크에서 강력한 결과를 달성하지만 기본적인 수치 이해에서는 여전히 취약합니다...
Code generation tasks는 사용자 요구사항을 executable code로 자동 변환하는 것을 목표로 하며, 수동 개발 노력을 크게 줄이고 ...
Segment Anything 3 (SAM3)은 비디오에서 지정된 대상들을 강력하게 감지하고, 분할하며, 추적하는 견고한 기반을 구축했습니다. 그러나 원본에서는...
sparse multi-views에서의 3D pose estimation은 action recognition, sports analysis, human-robot interaction 등을 포함한 수많은 응용 분야에서 중요한 과제입니다.
현대의 비디오 생성 모델은 diffusion models에 기반하여 매우 현실적인 클립을 만들 수 있지만, 계산 효율성이 낮아 종종 몇 분이 걸린다.
LLM은 임상 워크플로에 점점 더 통합되고 있지만, 효과적인 의사-환자 커뮤니케이션의 필수적인 측면인 clinical empathy가 부족한 경우가 많다.
Large Language Models (LLMs)의 급속한 진화는 software engineering에 강력한 영향을 미쳤으며, 자동화된 unit test 생성에 관한 연구가 증가하고 있습니다.
대규모 언어 모델(LLM)이 계속 확장됨에 따라, 사후 훈련 프루닝은 계산 비용을 줄이면서 성능을 유지하는 유망한 접근법으로 떠올랐습니다.
Structure-based와 ligand-based 계산 약물 설계는 전통적으로 별개의 데이터 소스와 모델링 가정에 의존해 왔으며, 이는 두 접근법의 공동 활용을 제한해 왔습니다.
대규모 언어 모델(LLM) 라우터는 주어진 입력에 대해 최적의 모델을 동적으로 선택합니다. 기존 접근 방식은 일반적으로 실제 라벨이 달린 데이터(ground‑truth labeled data)에 접근할 수 있다고 가정합니다.
딥 리서치 시스템은 다단계 웹 리서치, 분석 및 교차 소스 합성에 널리 사용되지만, 그 평가에는 여전히 어려움이 있습니다. 기존 벤치마크...
멀티태스크 학습(MTL)과 로우-랭크 어댑테이션(LoRA)의 결합은 대규모 언어 모델의 파라미터 효율적인 배포를 위한 유망한 방향으로 부상하고 있습니다.