[Paper] 요약을 위한 모델 기반 평가 메트릭 보정
최근 요약 평가의 진보는 모델 기반 메트릭을 사용하여 완전성(completeness), 간결성(conciseness), 충실성(faithfulness)과 같은 품질 차원을 평가하는 데 기반하고 있습니다. 그러나...
최근 요약 평가의 진보는 모델 기반 메트릭을 사용하여 완전성(completeness), 간결성(conciseness), 충실성(faithfulness)과 같은 품질 차원을 평가하는 데 기반하고 있습니다. 그러나...
Ising 머신—Ising 최적화 문제를 휴리스틱하게 해결하기 위한 특수 목적 하드웨어—은 확률 비트(p-bits)를 기반으로 구축되어 왔으며...
스파이킹 뉴럴 오퍼레이터는 뉴로모픽 엣지 컴퓨팅에 매력적이다, 왜냐하면 이벤트‑드리븐 서브스트레이트가 원칙적으로 희소한 활동을 낮은 l… 로 변환할 수 있기 때문이다.
우리는 LaviGen을 소개한다. 이 프레임워크는 3D 생성 모델을 재활용하여 3D 레이아웃 생성을 수행한다. 텍스트로부터 객체 레이아웃을 추론하는 기존 방법과 달리 …
UAV 비전-언어 내비게이션(VLN)은 에이전트가 자기 중심적인 관점에서 복잡한 3D 환경을 탐색하면서 모호한 다단계 지시를 따르는 것을 요구한다.
대기 안개는 야생동물 이미지의 품질을 크게 저하시켜, animal detection, tracking 등 보존에 필수적인 computer vision 응용 프로그램을 방해합니다.
느리거나 메타안정적인 거동을 보이는 Stochastic dynamical systems는 장시간 스케일에서 고차원 주변 공간의 알려지지 않은 low-dimensional manifold 위에서 진화한다.
머신러닝(ML) 결과를 투명하고 사용자 친화적인 방식으로 설명하는 것은 설명 가능한 인공지능(XAI)의 도전적인 과제로 남아 있습니다. In t...
대규모 언어 모델(LLMs)은 다양한 출처의 정보를 추론할 수 있는 능력 때문에 소분자 약물 설계를 가속화할 잠재력이 있습니다…
대부분의 자동 정리 증명 접근 방식은 형식 증명 시스템에 의존하지만, 비공식 정리 증명은 대규모 언어 모델과 더 잘 맞을 수 있다...
이 논문은 다양한 정중함 및 무례함 정도를 가진 사용자 프롬프트에 대한 대형 언어 모델(Large Language Models, LLMs)의 반응을 탐구한다. Politeness Theory에 따르면...
AI 지원 비디오 제작이 점점 실용화됨에 따라, 명령 기반 비디오 편집은 생성되거나 촬영된 영상의 정교화를 위해 필수적이 되었습니다…
베트남의 법률 텍스트의 복잡성은 대중이 정의에 접근하는 데 상당한 장벽을 제시합니다. Large Language Models는 유망한 해결책을 제공하지만…
수중 이미지는 빛의 흡수와 산란으로 인해 색 왜곡, 저대비, 흐릿한 디테일 등 심각한 퇴화를 겪는 경우가 많습니다.
기존의 다중위험 감수성 매핑(MHSM) 연구는 종종 공간적으로 균일한 모델에 의존하고, 위험을 독립적으로 다루며, 제한된 표현을 제공한다.
Vision Language models (VLMs)은 다양한 벤치마크에서 강력한 성능을 보여왔지만, 종종 모달리티 우위(modality dominance) 현상을 겪으며, 여기서 …
최근 언어 모델의 발전은 자연어 이해(NLU)를 크게 향상시켰습니다. 널리 사용되는 벤치마크는 대형 언어…
시각‑언어 모델(VLMs)에서의 추론은 최근 다양한 다운스트림 작업에 걸친 폭넓은 적용 가능성 때문에 큰 주목을 받고 있습니다. 그러나,…
Image geolocalization은 전통적으로 retrieval‑based place recognition 또는 geometry‑based visual localization pipelines를 통해 해결되어 왔습니다. Recent advance…
우리는 HILBERT (HIerarchical Long-sequence Balanced Embedding with Reciprocal contrastive Training)를 제안한다. 이는 문서 학습을 위한 cross‑attentive 멀티모달 프레임워크이다.
Reinforcement learning은 large multi-modal models에서 video reasoning을 발전시켰지만, 지배적인 파이프라인은 대부분 on-policy self-exploration에 의존하여 성능이 plateau…
검증 가능한 보상을 사용하는 강화 학습(RLVR)은 일반적으로 중간 추론에 대한 제약을 두지 않고 결과 보상을 최적화합니다. 이는…
Time-to-Collision (TTC) 예측은 충돌 방지에 있어 중요한 과제로, 정확한 시간 예측과 지역 및 전역적인 ...
의사결정자들은 작물 재배, 산불 관리, 물·에너지 배분, 그리고 기상 극한에 대비하기 위해 일기예보에 의존합니다. 오늘날 이러한 예보는 …
본 논문은 토큰 프루닝(token pruning)이라는 압축 기법을 통해 적응된 최신 다국어 대형 언어 모델(LLM)의 체계적인 벤치마크를 제시한다.
대규모 언어 모델은 신뢰성이 중요한 환경에 점점 더 많이 배치되고 있지만, 토큰 확률, 엔트로피와 같은 출력 수준의 불확실성 신호는 …
Adapter 기반 방법은 대규모 언어 모델(Large Language Models, LLMs)의 지속적 학습(continual learning, CL)을 위해 순차적으로 저랭크 업데이트를 학습함으로써 비용 효율적인 접근법이 되었다.
대형 언어 모델(LLMs)은 복잡한 작업을 해결하기 위해 점점 더 chain-of-thought (CoT) 추론에 의존하고 있다. 그러나 추론 트레이스가 모두 기여하도록 보장하는 것은…
최근 연구들은 작은 aligned 모델을 proxy 로 사용하여 더 큰 base (unaligned) 모델의 생성을 안내하는 test-time alignment 방법을 제안했습니다. T...
분산 딥러닝에서 훈련 시간의 정확한 예측은 resource allocation, cost estimation, 그리고 job scheduling에 매우 중요합니다. 우리는 f...
우리는 German sign language (DGS) fairy tales에 대한 sentiment analysis를 위한 dataset과 model을 제시한다. 먼저, 우리는 세 가지 수준의 ...
소개는 보통 암묵적인 가정을 동반합니다: 많은 양의 라벨된 데이터가 필요하다는 것. 동시에, 많은 모델은 데이터에서 구조를 발견할 수 있습니다.
Probabilistic Synchronous Parallel (PSP)은 동기화 병목 현상을 줄이기 위해 참여자들의 일부를 샘플링하는 방식으로 분산 학습 시스템에서 사용되는 기법이다.
Concept Bottleneck Models (CBMs)은 인간이 이해할 수 있는 개념을 통해 예측을 구조화함으로써 딥러닝의 해석 가능성을 향상시키는 것을 목표로 하지만, 그들은 …
소프트웨어 개발에서 Large Language Models (LLMs)의 급속한 확산으로 AI가 생성한 코드와 인간이 작성한 코드를 구별하는 것이 중요한 과제가 되었다.
Code localization은 autonomous software engineering의 핵심 요소입니다. 최근의 발전으로 real-world issue benchmarks에서 인상적인 성능을 달성했습니다. ...
Spiking neural networks (SNNs)는 자원 제한이 있는 엣지 시스템에서 기존 인공 신경망의 대안으로 빠르게 주목받고 있습니다. I...
자동화된 심전도(ECG) 신호 분류는 심혈관 질환을 진단하고 모니터링하는 데 유용한 도구입니다. 본 연구는 세 가지 tr...
Universal Machine Learning Interatomic Potentials (uMLIPs)는 무기 재료와 유기 분자를 포함하는 대규모 다양한 데이터셋으로 사전 학습되었습니다.
핵심 요약 - Anthropic의 프롬프트 캐시 TTL은 5분입니다. - Orchestrator 루프가 270초보다 빠르게 실행될 경우 전체 입력 토큰 비용의 약 10%를 지불합니다. What Cha...
‘Designing ChatGPT Prompts & Workflows Like a Developer’ 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=a...
Profling Claude Converstaions의 커버 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-...
제한된 evaluation budgets 하에서도 효과를 유지하는 optimizers를 설계하는 것은 cardiac digital twinning과 같은 비용이 많이 드는 black‑box 환경에서 매우 중요합니다. 우리는 제안합니다…
Influence maximization (IM)은 복잡한 네트워크 분석에서 기본적인 문제이며, 실제 세계의 다양한 응용 분야를 가지고 있다. 현재까지 기존 접근 방식은 …
항시 켜져 있는 컨버터 상태 모니터링은 서브‑mW 엣지 추론을 요구하며, 이는 GPU 기반 physics‑informed neural networks으로는 접근할 수 없는 영역이다. 이 작업은 …
코드 검색은 정보 검색(IR)으로 프레이밍되어 현대 소프트웨어 엔지니어링의 기반을 이루며, 점점 더 검색 기반 생성(RAG)을 구동하여 ...
나는 30일 동안 모든 Manus AI 작업을 추적했습니다. 여기서 발견한 크레딧 사용 및 최적화에 대한 내용입니다. 작업 분류 | 카테고리 | 작업 비율 | 평균 크레딧 |...
저는 직장에서 AI 에이전트를 구축해 왔고 같은 문제에 계속 부딪혔습니다: 모든 프레임워크가 에이전트가 등록된 도구를 안전 검증 없이 호출하도록 허용합니다. An ag...