[Paper] 언어 모델 레이어와 인간 문장 처리의 이중 정렬
최근 연구(Kuribayashi et al., 2025)는 일반적으로 syntactically unchallenging constructions에서 측정되는 인간의 sentence processing behavior가 …
최근 연구(Kuribayashi et al., 2025)는 일반적으로 syntactically unchallenging constructions에서 측정되는 인간의 sentence processing behavior가 …
Controllable cooperative humanoid manipulation은 데이터 부족이 심하고 복잡성 때문에 구현된 지능에 있어 근본적이면서도 도전적인 문제이다, ...
Weight quantization은 효율적인 LLM 배포를 위한 표준 도구가 되었으며, 특히 로컬 인퍼런스에서 모델이 이제 2‑3비트 수준으로 일상적으로 제공됩니다.
모델 출력 검증은 대형 언어 모델(LLMs)의 훈련 및 실제 배포 모두에서 핵심 기본 요소로 급속히 부상하고 있습니다. 실제로, t...
클로와 같은 에이전트를 training 및 evaluating 하기 위한 환경을 구축하는 것은 여전히 수동적이고 인간 중심적인 과정으로, 규모를 확장할 수 없습니다. 우리는 필요하다고 주장합니다.
이 논문은 경험적 대화 흐름 통계가 다음 대화 행위 예측(NDAP)에 어떻게 통합될 수 있는지를 연구한다. KL 정규화 항이 제안된다…
주제 기반 텍스트‑이미지 합성의 급속한 발전, 특히 DreamBooth는 동의 없이 딥페이크 파이프라인을 가능하게 했습니다: 공격자는 단지…
Uniform Discrete Diffusion Model (UDM)은 최근 discrete generative modeling을 위한 유망한 패러다임으로 부상했지만, reinforcement …
Large language models (LLMs)은 추론 시 외부 지식을 통합하기 위해 retrieval-augmented generation (RAG)에서 널리 사용됩니다. 그러나, retrieve…
Lightning 로봇이 하프 마라톤 기록을 깨다. autonomous scarlet 로봇인 Lightning은 일요일 베이징에서 13‑mile 레이스를 단 50분 26초 만에 완주했다.
Molecular biology는 다양한 기능을 수행하기 위해 맞물리는 방식으로 협력하는 수많은 단백질 복합체를 특징으로 합니다. Adaptive evolution은 ...
번역하려는 텍스트를 제공해 주시겠어요? 해당 내용이 필요합니다.
최근 코드 지향 대형 언어 모델(LLMs)은 자연어를 실행 가능한 코드로 변환하는 강력한 능력을 보여주었습니다. Text-to-SQL은 ...
Large language models는 엔드투엔드 웹 코딩이 가능한 interactive coding agents로 빠르게 진화하고 있지만, 기존 benchmarks는 좁은 부분만 평가한다 ...
블랙박스 최적화에서 핵심 질문은 주어진, 이전에 보지 못한 문제를 해결하기 위해 어떤 알고리즘을 사용할 것인가이다. 그러나 단일 알고리즘을 선택하는 것은…
리더보드의 환상 모델 순위는 명확함을 제공한다. 모델 이름 옆에 있는 숫자는 결정적이고 거의 권위 있게 느껴지며, 팀들은 종종 이를 의존한다...
왜 일반적인 평가만으로는 충분하지 않은가? AI reliability 논의에서 흔히 딜레마에 직면한다: 품질이 중요하다는 것은 알지만, 아직 어떤 것이 실패하는지 모른다...
우리는 다목적 최적화에서 파레토 프런트에 대한 유한 근사 집합을 위한 새로운 단항(unary)이며 엄격히 파레토‑컴플라이언트한 품질 지표로서 magnitude를 조사한다.
설정 - 5개 카테고리에서 50개의 사실 질문 - 3가지 모델: llama3.2, mistral, phi3 - Ollama를 사용해 100% 로컬에서 실행 – API 키 필요 없음 Leaderboard...
번역할 텍스트를 제공해 주시겠어요?
소개 만약 ChatGPT에 프롬프트를 입력했을 때 무슨 일이 일어나는지 궁금했던 적이 있다면, 이 기사에서는 가능한 가장 간단한 방식으로 이를 설명합니다. 프롬프트가 어떻게…
!Launch Pegasus 1.5의 커버 이미지 (TwelveLabs, Product Hunt) https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto...
evolutionary algorithms의 확장성은 문제 규모가 증가함에 따라 성능이 어떻게 변하는지를 평가하는 것을 의미합니다. multi-objective optimisation 분야에서는…
Claude Token Counter, 이제 모델 비교 기능이 포함되었습니다. 나는 https://github.com/simonw/tools/pull/269 에서 내 Claude Token Counter 도구를 업그레이드하여 실행 기능을 추가했습니다.
핵심 요약 - 하얏트는 ChatGPT Enterprise를 도입했습니다. - ChatGPT Enterprise를 통해 하얏트 직원들은 GPT 5.4, Codex와 같은 최첨단 AI 기능에 접근할 수 있습니다.
왜 Inference Optimization이 대세가 되고 있는가
소개: 아이디어와 실행 사이의 격차가 좁혀지고 있습니다. 창의적 및 제품 개발 과정에서는 항상 좌절스러운 격차가 존재해 왔습니다. You mig...
번역할 텍스트를 제공해 주시겠어요?
심볼릭 회귀(SR)와 유전 프로그래밍(GP)은 데이터로부터 직접 해석 가능한 수학적 표현식을 발견하는 것을 목표로 합니다. 강력한 경험적 …
문서 소비자의 변화 저는 6년 넘게 시니어 테크니컬 라이터로 일해 왔으며, 문서의 소비자들이 …
Monotone Boolean functions는 구조적으로 중요한 Boolean functions의 클래스이지만, 그 제한된 형태는 달성 가능한 비선형성에 강력한 제한을 부과합니다.
Large Audio-Language Models (LALMs)는 일상 애플리케이션에 점점 더 통합되고 있지만, 그들의 생성 편향은 아직 충분히 탐구되지 않았다. 기존 음성 공정성…
빠른 진전에도 불구하고, 순차적 의사결정을 위한 LLMs(즉, LLM agents)는 여전히 다양한 출력을 생성하는 데 어려움을 겪고 있습니다. 이는 충분하지 않은 탐색을 초래합니다.
강인한 Multimodal Large Language Model (MLLM) for Earth Observation은 현실적인 입력 변동에서도 일관된 해석과 추론을 유지해야 합니다. ...
Personalized image aesthetics assessment (PIAA)는 이미지에 대한 개별 사용자의 주관적 평점을 예측하는 것을 목표로 하며, 이를 위해 사용자별 미학을 모델링해야 합니다.
회수되지 않은 전자폐기물은 상당한 경제적 손실을 의미합니다. 하드 디스크 드라이브(HDD)는 로봇 분해가 필요한 귀중한 전자폐기물 흐름을 구성합니다. Automa...
우리는 표 형식 데이터 문서에서 주장 검증을 위한 새로운 접근 방식을 제시한다. 최근 LLM 기반 접근 방식은 복잡한 사전 학습/미세 조정 또는 …
유방암 진단은 빠르고 정확한 도구가 필요하지만, 기존의 조직병리학적 방법은 수술 중 상황에서 종종 한계가 있습니다. Deep Ultraviolet...
Vision-Language Models (VLMs)는 강력한 교차 모달 성능을 달성하지만, 최근 증거에 따르면 텍스트 설명에 과도하게 의존하고 ...
순수하게 탐욕적인 업데이트에 기반한 반복 정렬 방법은 실제로 놀라울 정도로 효과적이지만, 기존의 (O(log T)) KL‑regularize에 대한 이론적 보장은…
최근 요약 평가의 진보는 모델 기반 메트릭을 사용하여 완전성(completeness), 간결성(conciseness), 충실성(faithfulness)과 같은 품질 차원을 평가하는 데 기반하고 있습니다. 그러나...
Ising 머신—Ising 최적화 문제를 휴리스틱하게 해결하기 위한 특수 목적 하드웨어—은 확률 비트(p-bits)를 기반으로 구축되어 왔으며...
스파이킹 뉴럴 오퍼레이터는 뉴로모픽 엣지 컴퓨팅에 매력적이다, 왜냐하면 이벤트‑드리븐 서브스트레이트가 원칙적으로 희소한 활동을 낮은 l… 로 변환할 수 있기 때문이다.
우리는 LaviGen을 소개한다. 이 프레임워크는 3D 생성 모델을 재활용하여 3D 레이아웃 생성을 수행한다. 텍스트로부터 객체 레이아웃을 추론하는 기존 방법과 달리 …
UAV 비전-언어 내비게이션(VLN)은 에이전트가 자기 중심적인 관점에서 복잡한 3D 환경을 탐색하면서 모호한 다단계 지시를 따르는 것을 요구한다.
대기 안개는 야생동물 이미지의 품질을 크게 저하시켜, animal detection, tracking 등 보존에 필수적인 computer vision 응용 프로그램을 방해합니다.
느리거나 메타안정적인 거동을 보이는 Stochastic dynamical systems는 장시간 스케일에서 고차원 주변 공간의 알려지지 않은 low-dimensional manifold 위에서 진화한다.
머신러닝(ML) 결과를 투명하고 사용자 친화적인 방식으로 설명하는 것은 설명 가능한 인공지능(XAI)의 도전적인 과제로 남아 있습니다. In t...