machine-learning — Page 2

정렬:

1주 전 · ai · - · -

[Paper] 재조합 기반 Cartesian Genetic Programming 평가 개선

Cartesian Genetic Programming은 전통적으로 변이를 주요하고 종종 유일한 유전 연산자로 사용하여 진화적 탐색을 진행해 왔습니다. 발전에도 불구하고...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Multi-Agent LLM 기반 메타모픽 테스트 for REST API

REST API가 소프트웨어 시스템에서 점점 더 중요한 부분이 되면서, 그 검증이 더욱 중요해지고 있습니다. 따라서 테스트와 근본적인 i...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 확률적 최적화에서 Number-of-Runs 추정의 신뢰성을 평가하는 학습

대규모 벤치마킹에서 stochastic optimization algorithms의 경우, 핵심 과제는 이제 신뢰성을 위해 repeated runs가 필요한지 여부가 아니라, 어떻게 d...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 디스어그리게이션은 어디까지 갈 수 있을까? 효율적인 MoE LLM 서빙을 위한 Attention‑FFN 디스어그리게이션의 디자인‑스페이스 탐색

현대의 대형 언어 모델(LLM) 추론은 모델 크기의 증가와 엄격한 TTFT 및 TPOT 서비스 수준 목표에 맞추기 위해 점진적으로 분산화되어 왔습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

Karpathy가 Anthropic에 합류해 Claude를 이용해 Claude를 훈련.

카파시가 Anthropic에 합류해 Claude를 훈련하기 위해 Claude를 사용한 커버 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=a...

#andrej karpathy #anthropic #claude #large language models #LLM pretraining #AI research #self‑training #machine learning
1주 전 · ai · - · -

[Paper] 실제 물리 기반 최적화에서 Evolutionary Algorithms의 성능 및 설명 가능성 요구사항

Evolutionary computation은 복잡한 실제 최적화 문제를 해결하기 위한 다양한 도구를 제공합니다. 그러나 연구는 종종 더 작고 단순화된 프로...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Tool Forge: 검증을 동반하는 툴체인, 거버넌스가 적용된 에이전시 실행을 위한

대규모 언어 모델 에이전트는 점점 더 운영 작업을 수행할 것으로 기대되고 있습니다: API 호출, 파일 조작, 워크플로우 조립, 그리고 엔터…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

신경망에 대해 읽을 때 당신은 무엇을 생각하나요!!? 수학? 🤔

!Hussein Mahdihttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...

#neural networks #machine learning #deep learning #mathematics #AI concepts
1주 전 · ai · - · -

[Paper] MUSE-Autoskill: 스킬 생성, 메모리, 관리 및 평가를 통한 자기 진화 에이전트

대형 언어 모델(LLM) 에이전트는 복잡한 작업을 해결하기 위해 재사용 가능한 스킬에 의존합니다. 그러나 기존의 스킬 생성 접근 방식은 스킬을 독립적이고 정적인 것으로 취급합니다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] LocateAnything: 빠르고 고품질 비전-언어 그라운딩 및 병렬 박스 디코딩

Vision-language models (VLMs)는 일반적으로 시각적 grounding과 detection을 좌표 토큰 생성 문제로 공식화하여, 각 2D 박스를 여러 …

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 검색 에이전트를 위한 자연어 쿼리에서 구성으로

현대 검색 에이전트는 LLM, retriever, 문서 수, hop 수, synthesis strategy 등 많은 구성 옵션을 제공하며, 각각이 ...을 형성합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] GENESIS: AI 에이전트를 활용한 자율 6G RAN 합성, 연구 및 테스트

세포 연구 및 개발(R&D)은 각 반복마다 수개월에 달하는 수동 엔지니어링 작업을 소모하는 여섯 가지 구조적 프로세스에 의해 제한됩니다: (i) synt...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] MobileMoE: 온-디바이스 Mixture of Experts 확장

Mixture-of-Experts (MoE)는 수백억 파라미터 언어 모델의 사실상 표준 아키텍처가 되었지만, 서브-억 규모에서 on‑dev에 대한 장점은…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] Sparse Autoencoders의 모델 내부를 활용한 LLM 사후 학습 데이터 엔지니어링 가이드

모델 내부는 대규모 언어 모델(LLM)이 훈련 데이터를 처리하는 방식에 대한 풍부한 정보를 인코딩합니다; 그러나 post‑training data engineering은 주로 …

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] Scores에서 Gibbs Correctors로: Uniform-Rate Discrete Diffusion Models 가속화

Discrete diffusion models는 텍스트 및 기타 기호 영역에서 강력한 경험적 성능을 달성했지만, 특히 uniform-rate models의 경우, 종종 요구한다...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 눈이 AI를 배신할 때: 사회적 시선 일관성을 AI 생성 이미지 탐지를 위한 시맨틱 큐

최근 생성 모델들은 저수준 아티팩트—pixel fingerprints, frequency anomalies, upsampling traces—에 대한 격차를 크게 좁혔으며, 특히 ...

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 표현-조건부 Diffusion Models를 통한 제어 가능한 이미지 생성

Diffusion 모델은 고품질 이미지 생성 및 편집을 위한 강력한 도구로 부상했지만, 이러한 모델을 특정 출력으로 유도하는 것은 여전히 도전 과제입니다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 전역 최적화를 위한 Ratio-Monotone Transforms 기반 Probabilistic Smoothing

확률적 스무딩은 전역 최적화를 위한 표준 도구이지만, 기존 방법들은 Gaussian 커널과 특정 변환에 의존하며, 종종 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Normal Guidance는 Attention이 필요로 하는 것

우리는 전체 볼륨에 대해 하나의 binary label만 사용하고 각 2D slice마다 라벨을 부여하는 것이 아니라, 3D medical images에 대한 분류기를 학습하는 것을 고려한다. 이러한 weakly supervised 상황에서...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] ReMoE: 메모리 제한된 MoE LLM 추론에서 라우터 파인튜닝을 통한 전문가 재사용 향상

Fine-grained Mixture-of-Experts (MoE) 모델은 토큰당 소수의 전문가만을 희소하게 활성화하여, 활성화된 연산량을 줄이면서도 높은 모델 c...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Signal-to-Noise Ratio와 Sample Size가 Neural Networks에서 Representational Alignment를 좌우한다

신경망은 서로 다른 아키텍처로 학습된 네트워크들 간에 정렬된, 즉 구조적으로 유사한 latent representations를 개발하는 것으로 알려져 있다, ...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 데이터 민감 도메인에 대한 LLM 출력의 신경-기호 검증 (확장 프리프린트)

고위험 분야에 배치된 LLM은 근본적인 신뢰성 문제에 직면합니다: 환각, 불일치, 그리고 프라이버시 취약점이 용납할 수 없는…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] LLM이 소프트웨어 디자인 패턴을 사용하도록 안내하는 전략: 싱글톤 사례

Large Language Models (LLMs)은 자연어 프롬프트에서 기능적인 source code를 생성할 수 있지만, 종종 higher‑level architectural 원칙을 일관되게 따르지 못합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] HTMLCure: 브라우저 경험을 인터랙티브 HTML을 위한 상태 기반 복구로 전환

LLMs는 이제 전체 HTML 페이지를 생성할 수 있지만, 그 페이지들 중 많은 부분이 겉보기만 맞습니다: 한 번 렌더링된 뒤 스크롤, hover, click, resize 등에서 실패합니다, 혹은…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Prompt Optimization이 작동하는 이유와 때때로 작동하지 않는 이유: Causal-Inspired Edit-Level Analysis

자동화된 프롬프트 최적화 방법(예: DSpy, TextGrad)은 대형 언어 모델(LLM)의 성능을 크게 향상시킬 수 있지만, 그들의 일반화…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] StreamSplit: 불확실성 기반 적응형 분할을 통한 연속 오디오 표현 학습

대규모 배치 Contrastive Learning (CL)은 현대 표현 학습의 기반이지만, 변동적인 자원 제약과는 근본적으로 호환되지 않는다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 통합 Neural Scaling Laws

우리는 Unified Neural Scaling Law (UNSL)이라고 부르는 함수 형태를 제시하며, 이는 딥 뉴럴 네트워크의 스케일링 행동을 정확하게 모델링하고 외삽합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] MobileGym: 검증 가능한 고도로 병렬화된 모바일 GUI 에이전트 연구를 위한 시뮬레이션 플랫폼

우리는 MobileGym을 소개한다. 이는 브라우저‑호스팅된 lightweight, fully controllable 환경으로, 일상적인 모바일 사용을 위해 interaction fidelity를 목표로 하면서 복제하지 않는다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 멀티모달 대형 언어 모델에서 용량을 끌어내어 Subject-driven Generation

주제 기반 이미지 생성은 주어진 대상의 정체성을 유지하면서 텍스트 지침을 따르는 새로운 이미지를 합성하는 것을 목표로 합니다. 기존 앱...

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] Prism: 확장 가능한 멀티모달 지속적 인스트럭션 튜닝을 위한 플러그인 재현 가능 인프라

Multimodal Large Language Models (MLLMs)은 다양한 작업을 통합된 instruction‑following 프레임워크로 재구성하고 instruction tuning을 통해 다재다능성을 달성합니다.

#research #paper #ai #machine-learning #nlp #computer-vision
1주 전 · ai · - · -

[Paper] 루프형 디퓨전 언어 모델

Masked diffusion models (MDMs)은 언어 모델링을 위한 autoregressive 모델에 대한 유망한 대안으로 부상했지만, transformer a…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 언어 모델은 잠이 필요하다

Transformer 기반 대형 언어 모델은 장기 과제에 점점 더 많이 사용되고 있지만, 이들의 attention 메커니즘은 context length가 늘어남에 따라 확장성이 좋지 않습니다. To h...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] OrpQuant: 기하학적 직교 잔차 투영을 이용한 곱셈기 없는 2의 거듭제곱 Transformer 양자화

대형 언어 모델(LLMs) 및 비전 트랜스포머(ViTs)를 엣지 디바이스에 배포하는 것은 메모리 제한과 중요한 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] VeriTrace: 딥 리서치 에이전트를 위한 진화하는 멘탈 모델

딥 리서치 에이전트는 방대하고 상호 의존적이며 광범위하게 불확실한 정보를 마주합니다. 기존 시스템은 진화하는 중간 표현이 무엇이어야 하는지를 탐구합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] StakeBench: 시장 약속에 기반한 언어 이해 평가

기존 금융 NLP 벤치마크는 종종 외부 관찰자가 제공한 라벨에 의존하여, 화자가 실제로 전달하려는 내용보다는 언어가 어떻게 인식되는지를 측정합니다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 그라디언트가 충돌할 때: LLM 판사를 위한 Multi-Objective Prompt Optimization의 실패 모드

LLM 판사를 특정 작업이나 도메인에 맞게 맞춤화하려면 종종 프롬프트를 여러 평가 기준에 걸쳐 동시에 최적화해야 합니다. Textual gradient ...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 연합 엣지 학습에서 훈련 및 추론의 공동 최적화: 제약된 다목표 딥 강화학습

Federated edge learning (FEEL)은 최근 협업 모델 훈련을 가능하게 함으로써 edge intelligence (EI)를 달성하기 위한 유망한 패러다임으로 부상하고 있습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 프로파일링 기반 적응형 분산 Transformer 추론을 위한 임베디드 엣지 배포

임베디드 엣지 디바이스에 걸쳐 Transformer 추론을 분산시키면 개별 메모리 및 연산 제약을 완화할 수 있지만, 실제 하드웨어에서의 실질적인 이점은 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Meta-Engineering 활용을 통한 AI-Native 소프트웨어 생산: 계약 기반 대립 검증 아키텍처와 초기 배포 보고서

AI-native 소프트웨어 개발은 종종 개별 모델, 프롬프트, 혹은 생성된 아티팩트 수준에서 평가됩니다. 이러한 프레이밍은 프로덕션에 충분하지 않습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 고전 열거기하학에서의 양성: 동기화된 AI 지원 수학 사례 연구

우리는 대칭 다항식 (displaystyle prod_{alphain A_{n,d}}bigl(1+alpha_{1}x_{1}+cdots+alpha_{n}x_{n}bigr))를 연구한다. 여기서 (A_{n,d}:={alphainmathbb{Z}_{ge 0}^{n}mid |alpha|=d})이며, 이는 total Chern class이다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] SkillOpt: 자기 진화형 에이전트 스킬을 위한 실행 전략

현재 에이전트 스킬은 수작업으로 제작되거나, 원샷으로 생성되거나, 느슨하게 제어된 self-revision을 통해 진화하지만, 이들 중 어느 것도 deep-learning 최적화처럼 동작하지 않는다…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] LLMs as Noisy Channels: Shannon 관점에서 본 Model Capacity와 Scaling Laws

대규모 언어 모델(Large Language Models, LLMs)에 대한 기존 스케일링 법칙은 주로 단조적인 멱법칙이며, 재앙적인 비단조 현상 등을 설명하지 못한다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 원시 경험에서 스킬 소비까지: Model-Generated Agent Skills에 대한 체계적 연구

언어 에이전트는 과거 경험에서 추출된 구조화된 절차적 아티팩트를 재사용함으로써 점점 더 향상됩니다. 특히, 도메인 수준 및 모델‑...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] SPACENUM: VLMs에서 공간 수치 이해 재검토

Vision-Language Models (VLMs)는 점점 더 구현된 환경에 배치되고 있으며, 이들 환경에서는 행동 크기와 공간적 ...와 같은 수치 출력을 생성해야 합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] ETCHR: 편집을 통한 명확화 및 추론 활용

Multimodal Large Language Models는 visual reasoning을 발전시켰지만, 순수 텍스트 기반 chain of thought는 fine‑grained 정보를 필요로 하는 질문에 여전히 병목 현상으로 남아 있다.

#research #paper #ai #machine-learning #nlp #computer-vision
1주 전 · ai · - · -

[Paper] Complete-muE: MoE 모델을 위한 최적 하이퍼파라미터 전이 및 스케일링

우리는 Complete-muE라는 프레임워크를 제안한다. 이 프레임워크는 transformer 블록의 dense FFN과 모든 Mixture-of-Experts (MoE) 설정 간의 하이퍼파라미터 전이를 목표로 한다. Exist...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 좋은 토큰 헌팅: 비주얼 지오메트리 트랜스포머를 위한 토큰 선택 히치하이커스 가이드

Visual geometry transformers는 다중 뷰 3D 재구성을 위한 강력한 아키텍처가 되었으며, 피드-...에서 여러 3D 속성을 공동으로 예측할 수 있게 합니다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] CHRONOS: 진화하는 데이터 마켓플레이스를 위한 시간 인식 멀티에이전트 협조

Temporal knowledge-graph 데이터 마켓플레이스는 정적 설계에서 세 가지 결합된 실패에 직면한다: 하이브리드 인덱스 바로가기가 오래되어 엣지가 진화함에 따라 리콜이 감소하고, 정적인…

#research #paper #ai #machine-learning

Newer posts

Older posts