machine-learning — Page 6

정렬:

3주 전 · ai · - · -

[Paper] MEME: 멀티-엔터티 및 진화 메모리 평가

LLM-based agents는 지속적인 환경에서 점점 더 많이 작동하며, 여러 세션에 걸쳐 정보를 저장하고 업데이트하며 추론해야 합니다. 이전에는 …

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 라우터가 전문가들의 기하학을 학습한다: Sparse Mixture‑of‑Experts에서의 기하학적 결합

Sparse Mixture-of-Experts (SMoE) 모델은 언어 모델을 효율적으로 확장할 수 있게 해주지만, 학습은 여전히 어려운데 라우팅이 소수의 전문가에게만 집중될 수 있기 때문이다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Rubric 기반 강화학습에서 Reward Hacking

검증 가능한 보상을 활용한 Reinforcement learning은 수학 및 코딩과 같은 분야에서 강력한 post‑training gains를 가능하게 했지만, 많은 open‑ended settings는 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] KV-Fold: 긴 컨텍스트 추론을 위한 원스텝 KV-Cache 재귀

우리는 KV-Fold를 소개한다. 이는 training-free인 간단한 long-context inference protocol로, key-value (KV) cache를 시퀀스에 대한 left fold의 accumulator로 취급한다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 루프 해결: 언어와 추론을 위한 Attractor 모델

Looped Transformers는 잠재 표현을 반복적으로 정제함으로써 순수한 feed-forward 연산에 대한 유망한 대안을 제공하며, language modeling을 향상시킵니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 저렴한 에너지로 가는 길: 전력 유틸리티 수요‑반응 프로그램을 위한 Gymnasium 환경

극심한 기후와 변동성이 큰 도매 전력 시장은 주거용 소비자를 재앙적인 재정 위험에 노출시키지만, 배전 단계에서의 demand response는…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 멀티 스트림 LLMs: 생각, 입력 및 출력의 병렬 스트림으로 언어 모델 잠금 해제

언어 모델 능력의 지속적인 향상이 코딩이나 컴퓨터 사용 등에서 자율 에이전트의 구동 요소로서 그 활용을 널리 가능하게 했습니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] TextSeal: 지역화된 LLM 워터마크를 통한 출처 및 증류 보호

우리는 TextSeal을 소개합니다, 대형 언어 모델을 위한 최첨단 워터마크입니다. Gumbel-max 샘플링을 기반으로, TextSeal은 dual-key generation을 도입하여 resto...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 6G에서 AI 네이티브 모빌리티 구현: 핸드오버, 빔 관리 및 타이밍 어드밴스를 위한 실제 데이터셋

고속 5G 사용 사례에서 특히 사용자 장비(UE) 이동성에 따른 높은 중단 시간 및 측정 보고 오버헤드 문제를 해결하기 위해 ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 알고리즘적 캐리커처: 위기 사건에서 LLM 생성 정치 담론 감사

대규모 언어 모델(LLMs)은 대량의 유창한 정치 텍스트를 생성할 수 있어, 위기 상황과 사회 갈등 시 synthetic discourse에 대한 우려를 불러일으킵니다. 기존…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] ORCE: 대형 언어 모델에서 언어화된 신뢰도의 순서 인식 정렬

대형 언어 모델(LLMs)은 종종 틀린 경우에도 높은 확신을 가지고 답변을 생성하므로, 신뢰할 수 있는 confidence estimation이 배포에 필수적이다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Quaternion-Valued Differential Evolution 알고리즘군을 이용한 수치 함수 최적화

연속 함수에 대한 numerical optimization은 기계 설계부터 training에 이르기까지 다양한 과학 및 공학 분야에서 기본적인 과제이다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] LLM-Managed Multi-Agent Systems에서의 반복 감사 수렴: Prompt Engineering Quality Assurance 사례 연구

멀티 에이전트 대형 언어 모델(LLM) 시스템을 위한 프롬프트 사양은 데이터 계약과 통합 로직을 많은 상호 의존 파일에 걸쳐 포함하지만, 이는 드물다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] LLM 기반 코드 생성에 대한 불확실성 정량화

Prediction sets는 머신러닝 모델에서 불확실성을 정량화하기 위한 이론적으로 기반된 프레임워크를 제공합니다. 이를 구조화된 생성 작업에 적용하면,…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] CIDR: 대규모 산업용 소스 코드 데이터셋 for 소프트웨어 공학 연구

우리는 Curated Industrial Developer Repository (CIDR)를 소개합니다. 이는 직접 협업을 통해 수집된 실제 소프트웨어 저장소들의 대규모 데이터셋입니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 크기가 문제가 아니다: Harness Design가 Small Language Models의 Operational Stability를 결정한다

이 논문은 실험적으로 하네스 엔지니어링 수준이 소형 언어 모델(SLMs, 2‑3B 파라미터)의 운영 성능에 어떻게 영향을 미치는지 분석한다. Th...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 에이전트 결정의 속성 수준 재구성 가능성: 벤더 SDK 어댑터 체제 전반에 걸친 앵커 수준 파일럿

Agentic AI 실패는 사후 재구성이 필요합니다: 에이전트가 무엇을 했는지, 누구의 권한으로 했는지, 어떤 정책에 위배되는지, 그리고 어떤 논리에 기반했는지. Cross-regime feasibilit...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 표현력 있는 뉴런의 순환 네트워크에서의 스케일링 법칙과 트레이드오프

Cortical neurons은 복잡하고 multi‑timescale 프로세서로, recurrent circuits에 연결되어 있으며, 엄격한 biological constraints 하에서 오랜 evolutionary pressure에 의해 형성됩니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] LLM Decode에서 Power Capping의 착각: Attention Architectures 전반의 Phase‑Aware Energy Characterisation

Power capping은 LLM 서빙에서 표준 GPU 에너지 레버이며, 효과가 있는 것으로 보입니다: 처리량이 감소하고, 전력 측정값이 낮아지며, 에너지 예산이 충족됩니다. 우리는 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 분산형 Agentic AI 발견에서의 트레이드오프: 컴퓨트 연속체 전반에 걸쳐

컴퓨팅 연속체 전반에 배치된 에이전시 시스템은 클라우드, 엣지, 그리고 간헐적으로 연결되는 도메인 전반에서 효과를 유지할 수 있는 디스커버리 메커니즘이 필요합니다. ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Multi-Timescale Conductance Spiking Networks: 풍부한 발화 역학을 갖춘 Sparse, Gradient-Trainable Framework for Enhanced Temporal Processing

Spiking neural networks (SNNs)는 시간적으로 풍부한 작업에 대해 저전력 이벤트 기반 계산을 약속하지만, 일반적으로 사용되는 뉴런 모델은 종종 gradient‑based …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 시공간 대비 최적화를 통해 자기 조직화된 MT 방향 맵이 나타난다

영장류 시각 피질의 공간적 및 기능적 조직은 신경과학에서 근본적인 문제이다. 최근 To…와 같은 계산 프레임워크는 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 진화적 Mixture-of-LoRA 아키텍처 분해: 라우팅 레버, 라이프사이클 페널티, 그리고 기판 조건부 경계

우리는 처음부터 만든 약 150M 파라미터의 widened‑D 기판(D=1536, V=32000; D/V 약 0.048; ‘widened‑1536’…) 위에서 진화적 mixture‑of‑LoRA 시스템을 분해한다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] ELF: 임베디드 언어 흐름

Diffusion 및 flow-based 모델은 이미지와 비디오와 같은 연속 데이터 생성에 있어 사실상의 표준 접근법이 되었습니다. 그들의 성공은…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Lévy Process-Driven SDE를 위한 Variational Inference via Neural Tilting

극단적인 사건과 heavy-tailed 현상을 모델링하는 것은 금융, 기후 과학, safety‑critical 시스템과 같은 분야에서 신뢰할 수 있는 예측 시스템을 구축하는 데 핵심적입니다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] DECO: 엔드 사이드 디바이스에서 Dense-Comparable Performance를 달성하는 Sparse Mixture-of-Experts

Mixture-of-Experts (MoE)는 computation을 비례적으로 증가시키지 않으면서 model capacity를 확장하지만, 그 방대한 total parameter footprint는 상당한 …

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 저온 영역(Low-Temperature Regime)에서 Mean-Field Transformers의 집중 현상 정량화

자기 주의(self‑attention) 모듈을 핵심 구성 요소로 하는 트랜스포머는 현대의 대규모 언어 모델 및 파운데이션 모델에서 필수적인 아키텍처가 되었습니다. 이 논문에서는…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 동적 스킬 수명주기 관리 for Agentic Reinforcement Learning

대규모 언어 모델 에이전트는 복잡한 작업을 해결하기 위해 외부 스킬에 점점 더 의존하고 있으며, 스킬은 그들의 능력을 확장하는 모듈형 단위로 작동합니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 최적이고 확장 가능한 MAPF: 다중 주변 최적 운송 및 Schrödinger Bridges를 통한 접근

우리는 유한하고 연결된 그래프 상에서 로봇 집합이 목표 집합으로 이동하도록 하는 익명 다중 에이전트 경로 찾기(MAPF)를 고려한다. 우리는 M...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 향상된 방글라 복합 문자 인식을 위한 Confidence-Guided Diffusion Augmentation

손글씨 Bangla 복합 문자 인식은 복잡한 문자 구조, 큰 클래스 내 변동성, 그리고 제한된 …

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] Shepherd: 형식화된 실행 추적을 활용한 메타 에이전트를 위한 Runtime Substrate

우리는 Shepherd를 소개합니다. 이는 메타‑에이전트 연산을 대상 에이전트에 대한 함수로 형식화하는 함수형 프로그래밍 모델이며, 핵심 연산은 Lean에서 기계화되었습니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 등변 강화 학습을 이용한 클리포드 양자 회로 합성

우리는 전면(all-to-all) 큐비트 연결성을 가진 장치에 대한 Clifford 양자 회로 합성 문제를 고려한다. 우리는 이 작업을 강화 학습(reinforcement learning)으로 접근한다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 제한된 정책 클래스에 대한 정책 그라디언트 재검토: $k$-단계 정책 그라디언트로 근시안적 지역 최적점 탈피

이 작업은 제한된 정책 클래스에 사용되는 표준 policy gradient 방법을 재검토한다. 이러한 방법은 suboptimal critical points에 갇히는 것으로 알려져 있다. 우리는 …를 식별한다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] AI Workflow Store를 이용한 개인 에이전트의 견고성 강화

AI 에이전트에 대한 지배적인 패러다임은 에이전트가 계획을 합성하고 사용자 p에 대응하여 몇 초 또는 몇 분 안에 행동을 실행하는 'on-the-fly' 루프이다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] DataMaster: 머신러닝을 위한 자율 데이터 엔지니어링으로의 접근

모델 패밀리, 트레이닝 레시피, 그리고 컴퓨트 예산이 점점 표준화됨에 따라, 머신러닝 시스템의 추가적인 향상은 점점 데이터에 의존하게 된다...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 레드팀을 넘어: LLM Guardrail Classifiers의 형식적 보증

Guardrail Classifiers는 production language models를 유해한 행동으로부터 방어하지만, 테스트에서는 결과가 유망해 보이지만, formal guarant...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] RubricEM: 검증 가능한 보상을 초월한 Rubric‑guided Policy Decomposition 기반 Meta‑RL

Deep research agents, 즉 계획을 세우고, 검색하고, 증거를 평가하며, 장문 보고서를 종합하는 시스템을 훈련시키는 것은 reinforcement learning을 그 …

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] On-Policy Distillation 밝히기: 도움이 되는 경우, 해가 되는 경우, 그리고 왜

On-policy distillation은 추론 모델을 훈련하기 위해 밀도 높은 per-token 감독을 제공하지만, 이 신호가 언제 유익한지는 아직 명확하지 않다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] MDP에서 확률적 안전을 보장하는 Shields

Shielding은 자율 에이전트의 안전을 보장하기 위한 대표적인 모델 기반 기법입니다. Classical shielding은 나쁜 일이 절대 일어나지 않도록 보장하는 것을 목표로 하며…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] LoKA: 대규모 추천 모델을 위한 저정밀 커널 애플리케이션

최근 GPU 세대는 FP8과 같은 저정밀 연산을 사용하여 훨씬 높은 FLOPs를 제공한다. 이는 대형 언어 모델(LL…에 성공적으로 적용되었다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] AssayBench: LLM 및 에이전트를 위한 어세이 수준 가상 셀 벤치마크

최근 machine learning과 large-scale biological data collections의 발전은 가상 세포(virtual cell), 즉 세포의 computational model을 구축한다는 전망을 다시 부활시켰다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 핵심을 계산하라: Self Optimizing Language Models

효율적인 LLM 추론 연구는 주로 각 디코딩 단계의 비용을 줄이는 데 초점을 맞춰 왔으며(예: quantization, pruning, sparse attention 사용), 일반적으로…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] CADBench: AI 지원 CAD 프로그램 생성을 위한 멀티모달 벤치마크

이미지나 3D 관찰에서 편집 가능한 CAD 프로그램을 복구하는 것은 AI‑assisted design의 핵심이지만, 기존 평가 방법 때문에 진행 상황을 측정하기가 어렵다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] ComplexMCP: 동적·상호 의존적·대규모 Tool Sandbox에서 LLM 에이전트 평가

현재 LLM 에이전트는 고립된 API 호출에 능숙하지만 상업용 소프트웨어 자동화의 ‘라스트 마일’에서는 어려움을 겪습니다. 실제 시나리오에서는 도구가…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Step Rejection Fine-Tuning: 실용적인 Distillation 레시피

Rejection Fine-Tuning (RFT)은 LLM 에이전트를 훈련시키는 표준 방법으로, 성공하지 못한 트래젝터리를 훈련 세트에서 제외합니다. In the context of...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] SoK: AI 및 DLT 융합에 대한 체계적인 양방향 문헌 검토

인공지능(AI)과 분산 원장 기술(DLT)의 통합은 성장하는 연구 분야가 되었지만, 기여는 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

LLMs와 텍스트-인-텍스트 스테가노그래피

댓글 개인정보 – 2026년 5월 11일 오전 8시 07분 텍스트를 숨기려면 흰 배경에 흰 텍스트를 사용해 보세요. 인간의 눈은 보지 못하지만 컴퓨터는 볼 수 있습니다. 만약 …

#LLM #steganography #text hiding #adversarial NLP #security #machine learning
3주 전 · ai · - · -

[Paper] Joint sparse coding 및 temporal dynamics가 context reconfiguration을 지원

Adaptive behavior는 뇌가 서로 다른 contexts 사이를 전환하면서 prior experience의 representations를 유지하도록 요구한다. 재구성 능력은 n...

#research #paper #ai #machine-learning

Newer posts

Older posts