machine-learning

정렬:

1일 전 · ai · - · -

[Paper] 풍부한 피드백을 활용한 강화 학습과 Distributional DAgger

추론 모델은 빠르게 발전했지만, 검증 가능한 보상으로부터의 강화 학습(RLVR)이라는 지배적인 레시피는 놀라울 정도로 좁은 범위에 머물고 있다: 많은 r을 샘플링한다.

#research #paper #ai #machine-learning #nlp
1일 전 · ai · - · -

[Paper] 효율적이고 증거 기반의 이동성 예측을 위한 LLM-Driven Agent

Individual-level mobility prediction은 urban simulation, transportation planning 및 policy analysis의 핵심이다. Supervised sequence models는 강력한 정확도를 달성한다.

#research #paper #ai #machine-learning
1일 전 · ai · - · -

[Paper] 라벨이 필요할까? 이미 가지고 있는 메타데이터로 Vision Foundation Models 적응하기

우리는 강력하지만 일반적인 비전 파운데이션 모델을 특수 과학 분야에 적용하기 위해 라벨이 없는 접근 방식을 제안한다. 표준 감독식 파인튜닝은 …

#research #paper #ai #machine-learning #computer-vision
1일 전 · ai · - · -

[Paper] 자기반영 API: 구조가 장황함을 이긴다 AI 에이전트 복구

AI 에이전트가 API를 호출하고 validation error가 발생하면, 무엇이 잘못됐는지에 대한 정보만으로는 충분하지 않습니다 — 다음에 무엇을 해야 하는지가 필요합니다. self‑reflective API는 validation error 시, …

#research #paper #ai #machine-learning
1일 전 · ai · - · -

[Paper] 프롬프트에서 프로세스로: 프로세스 분류 체계 및 AI 소프트웨어 개발 에이전트를 지원하는 프레임워크의 비교 평가

프로그래밍용 AI 도구는 이제 단순히 autocomplete나 chat assistants에 그치지 않는다: 이들은 process, roles, artifacts와 함께 development frameworks로 스스로 조직된다.

#research #paper #ai #machine-learning
1일 전 · ai · - · -

[Paper] U-Net 가속 Quality-Diversity Optimization for 기후 적응형 도시 레이아웃

기후 적응을 위한 도시 레이아웃 최적화는 건물 밀도와 차가운 공기 환기의 균형을 맞추는 것을 필요로 합니다. 물리 기반 기후 시뮬레이션은 com...

#research #paper #ai #machine-learning
1일 전 · ai · - · -

[Paper] ParetoPilot: Zero‑Surrogate 오프라인 다목표 최적화 via Infer‑Perturb‑Guide Diffusion

Offline multi-objective optimization (Offline MOO)은 비용이 많이 드는 환경 상호작용 없이 static datasets를 기반으로 새로운 Pareto-optimal 설계를 발견하는 것을 목표로 합니다.

#research #paper #ai #machine-learning
2일 전 · ai · - · -

[Paper] Orthogonal-Easy-Axis Magnetic Tunnel Junction에 의해 가능해진 부호 스파이킹 뉴런

부호 스파이킹 뉴런은 표준 스파이킹 뉴런보다 더 풍부한 정보를 전달합니다. 이 연구는 부호를 위한 컴팩트한 자기 터널 접합(MTJ) 기반 뉴런을 제안합니다.

#research #paper #ai #machine-learning
2일 전 · ai · - · -

[Paper] Equilibrium Propagation을 이용한 ImageNet에서 Predictive Coding Network 훈련

Equilibrium Propagation (EP)은 물리 기반 훈련 프레임워크로, 주로 연속 Hopfield 네트워크를 포함한 에너지 기반 모델에 사용되어 왔습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 물리학만 있으면 충분할까? 물리학자‑감독 AI 개발을 통한 Scientific Software 사례 연구

AI 에이전트는 도구인가, 공동 저자인가, 아니면 연구자인가? 우리는 정량화된 사례 연구(N=1)를 제시한다: 물리학자가 AI 코딩 에이전트(Claude Code, Sonnet 및 O…)를 감독한다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] VideoMLA: 저랭크 잠재 KV 캐시를 활용한 분 단위 자동회귀 비디오 확산

Long-rollout causal video diffusion은 고정 크기의 슬라이딩 윈도우 KV 캐시로 수렴했으며, 최근의 진전은 이 레이아웃 내에서 어떤 것을 변경함으로써 혁신을 이루고 있다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] DynaFLIP: Tri-Modal-Dynamics 기반 표현을 통한 로보틱스 인식 재고

로봇 조작은 장면의 action‑relevant 측면을 보존하는 perception에 크게 의존합니다. 그러나 대부분의 robot learning pipelines는 visual…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] LLMSurgeon: 대형 언어 모델의 데이터 혼합 진단

대규모 언어 모델(Large Language Models, LLMs)의 사전 학습 데이터 혼합은 그들의 ‘digital DNA’를 구성하며, 모델의 행동, 능력 및 실패 모드를 형성합니다. 그러나 이것은…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] SchGen: PCB 회로도 생성을 위한 시맨틱 기반 코드 표현

Printed circuit board (PCB) 회로도 설계는 거의 모든 전자 하드웨어를 정의하지만, 여전히 수동적이며 전문 지식이 많이 필요합니다. While generative AI has adva...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 작지만 신뢰할 수 있는: Time-Series Anomaly Detection을 위한 효율적인 Vision-Language Reasoning

최근 Vision-Language Models (VLMs)의 발전은 많은 작업에서 인상적인 성능을 달성했지만, 이전 연구들은 만족스럽지 못한 성능을 보고했습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 대형 언어 모델의 작업 기억 해제와 잠재적 추론

대형 언어 모델의 추론 능력을 향상시키기 위해, test-time compute는 일반적으로 final answer 전에 intermediate tokens를 생성함으로써 확장됩니다....

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] GPIC: 시각 생성용 대규모 허용 이미지 코퍼스

시각 생성 모델링을 위한 확장 가능한 방법을 연구하려면 크고 접근 가능하며 안정적인 데이터셋이 필요합니다. 우리는 GPIC, 즉 Giant Permissive Image Corpus를 소개합니다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 효율적인 테스트 시점 파인튜닝: Convex Reconstruction 및 Gradient Caching을 통한 LLMs

Test-time finetuning (TTFT)은 각 프롬프트에 대해 관련 시퀀스를 검색하고 모델을 업데이트함으로써 언어 모델을 적응시키는 빠르게 진화하는 패러다임입니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 국소적으로 일관되지만 전역적으로 일관되지 않음: 다중 구성 요소 LLM 에이전트의 구성적 불일치 경계

다중 구성 요소 LLM 에이전트는 공동 문제의 일부만 보는 각 구성 요소로부터 확률적 주장을 조합합니다; 이러한 조합은 기본 확률을 위반할 수 있습니다…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 언제, 왜, 그리고 어떻게 diffusion posterior samplers가 실패하는가? 유한 샘플 관점

Diffusion models는 자연 데이터의 복잡한 분포를 모델링하는 뛰어난 능력을 가지고 있어, posterior sampling에 있어 인기 있고 효과적인 선택이 되었습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] SoundnessBench: 당신의 AI Scientist가 정말 좋은 연구 아이디어와 나쁜 아이디어를 구별할 수 있나요?

Autonomous AI research agents는 가설 생성부터 동료 검토까지 연구 파이프라인을 자동화함으로써 과학적 발견을 가속화하는 것을 목표로 합니다. 그러나 ex...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 샘플링을 이용한 추론: 결정 지점에서 절단

Frontier reasoning models는 posttraining된 base language models에 reinforcement learning을 적용하여 생성됩니다. 최근 연구는 샘플링…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 제한된 메모리를 가진 극한에서의 언어 생성

우리는 bounded memory 하에서 limit에 따른 language generation을 연구한다. 이 작업에서 learner는 unknown target language의 예시를 하나씩 관찰하고 must...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 강인한 선호 모델링을 위한 인-컨텍스트 보상 적응

Reinforcement Learning from Human Feedback (RLHF)는 일반적으로 정적 보상 모델에 의존하여 대형 언어 모델(Large Language Models)을 인간 선호에 맞추도록 합니다. 그러나 인간…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 해상도 진단을 위한 쌍별 LLM 평가

두 개의 공개 LLM leaderboards 전반에 걸쳐, 실제 paired evaluation에서 많은 표시된 pairwise rankings가 기존의 paired-test resolution target을 충족하지 못합니다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] MedCase-Structured: 임상적으로 현실적인 EHR 환경에서 진단 추론 벤치마킹을 위한 Text-to-FHIR 데이터셋

대형 언어 모델(LLMs)은 임상 추론 및 의사결정 지원에 대한 가능성을 보여주지만, 현실적인 전자 건강 기록에 부합하는 환경에서의 평가가 필요합니다...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] GP를 이용한 해석 가능한 생존 분석을 위한 특징 진화 vs 전체 트리 진화

Survival analysis는 사건이 발생할 때까지의 시간을 예측하는 작업과 관련됩니다. 주로 의료 분야에서 사용되는 Survival analysis는 불완전한 데이터(예: 검열된 데이터)를 다룹니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Projectional Decoding: Semantic-Aware LLM 생성을 향한

대형 언어 모델(LLM)은 많은 소프트웨어 엔지니어링(SE) 작업에서 소프트웨어 아티팩트를 생성하는 데 점점 더 많이 사용되고 있지만, 의미적 타당성을 보장하는 것은…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] REPOT: 복구 가능한 Program-of-Thought via Checkpoint Repair

One-shot Program-of-Thought (PoT)는 원시 행동 계획을 출력하는 Python 프로그램을 생성합니다; 하나의 잘못된 행동이 트래젝터리를 조용히 무효화합니다. 우리는 …

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] Selection Hyper-heuristics는 Learning Period를 자동으로 조정하여 Pseudo-Boolean Problems를 최적으로 해결할 수 있다.

Random Gradient 하이퍼휴리스틱은 최근 Rand…를 통해 LeadingOnes 벤치마크를 최적화할 때 최적의 neighbourhood size를 학습할 수 있음이 보여졌다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 기업 부도 예측 모델에서의 진화적 규칙 추출

중소기업(SMEs)은 대부분의 경제에서 기업의 대다수를 차지하며, 종종 재정적 제약과 재무적 취약성에 더 높은...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

RamAIn (YC W26) 채용 중

RamAIn은 Shourya Vir Jain CEO와 Vansh Ramani CTO가 설립했으며, 두 사람은 IIT Delhi에서 만나 중퇴하고 기업 업무를 위한 AI‑native automation을 구축하기 위해 회사를 시작했습니다.

#AI agents #enterprise automation #workflow automation #YC #machine learning #legacy systems #vector search #AI-native automation
1주 전 · ai · - · -

Tensor 설명 파트 1: AI 시스템이 데이터를 표현하는 방법

소개 이 기사에서는 머신러닝 맥락에서 텐서(tensors)의 개념을 탐구합니다. 신경망(neural network)을 구축하는 사람의 관점에서, t...

#tensors #machine learning #neural networks #data representation #deep learning
1주 전 · ai · - · -

[Paper] PEFT-Arena: Parameter-Efficient Finetuning을 안정성‑가소성 관점에서 이해하기

Parameter-efficient finetuning (PEFT)은 대형 언어 모델을 적응시키는 표준 접근 방식이 되었지만, 평가에서는 주로 다운스트림 정확도에 초점을 맞추고 있다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] Scalable Oversight를 위한 보수성 보정

자율적인 계획과 확장된 환경 상호작용이 가능한 Agentic AI 시스템은 근본적인 제어 문제를 제기한다: 인간이 의미 있는 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] OmniVerifier-M1: 명시적 구조 재보정을 갖춘 다중모달 메타 검증기

시각적 결과는 멀티모달 대형 언어 모델에서 점점 더 중심적인 역할을 차지하고 있으며, 신뢰할 수 있고 세밀한 검증이 범용 기반 모델을 확장하는 데 필수적입니다.

#research #paper #ai #machine-learning #nlp #computer-vision
1주 전 · ai · - · -

[Paper] 스킬 조건부 게이트형 셀프 디스틸레이션을 통한 LLM 추론

On-policy self-distillation (SD)은 teacher-side privileged information (PI)를 사용하여 sparse verifier outcomes를 dense token-level로 전환함으로써 LLM reasoning을 개선합니다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 편향은 Gradient Trail을 남긴다: Label-Free 편향 식별 via Gradient Probes on Concept Decompositions

Vision classifiers는 spurious correlations를 활용하여 in-distribution 정확도가 높지만 distribution shift 상황에서는 실패한다. 기존의 bias에 대한 접근 방식은 …

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 약점에서 배우다: 자동화된 도메인 특화 소형 컴퓨터 사용 에이전트

Computer-use agents (CUAs)는 최근 상당한 진전을 이루었지만, 각 소프트웨어 도메인마다 별도의 대형 전문가를 배치하는 것은 여전히 비용이 많이 듭니다. 작은 오픈…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] Memory를 연속적으로 진화하는 연결성으로 재고찰

기존의 memory-augmented LLM agents는 종종 메모리를 사전 정의된 표현과 고정된 retrieval pipelines를 가진 정적 저장소로 취급하는데, 이는 brittle합니다 ...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] SwarmHarness: 스킬 기반 작업 라우팅을 위한 분산 인센티브 정렬 AI 에이전트 네트워크

거대한 양의 컴퓨팅(GPU 사이클, 개인 워크스테이션, 유휴 추론 서버, 작업 사이의 엣지 디바이스 등)이 인센티브에 맞는 p... 때문에 사용되지 않는다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Preference-Shaped Expected Hypervolume와 R2 Improvement: Exact Computation 및 Monotonicity

이 논문은 베이지안 다목적 최적화를 위한 preference-shaped expected improvement 기준을 연구한다. 우리는 종종 …인 두 가지 indicator families를 고려한다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Preference‑Shaped Expected Hypervolume와 R2 Improvement: Exact Computation 및 Monotonicity

본 논문은 베이지안 다목적 최적화를 위한 preference‑shaped expected improvement 기준을 연구한다. 우리는 종종 사용되는 두 가지 indicator families를 고려한다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] LLM은 제공자를 선호하는가? 코드 생성에서 Vertical Integration Bias 측정

대형 언어 모델(LLMs)은 특히 에이전시 기능이 등장하면서 소프트웨어 개발의 필수 요소가 되었습니다. 그러나 많은 최첨단 LLM들은 ...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 효율적이고 확장 가능한 LLM-Generated 코드 스니펫을 위한 Provenance Tracking

코드 완성 및 생성용 대형 언어 모델(LLMs)은 소프트웨어 개발에서 점점 더 많이 사용되고 있지만, 훈련 예시를 그대로 재현할 수 있습니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 논문에서 벤치마크로: 기계 건강 인텔리전스에서 under‑specified methods의 agentic, framework‑based 재현

Industrial Prognostics and Health Management (PHM)는 응용 머신러닝에서 더 넓은 과제인, 출판된 연구를 실제 적용으로 전환하는 것을 위한 대표적인 사례 연구를 제공합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 재조합 기반 Cartesian Genetic Programming 평가 개선

Cartesian Genetic Programming은 전통적으로 변이를 주요하고 종종 유일한 유전 연산자로 사용하여 진화적 탐색을 진행해 왔습니다. 발전에도 불구하고...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Multi-Agent LLM 기반 메타모픽 테스트 for REST API

REST API가 소프트웨어 시스템에서 점점 더 중요한 부분이 되면서, 그 검증이 더욱 중요해지고 있습니다. 따라서 테스트와 근본적인 i...

#research #paper #ai #machine-learning

Newer posts

Older posts