NLP — Page 6 | EUNO.NEWS

정렬:

1개월 전 · ai · - · -

[Paper] Neuro-RIT: 뉴런 기반 Instruction Tuning을 통한 견고한 Retrieval‑Augmented Language Model

Retrieval-Augmented Language Models (RALMs)는 지식 집약적인 작업에서 상당한 잠재력을 보여주었지만, 여전히 성능에 취약합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] RuleForge: 규모에 맞춘 웹 취약점 탐지를 위한 자동 생성 및 검증

보안 팀은 도전에 직면해 있습니다: 새로 공개된 Common Vulnerabilities and Exposures (CVE)의 양이 수동으로 탐지를 개발할 수 있는 역량을 훨씬 초과합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] FourierMoE: 대형 언어 모델의 Fourier Mixture-of-Experts 적응

Parameter-efficient fine-tuning (PEFT)은 제한된 계산 예산 하에서 대규모 언어 모델(LLMs)을 적응시키는 중요한 패러다임으로 부상했습니다. Howe...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 효율적인 깊이 스케일링을 위한 범용 YOCO

test-time scaling의 부상은 Large Language Models (LLMs)의 추론 및 에이전시 능력을 눈에 띄게 향상시켰다. 그러나 표준 Transformers는 ...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] $texttt{YC-Bench}$: 장기 계획 및 일관된 실행을 위한 AI 에이전트 벤치마킹

LLM 에이전트가 점점 더 복잡한 작업을 수행함에 따라, 중요한 질문은 그들이 장기적인 관점에서 전략적 일관성을 유지할 수 있는가이다: 불확실성 하에서의 계획…

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] LLM 회귀와 잠재적 반복 상태 헤드

우리는 RELISH (REgression with a Latent Iterative State Head)라는 새로운 경량 아키텍처를 소개합니다. 이 아키텍처는 대형 언어 모델을 이용한 텍스트 회귀를 위해 설계되었습니다. Ra...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] ORBIT: 제한된 예산의 검색 에이전트를 위한 확장 가능하고 검증 가능한 데이터 생성

Search agents는 language models (LMs)와 web search를 통합하여 복잡한 사용자 질의에 답변하는 데 점점 더 중요해지고 있습니다. training datasets를 구축하는 …

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 어이없을 정도로 간단한 Self-Distillation이 Code Generation을 향상시킨다

대규모 언어 모델(LLM)이 검증자, 교사 모델, 강화 학습 없이 자체 원시 출력만을 사용하여 코드 생성 능력을 향상시킬 수 있을까? 우리는 a...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] True (VIS) Lies: Generative AI가 Intentionality, Rhetoric, Misleadingness를 Visualization Lies에서 어떻게 인식하는지 분석

이 연구는 멀티모달 Large Language Models (LLMs)의 능력을 조사하여 오해를 일으키는 시각화를 식별하고 해석하며, 이러한 관찰을 인식하는...

#research #paper #ai #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] 스크리닝이면 충분하다

표준 softmax attention의 핵심 제한점은 절대적인 query–key 관련성 개념을 정의하지 않는다는 것이다: attention weights는 재분배를 통해 얻어진다...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 온라인 추론 보정: 테스트 시 훈련을 통해 일반화 가능한 컨포멀 LLM 추론

테스트-타임 스케일링은 대형 언어 모델이 매우 어려운 작업을 해결하도록 했지만, state-of-the-art 결과는 엄청난 연산 비용을 초래합니다. 이러한 inef...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] S0 튜닝: Zero-Overhead 하이브리드 순환‑주의 모델 적응

약 48개의 실행 검증된 HumanEval 훈련 솔루션을 사용하여, 순환 레이어당 단일 초기 상태 행렬을 튜닝하고, 추론 오버헤드가 전혀 없으며, ...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 수정인가 재해결인가? 멀티-LLM 파이프라인에서 2차 패스 이득 분해

Multi-LLM revision pipelines는 첫 번째 모델이 만든 초안을 두 번째 모델이 검토하고 개선하는 방식이며, 그 이득이 진정한 …에서 비롯된다고 널리 가정됩니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 보상 기반 온라인 LLM 라우팅 via NeuralUCB

본 연구는 비용 인식을 고려한 대형 언어 모델(LLM) 라우팅을 위해 NeuralUCB의 사용을 조사한다. 기존 라우팅 접근 방식은 크게 감독…

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 은밀하게 이해도를 향상시키는 데이터 기반 음성 타이밍 적응

인간 화자들은 종종 hard-of-hearing 또는 non-native adults와 같은 언어 이해에 어려움이 있는 청자들을 위해 전반적으로 말속도를 늦추는 방식으로 대응한다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 신경망 전반에 걸친 동등한 메커니즘 해석 추적

Mechanistic interpretability (MI)는 신경망을 해석하기 위한 새로운 프레임워크입니다. 작업과 모델이 주어지면, MI는 간결한 algorithmic을 발견하는 것을 목표로 합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 내러티브에서 Analogical Reasoning을 위한 LLM-derived Abstractions를 활용한 구조 매핑 강화

Analogical reasoning은 문제 해결 및 논증에서 인간 일반화의 핵심 동인이다. 그러나 서사 구조 간의 유추는 여전히 도전적이다...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] Structural Feature Engineering for Generative Engine Optimization: 콘텐츠 구조가 인용 행동을 형성하는 방식

AI-powered search engines의 급증은 전통적인 link-based retrieval에서 직접 답변 생성으로, 선택적인 …

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 의료 팀에서 지능형 튜터링 시스템을 활용한 생리학적 및 의미론적 패턴

효과적인 협업은 팀이 Socially Shared Regulation of Learning (SSRL)을 통해 복잡한 인지 및 감정 상태를 관리하도록 요구합니다. Physiological syn...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 뉴스 재작성: 뉴스 기관 전반에 걸친 편집 재사용 추적

이 논문은 다국어 저널리즘에서 문장 수준의 텍스트 재사용을 조사하여, 재사용된 콘텐츠가 기사 내에서 어디에 나타나는지를 분석합니다. 우리는 weakly supervised …

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] Less Is More? 고중요도 영역에 대한 선택적 시각 주의 for Multimodal Radiology Summarization

자동화된 방사선 보고서 요약은 장황한 소견을 간결한 임상 인상으로 압축하는 것을 목표로 하지만, 기존 멀티모달 모델은 종종 ...

#research #paper #ai #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] FLEURS-Kobani: 북부 쿠르드어를 위한 FLEURS 데이터셋 확장

FLEURS는 100개 이상의 언어에 대해 n-way parallel speech를 제공하지만, 북부 쿠르드어는 그 중 하나가 아니어서 자동 음성 인식 및 …에 대한 benchmarking을 제한합니다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] ParaSpeechCLAP: 풍부한 스타일적 언어‑오디오 사전학습을 위한 듀얼‑인코더 음성‑텍스트 모델

우리는 ParaSpeechCLAP를 소개합니다. 이 듀얼-인코더 contrastive model은 speech와 text style captions를 공통 embedding space에 매핑하여 다양한 범위의…를 지원합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] SOLE‑R1: Video‑Language Reasoning을 On‑Robot Reinforcement Learning의 유일한 보상으로

Vision-language models (VLMs)은 다양한 작업에서 인상적인 능력을 보여주었으며, 이러한 모델을 활용해 로봇 학습을 감독하려는 노력을 촉진하고 있습니다.

#research #paper #ai #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] AI 기반 척도 개발을 위한 생성 심리측정학 궁극 튜토리얼: AIGENIE를 병에서 풀어내기

심리 척도 개발은 전통적으로 광범위한 전문가 참여, 반복적인 수정, 대규모 파일럿 테스트를 거쳐 psychometric …

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] ResAdapt: 효율적인 멀티모달 추론을 위한 적응형 해상도

멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 입력 충실도를 확장함으로써 더 강력한 시각 이해를 달성하지만, 그 결과 발생하는 visual token의 증가로 인해 공동 …

#research #paper #ai #machine-learning #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] 리뷰를 넘어: 반성에서 계획 및 번역에 Language Models 적용

반성적 글쓰기는 학생들의 메타인지 기술 발달을 지원하는 것으로 알려져 있지만, 학습자들은 깊은 반성에 참여하는 데 어려움을 겪어 학습을 제한한다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 문맥 의존 루브릭 기반 단답형 채점 학습 데이터 생성

매 4년마다, PISA 시험은 OECD에 의해 전 세계 청소년 학생들의 지식을 테스트하고 교육 시스템을 비교할 수 있도록 시행됩니다. H...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] GraphWalker: 에이전시 Knowledge Graph 질문 응답을 위한 Synthetic Trajectory Curriculum

Agentic knowledge graph question answering (KGQA)은 에이전트가 지식 그래프(KGs)와 반복적으로 상호작용하도록 요구하며, 이는 학습 데이터 측면에서 도전 과제를 제시한다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

Attention 메커니즘 이해 – 파트 3: Cosine Similarity에서 Dot Product까지

‘Understanding Attention Mechanisms – Part 3: From Cosine Similarity to Dot Product’의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit...

#attention-mechanism #transformer #cosine-similarity #dot-product #machine-learning #deep-learning #nlp
1개월 전 · ai · - · -

[Paper] 커밋하기 학습: 온라인 리포지토리 메모리를 활용한 유기적 Pull Requests 생성

Large language model (LLM) 기반 코딩 에이전트는 제어된 벤치마크에서 인상적인 결과를 달성하지만, 실제 유지보수자들이 거부하는 pull request를 일상적으로 생성합니다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 가중치 공유가 토큰 임베딩을 출력 공간으로 편향시킴

Weight tying, 즉 입력 및 출력 embedding 행렬 간 파라미터를 공유하는 것은 언어 모델 설계에서 일반적인 관행이지만, 학습된 em...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] PerceptionComp: 복잡한 인식 중심 추론을 위한 비디오 벤치마크

우리는 복잡하고 장기적인, 인식 중심 비디오 추론을 위한 수동 주석 벤치마크인 PerceptionComp를 소개합니다. PerceptionComp는 설계되었습니다…

#research #paper #ai #machine-learning #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] EnTaCs: 감정과 언어 선택 사이의 관계를 영어‑타밀 코드 스위칭에서 분석

이 논문은 영어‑타밀 코드 스위칭 텍스트에서 발화 감정과 언어 선택 간의 관계를 머신 러닝 방법을 사용하여 조사한다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] MemBoost: 비용 인식 LLM 추론을 위한 메모리 강화 프레임워크

Large Language Models (LLMs)은 강력한 성능을 제공하지만, 실제 서비스에서 높은 inference 비용이 발생합니다. 특히 반복되거나 near-d... 워크로드에서는 더욱 그렇습니다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 퍼플렉시티가 거짓일 때: Generation-Focused Distillation of Hybrid Sequence Models

사전 학습된 Transformer를 증류를 통해 보다 효율적인 하이브리드 모델로 변환하는 것은 추론 비용을 줄이는 유망한 접근법을 제공합니다. 그러나, ...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] European Union Time-Indexed Reference Dataset 개발: Large Language Model을 이용한 Pharmacovigilance에서 Signal Detection Methods 성능 평가

배경: 최적의 signal detection methods를 식별하는 데는 신뢰할 수 있는 reference datasets가 부족하여 어려움이 있습니다. 기존 datasets는 ...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 신뢰할 수 있는 Scientific Inference를 가능하게 하려면 Language Models는 얼마나 개방적이어야 할까?

모델이 개방형인지 폐쇄형인지의 정도가 해당 모델을 포함하는 연구에서 도출될 수 있는 과학적 추론에 어떤 영향을 미치는가? 본 논문에서는 …

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] ALBA: 생성형 LLM에서 언어 및 언어학적 차원을 평가하기 위한 유럽 포르투갈어 벤치마크

대형 언어 모델(Large Language Models, LLMs)이 다국어 영역으로 확장됨에 따라, 대표성이 낮은 언어에서의 성능을 평가하는 것이 점점 더 중요해지고 있습니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] JAL-Turn: 실시간 및 견고한 턴테이킹 감지를 위한 통합 음향‑언어 모델링, Full‑Duplex 음성 대화 시스템

최근의 발전에도 불구하고, 효율적이고 견고한 turn-taking detection은 산업용 등급 Voice AI 에이전트 배포에서 여전히 큰 과제로 남아 있습니다. 많은 기존…

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] Evidence Distillation 및 Write-Back Enrichment를 통한 Knowledge Base 학습

retrieval-augmented generation (RAG) 시스템의 knowledge base는 일반적으로 한 번만 조립되고 절대 수정되지 않으며, 쿼리가 요구하는 사실들은 …

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 자연어 에이전트 활용

에이전트 성능은 점점 더 하네스 엔지니어링에 의존하지만, 하네스 설계는 보통 컨트롤러 코드와 런타임‑specific conventions에 묻혀 있어, …

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] S2D2: 훈련 없이 자체 추측을 통한 Diffusion LLMs의 빠른 디코딩

Block-diffusion 언어 모델은 블록 단위 autoregressive 디코딩과 within-... 를 결합함으로써 autoregressive보다 빠른 생성에 대한 유망한 경로를 제공한다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] Large Language Models의 자기 개선: 기술 개요 및 미래 전망

large language models (LLMs)가 계속 발전함에 따라, 인간 감독만으로 이를 개선하는 것은 점점 더 비용이 많이 들고 확장성에 제한이 생기고 있습니다....

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] RenoBench: 인용 파싱 벤치마크

정확한 citations 파싱은 machine‑readable scholarly infrastructure에 필수적이다. 그러나 이 문제에 대한 지속적인 관심에도 불구하고 기존의 평가 t...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] Beyond Via: Large Language Models가 학술 논문에 미치는 영향 분석 및 추정

arXiv 논문에 대한 분석을 통해, 우리는 large language models (LLMs)에 의해 촉발된 것으로 보이는 단어 사용의 여러 변화를 보고하지만, 이는 이전에 보고된 바 없습니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] PICon: 다중 턴 인터로게이션 프레임워크를 통한 페르소나 에이전트 일관성 평가

대규모 언어 모델(LLM) 기반 페르소나 에이전트는 다양한 분야에서 인간 참가자를 대체할 수 있는 확장 가능한 프록시로 빠르게 채택되고 있습니다. 그러나 아직 시스템이 없습니다.

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] On-Policy Distillation 재검토: 경험적 실패 모드와 간단한 해결책

On-policy distillation (OPD)은 대규모 언어 모델(LLM) 사후 학습에 매력적입니다. 왜냐하면 교사의 피드백을 학생이 생성한 롤아웃에 대해 평가하기 때문입니다.

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts