large language models — Page 3

정렬:

2주 전 · ai · - · -

SkillsBench: 다양한 작업에서 에이전트 스킬이 얼마나 잘 작동하는지 벤치마킹

저자 - Xiangyi Li https://arxiv.org/search/cs?searchtype=author&query=Li,+X - Wenbo Chen https://arxiv.org/search/cs?searchtype=author&query=Chen,+W - Yimin L...

#agent benchmarking #skill evaluation #large language models #AI agents #multitask performance
2주 전 · ai · - · -

무분별한 Fine-Tuning을 멈춰라: Fine-Tuning 시점—Model Weights를 건드리지 말아야 할 때

파인튜닝은 망치가 아니라 칼이다 파인튜닝은 평판 문제가 있다. 일부 사람들은 이를 마법처럼 여기며: “그냥 파인튜닝만 하면 모델이 우리 d…”

#fine-tuning #model-weights #large-language-models #transfer-learning #prompt-engineering #GPU-cost #bias-mitigation #machine-learning
3주 전 · ai · - · -

Nvidia의 새로운 기술, 정확도 손실 없이 LLM 추론 비용을 8배 절감

Dynamic Memory Sparsification DMS NVIDIA 연구원들은 Dynamic Memory Sparsification DMS를 도입했으며, 이 기술은 대규모…

#Nvidia #large language models #dynamic memory sparsification #KV cache compression #LLM reasoning efficiency #memory optimization #AI research
3주 전 · ai · - · -

[Paper] 맹점에서의 편향: LLM이 언급하지 못하는 것을 탐지하기

대형 언어 모델(LLMs)은 종종 설득력 있게 보이는 사고 흐름(chain-of-thought, CoT) 추론 흔적을 제공하지만, 내부 편향을 숨길 수 있습니다. 우리는 이를 *unverbali...

#bias detection #large language models #machine learning research #fairness #explainability
3주 전 · ai · - · -

RAG란? Retrieval‑Augmented Generation 설명

TL;DR RAG Retrieval‑Augmented Generation은 언어 모델과 실시간 데이터 검색을 결합하여 정확하고 최신의 응답을 제공합니다. 주요 장점: …

#retrieval-augmented generation #RAG #large language models #LLM #hallucination reduction #knowledge retrieval #AI research
3주 전 · ai · - · -

연구: 최신 LLM을 순위 매기는 플랫폼은 신뢰할 수 없을 수 있다

개요: 판매 보고서를 요약하거나 고객 문의를 triage하려는 기업은 수백 개의 고유한 LLM 중에서 선택할 수 있습니다.

#large language models #LLM ranking platforms #crowdsourced data bias #model evaluation #MIT study #AI performance metrics
3주 전 · ai · - · -

RAG를 넘어: 지식 그래프를 활용한 ‘Deep Memory’ AI 동반자 구축

Synapse AI Chat으로 “Continuous Brain” 구축하기 나는 내 문제를 해결하기 위해 AI 도구를 만든다. 얼마 전, 나는 칼로리를 추적하기 위해 NutriAgent를 만들었다, 왜냐하면 나는 …

#large language models #knowledge graphs #retrieval augmented generation #AI memory #personal AI assistants
3주 전 · ai · - · -

생성 중지, 사고 시작

생성 중단, 생각 시작 – Sophie Koonin, 2026년 2월 8일 태그: ai/tags/ai/, engineering/tags/engineering/ 내 경력 전반에 걸쳐 나는 …

#code-generation #large-language-models #developer-tools #software-engineering #AI-productivity
0개월 전 · ai · - · -

FunctionGemma 파인튜닝 가이드

markdown 2026년 1월 16일 에이전틱 AI 세계에서, 도구를 호출하는 능력은 자연어를 실행 가능한 소프트웨어 동작으로 변환합니다. 지난 달 우리는 출시했습니다...

#FunctionGemma #fine-tuning #function calling #Gemma 3 #AI agents #large language models #Hugging Face #Google AI
0개월 전 · ai · - · -

인류와 AI 종말 사이에 서 있는 유일한 것은 … 클로드?

AI 시스템이 점점 더 강력해짐에 따라, Anthropic의 전담 철학자는 스타트업이 Claude 자체가 재난을 피하기 위해 필요한 지혜를 배울 수 있다고 베팅하고 있다고 말한다....

#AI safety #Anthropic #Claude #AI alignment #large language models
1개월 전 · ai · - · -

OpenAI, Anthropic가 자체 모델을 출시한 지 몇 분 만에 새로운 agentic 코딩 모델 발표

새 모델은 이번 주 초에 OpenAI가 출시한 에이전시 코딩 도구인 Codex의 기능을 가속화하도록 구축되었습니다....

#OpenAI #agentic coding model #Codex #Anthropic #AI coding assistants #large language models #generative AI
1개월 전 · ai · - · -

심리측정 탈옥이 프론티어 모델의 내부 갈등을 드러낸다

번역할 텍스트를 제공해 주시겠어요? 텍스트를 알려주시면 한국어로 번역해 드리겠습니다.

#psychometric testing #jailbreak #frontier models #large language models #AI safety #model evaluation

Newer posts

Older posts