large language models — Page 3

排序:

2周前 · ai · - · -

个性化功能可以让 LLMs 更友好

概述许多最新的大型语言模型（LLMs）被设计用于记住过去对话的细节或存储用户档案，使这些模型能够……

#large language models #personalization #sycophancy #model alignment #user profiling #MIT research
2周前 · ai · - · -

AI抖动冲击IT股，Infosys与Anthropic合作打造‘企业级’AI代理

印度IT巨头Infosys宣布与Anthropic合作，开发企业级AI代理。此次合作将整合Anthropic的Claude模型……

#Infosys #Anthropic #enterprise AI agents #large language models #AI services
2周前 · ai · - · -

为什么大多数 AI agents 仍然是被美化的 Chatbots（以及真正有效的做法）

AI agent 的 hype 真实存在。大家都在构建它们，大家都在谈论它们，而大多数都是垃圾。我一直在密切关注这个领域，以下是……

#AI agents #chatbots #large language models #function calling #agent architecture #AI hype
2周前 · ai · - · -

你是一个（大多数情况下）有帮助的助手

当帮助变成问题时，想象一下，你的首要指令、整个存在的目的、使命以及终身目标都是尽可能地提供帮助……

#large-language-models #LLM #helpfulness #model-confidence #AI-safety #prompt-engineering
2周前 · ai · - · -

FunctionGemma 微调指南

markdown FunctionGemma：Fine‑Tuning for Tool Selection Ambiguity 日期：2026年1月16日在Agentic AI的世界中，调用工具的能力是将……

#FunctionGemma #fine‑tuning #tool‑calling #large language models #Gemma 3 #AI agents #Hugging Face #Google AI #function calling models
2周前 · ai · - · -

SkillsBench：基准测试代理技能在多样任务中的表现

作者 - Xiangyi Li https://arxiv.org/search/cs?searchtype=author&query=Li,+X - Wenbo Chen https://arxiv.org/search/cs?searchtype=author&query=Chen,+W - Yimin L...

#agent benchmarking #skill evaluation #large language models #AI agents #multitask performance
2周前 · ai · - · -

停止盲目Fine-Tuning：何时Fine-Tune——何时不动模型权重

微调是一把刀，而不是锤子微调存在声誉问题。有些人把它当成魔法：“只要微调一下，模型就会理解我们的需求……”

#fine-tuning #model-weights #large-language-models #transfer-learning #prompt-engineering #GPU-cost #bias-mitigation #machine-learning
3周前 · ai · - · -

[Paper] 探索使用大型语言模型的新胜任力建模过程

能力模型在人才资源管理中被广泛用于选拔、发展和评估人才。然而，传统的专家驱动方法过度依赖…

#large-language-models #competency-modeling #HR-analytics #embedding #research-paper
3周前 · ai · - · -

Nvidia 的新技术将 LLM 推理成本降低 8 倍且不失准确性

Dynamic Memory Sparsification DMS（动态内存稀疏化）是 NVIDIA 的研究人员推出的一项技术，能够削减大规模模型的内存成本。

#Nvidia #large language models #dynamic memory sparsification #KV cache compression #LLM reasoning efficiency #memory optimization #AI research
3周前 · ai · - · -

[Paper] 数据重复胜过数据规模化在 Long‑CoT 监督微调中

在 chain-of-thought 数据上进行 Supervised fine-tuning (SFT) 是推理语言模型的关键后训练步骤。标准的机器学习直觉表明…

#chain-of-thought #fine-tuning #large language models #data efficiency
3周前 · ai · - · -

[论文] Large Language Models 能让每个人都快乐吗？

大型语言模型（LLMs）中的错位指的是未能同时满足安全、价值和文化维度的要求，导致模型产生偏离预期的行为。

#large language models #misalignment #benchmark #AI safety #NLP
3周前 · ai · - · -

[Paper] 盲点中的偏见：检测 LLMs 未提及的内容

大型语言模型（LLMs）经常提供看似合理的链式思考（CoT）推理轨迹，但可能隐藏内部偏见。我们将这些称为 *unverbalized* …

#bias detection #large language models #machine learning research #fairness #explainability

Newer posts

Older posts