large language models — Page 4

排序:

3周前 · ai · - · -

[Paper] 数据重复胜过数据规模化在 Long‑CoT 监督微调中

在 chain-of-thought 数据上进行 Supervised fine-tuning (SFT) 是推理语言模型的关键后训练步骤。标准的机器学习直觉表明…

#chain-of-thought #fine-tuning #large language models #data efficiency
3周前 · ai · - · -

[论文] Large Language Models 能让每个人都快乐吗？

大型语言模型（LLMs）中的错位指的是未能同时满足安全、价值和文化维度的要求，导致模型产生偏离预期的行为。

#large language models #misalignment #benchmark #AI safety #NLP
3周前 · ai · - · -

[Paper] 盲点中的偏见：检测 LLMs 未提及的内容

大型语言模型（LLMs）经常提供看似合理的链式思考（CoT）推理轨迹，但可能隐藏内部偏见。我们将这些称为 *unverbalized* …

#bias detection #large language models #machine learning research #fairness #explainability
3周前 · ai · - · -

[Paper] 能源公司中的 Generative AI 采用：探索挑战与使用案例

组织正在研究生成式 AI 如何支持其运营工作和决策过程。本研究调查了能源…

#generative AI #large language models #AI adoption #energy industry #use case research
3周前 · ai · - · -

什么是RAG？检索增强生成解释

TL;DR RAG Retrieval‑Augmented Generation 将语言模型与实时数据检索相结合，以提供准确、最新的响应。关键好处：降低……

#retrieval-augmented generation #RAG #large language models #LLM #hallucination reduction #knowledge retrieval #AI research
3周前 · ai · - · -

研究：对最新 LLM 排名的平台可能不可靠

概述：一家希望使用大型语言模型（LLM）来总结销售报告或分流客户询问的公司，可以在数百种独特的 LLM 中进行选择。

#large language models #LLM ranking platforms #crowdsourced data bias #model evaluation #MIT study #AI performance metrics
0个月前 · ai · - · -

超越 RAG：使用知识图谱构建具备“Deep Memory”的 AI 伴侣

构建“Continuous Brain”与 Synapse AI Chat 我构建 AI 工具来解决我自己的问题。前一段时间，我创建了 NutriAgent 来跟踪我的卡路里，因为我…

#large language models #knowledge graphs #retrieval augmented generation #AI memory #personal AI assistants
0个月前 · ai · - · -

停止生成，开始思考

停止生成，开始思考作者：Sophie Koonin 2026年2月8日标签：ai/tags/ai/，engineering/tags/engineering/ 在我的职业生涯中，我感觉我已经做了一个……

#code-generation #large-language-models #developer-tools #software-engineering #AI-productivity
0个月前 · ai · - · -

FunctionGemma 微调指南

markdown 2026年1月16日在Agentic AI的世界中，调用工具的能力将自然语言转换为可执行的软件操作。上个月我们发布了……

#FunctionGemma #fine-tuning #function calling #Gemma 3 #AI agents #large language models #Hugging Face #Google AI
1个月前 · ai · - · -

阻止人类与 AI 末日之间的唯一因素是…Claude？

随着AI系统变得更强大，Anthropic的常驻哲学家表示，这家初创公司押注Claude本身能够学习避免灾难所需的智慧……

#AI safety #Anthropic #Claude #AI alignment #large language models
1个月前 · ai · - · -

OpenAI 在 Anthropic 推出其自有模型几分钟后发布新的 agentic coding 模型

新模型旨在加速 Codex 的功能，Codex 是 OpenAI 本周早些时候推出的具备代理能力的编码工具……

#OpenAI #agentic coding model #Codex #Anthropic #AI coding assistants #large language models #generative AI
1个月前 · ai · - · -

心理测量Jailbreaks揭示前沿模型的内部冲突

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#psychometric testing #jailbreak #frontier models #large language models #AI safety #model evaluation

Newer posts

Older posts