2026 年主题建模技术:种子建模、LLM 集成和数据摘要
Seeded topic modeling、与 LLMs 的集成,以及在摘要数据上的训练是 NLP 工具箱中的新内容。文章《Topic Modeling Techniques for 202...》。
Seeded topic modeling、与 LLMs 的集成,以及在摘要数据上的训练是 NLP 工具箱中的新内容。文章《Topic Modeling Techniques for 202...》。
当需要在一组代理人之间分配资源并遵循平等主义社会福利时,目标是最大化效用最小的代理人的效用。
大规模、计算密集型的应用,如高性能计算、人工智能和大数据的广泛部署正导致……
从 Generative AI 到 Agentic AI:下一场革命 在过去的两年里,世界被“chatbot”时代所吸引。我们学会了 prompt,去 coax……
1623 年,德国的 Wilhelm Schickard 制作了已知的第一批机械计算器设计。二十年后,Blaise Pascal 制造了一台……
Cluster workload allocation 通常需要复杂的配置,导致可用性差距。本文介绍了一种 semantic, intent‑driven scheduling paradigm。
你可能在想,为什么在真正理解模型是如何学习之前,不应该直接跳到 scikit‑learn。关键是要建立一个坚实的心理模型……
引言 我一直对 deep learning 如何解决现实世界问题感到着迷,而 fruit disease detection 似乎是完美的挑战——不是...
LLM 推理延迟在决定用户体验和运营成本方面至关重要,直接影响在 SLO 约束下的吞吐量。即使是短暂的延迟峰值……
封面图片:🤖《编码改变的那一天:Claude 现在自我编写代码,为什么这太疯狂》
风险备忘录 / 风险声明
提供AI基础设施和云服务、行业解决方案的AI全栈企业Ellis集团(代表金在元)在全球开源平台“Hugging Face”上公开了两种韩语教育用数据集。Ellis集团致力于为研究者、开发者和企业提供适用于韩语AI模型训练的高质量数据……
差分隐私联邦学习(DP-FL)在严格的隐私预算下由于为保持隐私而引入的巨大噪声,导致收敛速度缓慢。
关键的 ServiceNow Virtual Agent 漏洞凸显了一个重要教训:确保 agentic AI 的安全需要回归传统的 AppSec 基础。虽然 AI...
通用矩阵乘法(GEMM)是科学计算中的核心算法之一。单线程 GEMM 实现已得到良好优化,...
幻觉问题 尽管它们具备令人印象深刻的能力,LLM 经常以绝对的自信生成错误信息。传统方法……
Split Federated Learning (SFL) 使资源受限的边缘设备与计算资源丰富的服务器之间能够进行协作训练。通信开销是一个…
不!😂 嗨,我是来自中国的软件工程师 Gudong。今天我想到了一个有趣的话题:我用 AI 赚钱了吗?不,恰恰相反——我实际上花了……
Article URL: https://yarnspinner.dev/blog/why-we-dont-use-ai/ Comments URL: https://news.ycombinator.com/item?id=46609279 Points: 56 Comments: 26...
当前问题 - 背景:对大规模语言模型(LLM)进行微调(fine‑tuning)需要消耗大量资源。LoRA(Low‑Rank Adaptation)方法应运而生,以...
利用现有的环境模拟器和基于可验证真实数据的奖励函数,即使在小模型和小规模训练的情况下,也能提升任务成功率。
《战锤》制造商 Games Workshop 禁止其员工在内容或设计中使用 AI,并称其高级管理层均未使用 AI。
NVIDIA 与 Lilly 推出《药物发现未来蓝图》;NVIDIA 创始人兼 CEO Jensen Huang 与 Lilly 董事长兼 CEO Dave Ricks 讨论了合作伙伴……
在大型语言模型(LLM)优化的混乱世界中,工程师们在过去几年里不断开发日益深奥的仪式,以获得更好的……
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
隐形水印已成为验证 AI 生成图像内容的关键机制,主要平台正在大规模部署水印方案……
像 SAM2 这样的 Video object segmentation 方法通过基于 memory 的架构实现了强大的性能,但在视角大幅变化时会因可靠性…
在本研究中,我们使用真实的会议论文提交,探讨在 Elo 排名审稿系统中大型语言模型(LLM)代理审稿人的动态。Mu...
尽管视频生成模型取得了快速进展,但数据在影响运动方面的作用仍然了解不足。我们提出了 Motive(MOTIon attribution for Vi...)。
OpenAI 和 Anthropic 在过去一周各自推出了面向医疗保健的产品……
推荐系统的演进已经将偏好存储从 rating matrices 和 dense embeddings 转向了 agentic era 中的 semantic memory。然而现存…
最近大型语言模型(LLMs)在强推理能力方面的发展推动了数学、编码和科学等多个领域的研究。
大型语言模型在使用链式思考(Chain-of-Thought,CoT)时,往往能更有效地解决复杂推理任务,但代价是需要更长、低带宽的 token 序列。
在大多数人物再识别(ReID)方法中,Tracklet 质量常常被视为事后考虑,绝大多数研究仅关注架构的修改……
我们引入了软件工程 AI 生产力指数(APEX‑SWE),这是一项用于评估前沿 AI 模型是否能够执行具有经济价值的……的基准。
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行翻译。
请提供您想要翻译的具体摘录或摘要文本,我将为您翻译成简体中文。
准确的个体识别对于监测稀有两栖动物至关重要,但侵入性标记往往不适用于极危物种。我们 e...
从 radiographs 中诊断牙科疾病既耗时又具挑战性,因为诊断证据往往非常微妙。现有方法依赖于……
图像合成模型的快速出现对 AI 生成图像检测器的泛化能力构成了挑战。然而,现有方法往往依赖于 mo...
随着大型语言模型(LLMs)深入嵌入数字平台和决策系统,人们对其政治偏见的担忧日益增长。虽然……
机器学习算法在司法、医疗保健和金融等关键决策领域无处不在,这导致对公平性的需求大幅增长。
CLASSIX算法是一种快速且可解释的数据聚类方法。在其原始形式中,该算法利用对数据点的排序来…
研究人员提出了许多 text-to-SQL 技术,以简化数据分析并加速基于数据库的应用程序开发。为了比较…
将大型语言模型(LLMs)对齐,以服务于具有异质且可能冲突偏好的用户,是个性化和可信...的核心挑战。
组织病理学分析依赖于苏木精-伊红(H&E)染色,但荧光显微镜提供了互补的信息。将荧光…
封面图片:The NanoBanana Image Generation Prompt Templates That Actually Work https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover
检索增强生成(Retrieval-Augmented Generation)在软件工程中通常依赖向量相似度搜索,该搜索捕捉主题相似性,但在多跳推理时可能会失效……