[Paper] 基于物理信息的稳化有限元解后处理用于瞬态对流占优问题
对 convection-dominated 瞬态传输现象的数值模拟,由于出现 sharp gradients 和 propagating ……,面临显著的计算挑战。
4654 posts from this source
对 convection-dominated 瞬态传输现象的数值模拟,由于出现 sharp gradients 和 propagating ……,面临显著的计算挑战。
语言模型(LMs)作为代理在长上下文任务中的部署日益加速,这促使我们必须深入了解目标漂移:代理的…
针对不完全信息游戏的 AI 算法通常使用单个游戏的性能指标进行比较,这使得评估其鲁棒性变得困难……
自回归解码受其顺序特性限制。投机解码已经成为通过使用快速草稿模型来加速推理的标准方法。
生成式人工智能(AI)提供了可扩展的形成性反馈支持,但大多数 AI 生成的反馈依赖于任务特定的评分标准……
统一的多模态模型最近展示了强大的生成能力,但生成何时以及是否提升了理解仍不清楚。Exi...
我们研究在编码器‑解码器降阶模型中对学习到的潜在表示进行几何正则化的策略。在固定的实验设置中……
在无监督学习中,选择聚类数仍然是一个根本性的挑战。现有的标准通常针对单一的“optimal”划分,……
电动汽车路径问题(带时间窗,EVRPTW)在经典的 VRPTW 基础上加入了电池容量约束和充电站决策……
Physics-Informed Neural Networks (PINNs) 已被视为一种无网格的替代方法,用于求解包含物理信息的偏微分方程……
实时主动的代理系统,能够建模人类心理状态,使用 foundation EXG 模型和文本嵌入模型,完全离线运行于 …
Contrastive steering 已被证明是一种简单且有效的方法,可在 inference time 调整 LLMs 的生成行为。它使用 prompt 示例……
Agentic language models 在安全机制上与 chat models 完全不同:它们必须进行计划、调用工具,并执行 long-horizon actions …
CDD(Contamination Detection via output Distribution),通过测量模型采样输出的峰度来识别数据污染。我们研究了……
Omni-modal 大语言模型(omni LLMs)最近在视听理解任务上取得了强劲的表现,但它们仍然高度易受…
自动化工业优化建模需要将自然语言需求可靠地转换为 solver‑executable code。然而,large language models ...
软件系统通过频繁的代码更改不断演进,然而尽管进行了大量的测试和代码审查,这些更改仍常常引入意想不到的 bug ……
Serverless 计算和流处理代表了两种主导的事件驱动数据处理范式,但它们都做出了一些假设,使其在许多真实工作负载下效率低下。Serverless 平台假设每次函数调用是相互独立的,这阻止了跨调用重用状态。流处理系统假设数据流是无限的,这迫使它们无限期地保留状态。在本文中,我们提出了一种新模型,称为 “stateful serverless”,它融合了两者的优势:允许函数在调用之间保留和共享状态,同时仍提供 Serverless 的弹性和按需付费定价模型。我们在 Apache Flink 和 AWS Lambda 之上实现了原型,并在包括 real‑time analytics、online machine learning 和 complex event processing 在内的一系列 benchmark 中进行评估。结果表明,stateful serverless 相比传统 Serverless 可实现最高 3× 的 latency 降低和 2× 的 throughput 提升,资源使用相当。我们还讨论了该新模型在 debugging、monitoring 和 security 方面的挑战,并概述了未来工作的方向。
企业工程组织从 version control systems、CI/CD pipelines、issue trackers 和 observability 平台产生高容量、异构的 telemetry。
工具塑造我们的思维。这就是为什么拥有可扩展且灵活的工具对开发者适应其需求至关重要。对程序的推理在……
我们描述了在两个求解器的重叠网格区域中进行解数据插值的可扩展算法的应用。此特性对于……
大型语言模型在软件工程领域迅速获得关注,但它们日益增长的碳足迹引发了迫切的可持续性问题。虽然 tr...
自认技术债务(Self‑Admitted Technical Debt,SATD)指的是开发者在代码注释、提交信息等自然语言工件中明确承认的技术折衷。
Parameter-Efficient Fine-Tuning (PEFT) 在数据中心中被广泛用作大语言模型(LLM)定制的微调 API 的后端。Service…
随着对学术会议碳足迹的讨论日益增多,越来越多的问题被提出,是否应该关注交通等造成的环境影响……
我们研究未决定状态动力学(Undecided-State Dynamics,USD),这是一种基本的共识过程,其中每个顶点持有 k 种已决定的意见之一或未决定状态。我们 con...
自动化的 C 到 Rust 迁移在从代码片段扩展到工业项目时遇到系统性障碍,主要是因为构建上下文往往不可用……
大规模 AI/ML 训练系统依赖于两个很少被审视的假设:(1) checkpoints 代表全局训练状态的原子快照,...
从顺序计算向并行计算的转变对于现代高性能应用至关重要,但受到并发编程陡峭学习曲线的阻碍……
Human-product images(展示人类与产品融合的图像)在广告、电子商务和数字营销中发挥着至关重要的作用。关键是……
在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法,超越标准预训练语料库所能提供的范围。Y...
当我们能够识别与测试样本可交换的校准样本时,选择性共形预测可以产生显著更紧的不确定性集合。
Test-time reinforcement learning (TTRL) 已成为自我进化的大型推理模型 (LRMs) 的一种有前景的范式,使其能够在未标记的数据上进行在线适应。
像 Sudoku 和 ARC-AGI 这样的推理问题对神经网络仍然具有挑战性。结构化问题求解架构家族 Recurrent Reasoning …
我们提出了 Sketch2Colab,它将 storyboard 风格的 2D 草图转换为连贯、具备对象感知的 3D 多人物动作,并对 agents、关节等实现细粒度控制。
大语言模型的长上下文推理在解码阶段受到键值(KV)缓存加载的瓶颈限制,因为生成的顺序性……
Multi-attribution learning (MAL),通过学习由多个 attribution mechanisms 产生的 conversion labels 来提升模型性能,已成为……
湄公河三角洲的非物质文化遗产(ICH)图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……
储层扩展可以在非线性混合下提升在线独立成分分析(ICA)的效果,但 top‑n 白化可能会丢弃注入的特征。我们正式…
Claude 代理技能的快速激增提出了一个核心问题:如何有效利用、管理和扩展代理技能生态系统。
基于指令的视频编辑取得了快速进展,但现有方法常常在精确的视觉控制方面遇到困难,因为自然语言本质上是……
低位注意力(如 SageAttention)已成为加速模型推理的有效方法,但其在训练中的适用性仍然较差……
检索增强生成(Retrieval‑Augmented Generation,RAG)系统通常采用检索融合技术,例如多查询检索和倒数排名融合(reciprocal rank fusion,RRF)来增加……
从与犯罪相关的文档中提取关键信息是执法机构的一项关键任务。命名实体识别 (NER) 可以执行……
强化学习与可验证奖励(RLVR)通过对大型语言模型(LLMs)进行优化,显著提升了它们的推理能力……
Scaling laws 假设在更多数据上训练的更大模型始终优于较小的模型——这一假设驱动了计算机视觉中的模型选择,但……
大型语言模型(LLMs)正日益被提出作为战略决策环境中的代理,但它们在结构化的地缘政治模拟中的行为仍然……
现代语言模型在有界上下文中进行推理,这一固有约束对长期推理构成了根本障碍。我们识别 recursion a...