[Paper] MoD-DPO:通过模态解耦偏好优化缓解全能大语言模型中的跨模态幻觉
Omni-modal 大语言模型(omni LLMs)最近在视听理解任务上取得了强劲的表现,但它们仍然高度易受…
3122 posts from this source
Omni-modal 大语言模型(omni LLMs)最近在视听理解任务上取得了强劲的表现,但它们仍然高度易受…
自动化工业优化建模需要将自然语言需求可靠地转换为 solver‑executable code。然而,large language models ...
软件系统通过频繁的代码更改不断演进,然而尽管进行了大量的测试和代码审查,这些更改仍常常引入意想不到的 bug ……
Serverless 计算和流处理代表了两种主导的事件驱动数据处理范式,但它们都做出了一些假设,使其在许多真实工作负载下效率低下。Serverless 平台假设每次函数调用是相互独立的,这阻止了跨调用重用状态。流处理系统假设数据流是无限的,这迫使它们无限期地保留状态。在本文中,我们提出了一种新模型,称为 “stateful serverless”,它融合了两者的优势:允许函数在调用之间保留和共享状态,同时仍提供 Serverless 的弹性和按需付费定价模型。我们在 Apache Flink 和 AWS Lambda 之上实现了原型,并在包括 real‑time analytics、online machine learning 和 complex event processing 在内的一系列 benchmark 中进行评估。结果表明,stateful serverless 相比传统 Serverless 可实现最高 3× 的 latency 降低和 2× 的 throughput 提升,资源使用相当。我们还讨论了该新模型在 debugging、monitoring 和 security 方面的挑战,并概述了未来工作的方向。
企业工程组织从 version control systems、CI/CD pipelines、issue trackers 和 observability 平台产生高容量、异构的 telemetry。
工具塑造我们的思维。这就是为什么拥有可扩展且灵活的工具对开发者适应其需求至关重要。对程序的推理在……
我们描述了在两个求解器的重叠网格区域中进行解数据插值的可扩展算法的应用。此特性对于……
大型语言模型在软件工程领域迅速获得关注,但它们日益增长的碳足迹引发了迫切的可持续性问题。虽然 tr...
自认技术债务(Self‑Admitted Technical Debt,SATD)指的是开发者在代码注释、提交信息等自然语言工件中明确承认的技术折衷。
Parameter-Efficient Fine-Tuning (PEFT) 在数据中心中被广泛用作大语言模型(LLM)定制的微调 API 的后端。Service…
随着对学术会议碳足迹的讨论日益增多,越来越多的问题被提出,是否应该关注交通等造成的环境影响……
我们研究未决定状态动力学(Undecided-State Dynamics,USD),这是一种基本的共识过程,其中每个顶点持有 k 种已决定的意见之一或未决定状态。我们 con...
自动化的 C 到 Rust 迁移在从代码片段扩展到工业项目时遇到系统性障碍,主要是因为构建上下文往往不可用……
大规模 AI/ML 训练系统依赖于两个很少被审视的假设:(1) checkpoints 代表全局训练状态的原子快照,...
从顺序计算向并行计算的转变对于现代高性能应用至关重要,但受到并发编程陡峭学习曲线的阻碍……
Human-product images(展示人类与产品融合的图像)在广告、电子商务和数字营销中发挥着至关重要的作用。关键是……
在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法,超越标准预训练语料库所能提供的范围。Y...
当我们能够识别与测试样本可交换的校准样本时,选择性共形预测可以产生显著更紧的不确定性集合。
Test-time reinforcement learning (TTRL) 已成为自我进化的大型推理模型 (LRMs) 的一种有前景的范式,使其能够在未标记的数据上进行在线适应。
像 Sudoku 和 ARC-AGI 这样的推理问题对神经网络仍然具有挑战性。结构化问题求解架构家族 Recurrent Reasoning …
我们提出了 Sketch2Colab,它将 storyboard 风格的 2D 草图转换为连贯、具备对象感知的 3D 多人物动作,并对 agents、关节等实现细粒度控制。
大语言模型的长上下文推理在解码阶段受到键值(KV)缓存加载的瓶颈限制,因为生成的顺序性……
Multi-attribution learning (MAL),通过学习由多个 attribution mechanisms 产生的 conversion labels 来提升模型性能,已成为……
湄公河三角洲的非物质文化遗产(ICH)图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……