5个实用技巧,将批处理数据管道转变为实时:即将举办的网络研讨会
本文为您提供五个实用技巧,帮助您充分利用现代化工作。欢迎参加我们即将举办的网络研讨会,了解更多信息 https://streamyard.co...
本文为您提供五个实用技巧,帮助您充分利用现代化工作。欢迎参加我们即将举办的网络研讨会,了解更多信息 https://streamyard.co...
软件工程中的情感分析侧重于理解软件制品中表达的情感。先前的研究指出了其局限性。
在缺乏持续外部输入的情况下,自我维持的神经活动是神经系统动力学的基本特征,然而其出现的条件……
本研究考察了加性噪声和乘性噪声对单个泄漏积分‑发放(LIF)神经元以及训练后的脉冲神经网络的影响……
我们提出了一种新颖的 end-to-end 隐私保护框架,由三个高效的 protocols 实现,适用于不同的部署场景,覆盖了输入和…
旅行窃贼问题(TTP)是一种著名的多组件优化问题,捕捉了两个组件之间的相互依赖:旅行路线跨越……
露天采矿调度是一个复杂的现实世界优化问题,涉及不确定的经济价值和动态变化的资源容量。Evol...
现代 GPU 工作负载,尤其是大语言模型(LLM)推理,受到 kernel launch 开销和粗粒度同步的限制,这限制了 inter‑kernel 并行性。
我们正逐步进入开发者大会季,接下来日程中最大的一场活动就是 Google I/O。今年的大会将在五月举行。
最近在视频生成方面的进展使得3D场景创建出现了新范式:生成受摄像机控制的视频,以模拟场景漫游,然后提升……
大型语言模型(LLMs)和视觉语言模型(VLMs)越来越多地通过布局和场景图等中间结构生成室内场景。
虽然扩散模型在视觉生成领域占据主导地位,但它们在计算上效率低下,对所有扩散过程都采用统一的计算努力。
Direct Preference Optimization(DPO)的有效性取决于能够反映多模态任务中关键质量差异的偏好数据。存在……
城市地区因快速城市化和气候变化而日益容易受到热极端的影响。传统上,热极端的监测……
系统日志的爆炸性增长使得流式压缩变得必不可少,然而现有的日志异常检测(LAD)方法会产生严重的预处理开销……
Energy Conserving Descent (ECD) 算法最近由 De Luca 与 Silverstein(2022)提出,作为一种全局非凸优化方法。不同于梯度……
Computed tomography (CT) enterography 是评估炎症性肠病 (IBD) 的主要成像方式,但最佳的表征选择仍有待确定。
计算机使用代理(Computer Use Agents,CUAs)根本上依赖图形用户界面(graphical user interface,GUI)基础,将语言指令转换为可执行的屏幕操作,但……
自主 AI 研究发展迅速,但长期视野的 ML 研究工程仍然困难:代理必须在任务理解上保持连贯的进展……
AI驱动的教育平台在个性化方面取得了一定进展,但大多数仍受限于静态适应——预定义的测验、统一的进度、……
On-policy distillation (OPD) 已成为大语言模型后训练的核心技术,但其训练动态仍然了解不足。这……
On-policy distillation (OPD) 已经成为大语言模型的一种高效的后训练范式。然而,标准的 OPD 需要实时的教师推理……
Instruction-tuned 大型语言模型产生有帮助、结构化的响应,但当受到微不足道的约束时,这种帮助性有多稳健?我们展示了简…
大型语言模型(LLMs)正日益被整合到现实世界的决策中,包括公共政策领域。然而,它们的能力去理解…
逻辑漏洞在软件中源于 program logic 的缺陷,而不是 memory safety,这可能导致关键的 security failures。虽然现有的 …
预测 longitudinal data 中的 counterfactual outcomes,尤其是当 sequential treatment decisions 严重依赖于不断演变的 patient states 时,既关键又极具挑战性。
执行准确率(EX),一种广泛用于评估自然语言转SQL(NL2SQL)解决方案有效性的指标,正变得越来越不可靠……
自主 AI 代理正迅速从实验工具转变为运营基础设施,预计 80% 的企业应用将……
光学字符识别(OCR)随着视觉语言模型的兴起而迅速发展,但评估仍然集中在少数几个……
多模态联邦学习实现了在医疗机构之间进行隐私保护的协作模型训练。然而,一个根本性的挑战出现了……
在 deep learning 优化中,平衡收敛速度、泛化能力和计算效率仍然是一个核心挑战。First-order gradient…
Anthropic的新平台:Claude Managed Agents Anthropic上周宣布了Claude Managed Agents,这是一个旨在消除大量复杂性的平台……
在深度学习中被引用最多的校准结果——在 CIFAR-100 上的 post-temperature-scaling ECE 为 0.012(Guo et al., 2017)——低于统计噪声的...
传统的固定深度架构通过增加训练 FLOPs 来提升质量,通常通过增加参数化(parameterization),但代价是更高的内存……
Speech-to-speech language models 最近出现,以提升对话式 AI 的自然度。特别是,full-duplex models 通过 t...
Metonymy 和 metaphor 常常在自然语言中共现,但计算工作大多是孤立地研究它们。我们提出了一个将……转化的框架。
二进制反编译是一项关键的逆向工程任务,旨在从已剥离的可执行文件中重建高级源代码。虽然 Large Language Model...
多语言基准指导前沿模型的开发。然而,前沿模型报告的多语言评估结构类似于流行的...
在关于神经元细胞自动机(NCAs)的文献中,通常理所当然地认为这些系统会学习吸引子。这一点通过演化 th...
MIT 人文、艺术与社会科学学院(SHASS)于 1950 年成立(https://shass.mit.edu/about-the-school/shass-timeline/),以响应“一个新的 …”。
大型语言模型(LLMs)越来越依赖显式推理来解决编码任务,但评估此类推理的质量仍然具有挑战性。Ex...
流式数据驱动优化(SDDO)问题在许多应用中出现,这些应用中数据持续到达,且优化环境随时间演变……
vibe coding 的出现,这是一种范式,非技术用户通过自然语言指示大型语言模型(LLMs)生成可执行代码,预…
我们系统性地测量了七种策略,以在小型本地模型可以作为前置分流层的情况下,减少云端 LLM 的 token 使用量。
大型语言模型(LLMs)可以根据自然语言生成代码,但它们在多大程度上捕捉到预期的程序行为仍不清楚。Executable...
我们研究在网络上进行去中心化学习的情形,其中数据分布在各节点上,没有中心协调者。Random walk learning 是一种基于 token 的方法……
深度神经网络尽管具有很高的准确率,但往往表现出置信度校准不足,限制了它们在高风险应用中的可靠性。当前的…
我们提出 (Experience‑Modulated Biologically‑inspired Emergent Reasoning),一种混合认知架构,重新组织大型语言模型之间的关系……