[Paper] EditYourself:Audio-Driven 生成与操控 Talking Head 视频,使用 Diffusion Transformers
当前的生成式视频模型在根据文本和图像提示生成新内容方面表现出色,但在编辑已有的预录制视频方面仍存在关键缺口,……
当前的生成式视频模型在根据文本和图像提示生成新内容方面表现出色,但在编辑已有的预录制视频方面仍存在关键缺口,……
创意图像生成已成为一个引人注目的研究领域,驱动力在于需要产生新颖且高质量的图像,以拓展边界。
大型语言模型(LLMs)在医学基准测试中表现出色,包括问答和诊断。为了使它们在临床...
量化显著提升了大型语言模型(LLM)训练的计算和内存效率。然而,现有方法仍然依赖于…
能源现在已成为关键的ML计算资源。虽然测量能源消耗并观察趋势是一个有价值的第一步,但准确理解和 d...
设计高性能光学透镜需要在一个高维、受严格约束的空间中探索表面曲率、玻璃选择、元件厚度……
评估大语言模型(LLM)应用与传统软件测试不同,因为其输出具有随机性、高维性,并且对……敏感。
AI 代理推理正在推动一个以推理为主的数据中心未来,并暴露出超出计算的瓶颈——尤其是内存容量、内存带宽以及高…
当代软件架构在支持推理具有适应性、概率性和上下文依赖性的自主代理时面临困难,同时系统集成……
最近的研究探索了通过多智能体强化学习(MARL)来优化大型语言模型(LLM)的协作。然而,大多数 MARL 微调方法依赖于预先…
AI 研究传统上优先考虑算法性能,例如在 machine learning 中优化准确率或在 automated planning 中优化运行时间。新兴的...
人工智能的快速崛起导致能源消耗的不可持续增长。这激发了类脑计算和ph...
信念传播(BP)是一种用于概率图模型中分布式推理的强大算法,但它很快在实际应用中变得不可行……
多目标进化算法(MOEAs)已被证明在解决多目标优化问题(MOOPs)方面有效。然而,它们的性能可能会……
Benchmark Design 在 Black-Box Optimization (BBO) 中是一个基础且仍未结束的话题。早期的 BBO 基准主要是人工制作的,引入了专家……
在万物互联(IoE)时代,网络边缘传感器生成数据的指数级增长使得高效的 Probabilistic Skyline Query …
Meta-Black-Box Optimization(MetaBBO)是优化社区中新兴的研究方向,在该方向中,算法设计策略可以通过强化学习进行元学习……
在汽车后市场中,高效的备件库存管理至关重要,因为需求高度间歇且不确定性导致巨大的成本……
确定性对于大语言模型(LLM)训练中的可重复性是必不可少的,但它往往会带来巨大的性能代价。在广泛使用的注意力 …
脉冲神经网络(SNNs)由于事件驱动的稀疏计算而具有极高的能效,但其训练受到脉冲不可微分性的挑战。
我们探讨 software engineering 中的 folklore 概念,借鉴 folklore studies 来定义和刻画 narratives、myths、rituals、humor,以及……
创建业务流程模型与标记(BPMN)模型是一项复杂且耗时的任务,需要领域知识和建模熟练度……
脉冲神经网络(SNNs)可以通过转换已有的、训练良好的人工神经网络(ANNs)来实现竞争性的性能,避免进一步…
同行评审是软件工程社区评估科学成果质量的主要机制。然而,论文提交的快速增长……