[Paper] 多模态语义通信
语义通信旨在传输与任务最相关的信息,而非原始数据,从而在应用中实现显著的通信效率提升。
3337 posts from this source
语义通信旨在传输与任务最相关的信息,而非原始数据,从而在应用中实现显著的通信效率提升。
未来的 AI agents 可能在提升的权限下 autonomously 运行。如果这些 agents 是 misaligned 的,它们可能滥用这些权限,造成严重损害。The...
强化学习已成为提升大语言模型推理能力的关键,但当前的探索机制仍然根本...
本文提出了一个统一框架,用于在供水分配网络中使用 multi... 进行异常的检测、分类和初步定位。
Partial Least Squares(PLS)是一种广泛使用的数据集成方法,旨在提取跨配对高维数据集共享的潜在成分……
随着向Exascale计算和数据驱动方法的推进,问题规模显著增加,导致计算需求大幅提升,……
本文提出了一种训练数据增强流水线,将合成图像数据与神经风格迁移相结合,以解决其脆弱性。
大型语言模型(LLM)激活一直以来都极其难以理解,大多数现有技术都使用复杂、专门的方法来解释……
大型语言模型(LLMs)展现出惊人的能力,但它们的推理过程仍然不透明,导致安全性和可信度方面的担忧。Attribution methods,...
人类通过批判性思维来解决复杂问题,在此过程中,推理与评估交织在一起,汇聚为正确的解决方案。然而,mos...
Raft 是一种用于在分布式数据库中复制写操作的领先共识算法。然而,分布式数据库也需要一致的读取。为了保证……
持续学习仍然是机器学习中的根本性挑战,需要模型从任务流中学习,同时不忘记先前获得的知识。
状态空间模型(SSMs)是语言建模中一种有前景的 transformer 替代方案,因为它们在推理时使用固定内存。然而,这种固定 ...
与扩展 LLMs 的 context window 相关的计算和内存开销严重限制了它们的可扩展性。一个值得注意的解决方案是 vision-te…
大型语言模型正日益通过微调适配下游任务。全监督微调(SFT)和参数高效微调(P...)
LLMs(Large Language Models)在文本处理流水线中被越来越多地使用,以智能地响应各种输入和生成任务。这引发了...
工作记忆使大脑能够整合瞬时信息,以实现快速决策。人工网络通常通过 recurrent 或 par...
心理防御是人们用来管理痛苦的策略,通常是自动的。防御的僵化或过度使用与心理健康呈负相关……
Bloom filters 是一种用于近似成员查询的基础数据结构,应用范围从数据分析到数据库和基因组学。Seve...
我们推出 Bolmo,这是首个在 1B 和 7B 参数规模上具有竞争力的完全开放的字节级语言模型(LMs)系列。与以往研究相比……
许多业务流程目前依赖于 web services,通常使用 REST APIs 进行通信。REST APIs 通过 endpoints 暴露 web service 功能,...
大型语言模型在代码方面的成功依赖于海量的代码数据,包括公共开源仓库,如 GitHub,以及私有的、保密的…
在代码审查中使用像 ChatGPT 这样的大语言模型可以带来有前景的效率提升,但也引发了对正确性和安全性的担忧。Existing e...
在制造业中,作为资产管理外壳(Asset Administration Shells,AAS)实现的数字孪生已经成为一种普遍的实践。这些数字复制品,常被用作 …
可重用的软件组件,通常以包的形式分发,是现代软件开发的核心范式。JavaScript 生态系统作为一个...
确保自动驾驶系统(ADS)的安全性和可靠性仍然是一个关键挑战,因为传统的验证方法,如大规模的……
现代数据中心拥有成千上万的服务器,使它们成为电力的主要消耗者。为了将其环境影响降至最低,关键是我们要使用……
我们提出了 LLMQ,这是一种端到端的 CUDA/C++ 实现,用于在经济实惠的通用 GPU 上进行中等规模语言模型的训练,例如 3B 到 32B 参数。
Digital twin (DT) 技术整合 heterogeneous data and models,以及 semantic technologies,以创建物理系统的多层次数字表示。
BPMN业务流程的日益广泛使用,以及其中包含的DMN表格,需要工具和方法来验证它们的正确性。然而,...
数据驱动的进化算法在通过稳健的 surrogate modeling 解决昂贵的优化问题方面展现出惊人的成果。虽然前景可期……
对高性能数据传输的追求通常侧重于原始网络带宽,且 100 Gbps 或更高的国际链路常被视为…
现代 AI 系统日益增长的计算需求暴露了数字硬件的根本限制,推动了对 alternative paradigms 的兴趣 fo...
创新农业系统正在彻底改变我们的耕作方式,使其成为我们时代最关键的创新之一!然而,它面临着重大的连接性……
我们提出了一种振荡神经形态原语,使用耦合的Wien桥振荡器网络和可调电阻耦合实现。相位关系…
流式视频生成的核心挑战是保持长上下文中的内容一致性,这对内存设计提出了很高的要求。Mo...
本论文并未提出新方法,而是为视频时间定位(VTG)建立了一个直接、渐进且必不可少的基线,……
非参数量化因其在参数上的高效性以及对大码本的可扩展性而受到广泛关注。本文中,我们提出了一种 uni...
我们介绍了 CRISP,这是一种从单目视频中恢复可模拟的人体运动和场景几何的方法。先前关于人‑场景联合重建的工作…
Universal transformers (UTs) 已被广泛用于诸如 ARC-AGI 和 Sudoku 等复杂推理任务,然而它们性能提升的具体来源仍然...
近年来,3D 生成建模的最新进展显著提升了生成的真实感,但该领域仍受到现有表示方式的限制,……
Video foundation models 生成视觉上逼真且时间上连贯的内容,但它们作为 world simulators 的可靠性取决于它们是否捕捉到 …
最近在人形机器人领域的进展已经实现了灵活的运动技能,包括后空翻、跑步和爬行。然而,对于人形机器人来说仍然具有挑战性……
最近的音频语言模型能够跟随长对话。然而,情感感知或口语对话摘要的研究受到数据缺乏的限制……
随机优化是现代机器学习的基础。最近的研究已经将随机一阶方法(SFOM)的研究从轻量级…
医院缺乏自动化系统来利用日益增长的异构临床和运营数据,以有效预测关键事件。早期……
Multi-token generation 已成为加速基于 Transformer 的大模型推理的有前景范式。近期的工作主要探索 diffusion …
我们提出 VASA-3D,一种音频驱动的单次拍摄 3D 头部化身生成器。本研究解决了两个主要挑战:捕捉细微的表情细节 p...