[Paper] 多模态文本与图谱结合的方法用于文档中的开放域事件抽取
Event extraction 对于事件理解和分析至关重要。它支持诸如 document summarization 和 emergency scenarios 中的 decision‑making 等任务……
4576 posts from this source
Event extraction 对于事件理解和分析至关重要。它支持诸如 document summarization 和 emergency scenarios 中的 decision‑making 等任务……
了解大型语言模型(LLMs)记忆的事实知识类型对于评估其可靠性和局限性至关重要。Entity-based ...
生成式人工智能(GenAI)方法能够逼真地修改相机图像,这提升了人们对在线共享图像真实性的关注。Inte...
Physical video understanding 需要的不仅是正确命名事件。模型可以根据文本规则回答关于 pouring、sliding 或 collision 的问题……
人类的道德判断是情境依赖的,并受到人际关系的调节。随着大型语言模型(LLMs)日益在决策支持中发挥作用……
STEM 教育研究者通常希望识别学生机械推理的时刻以进行更深入的分析,但他们在搜索方面的能力有限……
深度强化学习(RL)用于量子电路优化面临三个根本瓶颈:重放缓冲区忽视时序差分的可靠性……
参数驱动振荡器为神经形态计算提供了自然平台,其中非线性模耦合和内在动力学实现了 both memo...
Capsule endoscopy (CE) 实现了非侵入性的胃肠筛查,但当前的 CE 研究仍主要局限于帧级别的分类和检测……
测试用例对于软件开发和维护至关重要。在实践中,开发者基于他们的隐式模式推导出多个测试用例……
数据是现代企业的核心资源,数据验证对于确保下游应用的可靠性至关重要。然而,现有的...
大型语言模型正日益被用于通过自然语言让静态分析工具更易获取,然而现有系统在它们的…
AI 辅助编码的能力正以惊人的速度发展。基于聊天的 vibe 编码已经发展成为完整的 AI 辅助、具备代理性的软件开发。
先前的工作主要通过简单的条件语句来评估 code generation bias,这仅代表了现实编程的狭窄切片并且 rev...
背景。机器人软件最常用的开发框架是 ROS2。ROS2 架构极其复杂,成千上万的组件之间进行通信……
激活函数的选择在深度神经网络的优化和性能中起着关键作用。虽然修正线性单元(ReLU)仍然...
我们比较轻量级的基于自动机的模型(n-gram)与神经网络架构(LSTM、Transformer)在流式事件日志中的下一个活动预测。实验…
Reservoir computing(RC)是一种新兴的递归神经网络架构,因其低训练成本和适度的硬件需求而受到日益关注……
机器学习(ML)工程是一个不断增长的领域,需要提升 ML 开发的严谨性。它借鉴了许多软件工程的理念……
大数算术在科学计算和密码学中被广泛使用,但在单指令多数据 (SIMD) 并行方面的采用仍然有限。
区块链和数字资产生态系统的快速扩张加剧了将学术研究转化为可部署系统和监管……的挑战。
我们提出了一种轻量级且可解释的决策框架,用于在延迟关键的应用中进行动态 edge server 选择,并明确考虑了…
Local Optima Networks (LONs) 表示搜索空间的全局结构为图,但它们的构建需要迭代执行搜索算法……
本文对三种最常见的 Data Lakehouse 系统(包括 Apache Hudi、Apache Iceberg、……)的数据加载和存储效率进行了研究。
AI WiFi 卸载正成为一种有前景的方法,用于向资源受限的无线设备提供大语言模型(LLM)服务。然而,与 ...
自监督学习(SSL)是航空影像表示学习的标准方法。现有方法强制在增强视图之间保持不变性……
Vision Graph Neural Networks (ViGs) 将图像表示为补丁标记的图结构,实现自适应、特征驱动的邻域。不同于具有固定网格的 CNNs ……
在跨越数十TB的数据集上训练大规模深度学习模型,会在硬件利用率和训练可重复性方面带来关键挑战。
当前的区块链 Layer 2 解决方案,包括 Optimism、Arbitrum、zkSync 及其衍生方案,针对人为发起的金融交易进行优化。Autonomo...
复杂的刑事调查常常受到大量非结构化证据以及自然语言调查接口之间语义鸿沟的阻碍。
副语言线索对于自然的人机交互至关重要,然而在大型音频语言模型(LALMs)中的评估仍受限于粗略的……
最近在视频生成模型方面的进展,使得能够在广泛的场景和对象类别中合成逼真的human‑object interaction视频。
现代语言模型展示了在常见编程语言(PL)如 C++ 和 Python 中令人印象深刻的编码能力,但它们在低级…
随着人工智能(AI)系统在关键领域的部署日益增多,其安全漏洞带来的高调安全事件风险也在不断上升。
联邦学习(FL)使得在不共享原始数据的情况下进行协作模型训练成为可能;然而,分布式客户端中噪声标签的存在可能会……
生物医学成像中的核心问题是 batch effects:与感兴趣的生物信号无关的系统性技术变异。这些 batch effects……
海上风电行业正快速扩张,增加了对独立的高时间分辨率基础设施部署监测的需求……
长上下文大语言模型的可扩展性根本受限于精确自注意力的二次内存开销,这通常会导致内存溢出……
在自然文本上训练的语言模型学会使用周期特征来表示数字,主要周期为 T=2、5、10。在本文中,我们识别出一种两……
强化学习(RL)后训练已成为使生成模型与人类偏好保持一致的标准,然而大多数方法依赖于单一的标量……
随着 LLMs 越来越多地被集成到 agentic 系统中,它们必须遵守动态定义的、machine‑interpretable 接口。我们评估 LLMs as in‑cont...
大型视觉语言模型(LVLMs)在奥林匹克水平的推理任务上取得了显著进展。然而,当前的奥林匹克水平多模态…
人工智能(AI)的 value alignment problem 通常被框定为纯技术或规范性的挑战,有时聚焦于假设性的未来……
入门软件工程(SE)课程面临学生报名人数迅速增长、背景多元的参与者以及 Ge 的影响。
从RGB图像重建3D Human-Object Interaction对于感知系统至关重要。然而,这仍然具有挑战性,因为它需要捕捉子…
局部规范对称性是基本相互作用和强关联量子物质的基础,然而现有的机器学习方法缺乏通用的、原则性的……
我们提出 LLaDA2.0‑Uni,一个统一的离散扩散大型语言模型(dLLM),支持在原生集成的环境中进行多模态理解和生成。
本文提出了一种用于智能系统的混合架构,其中大型语言模型(LLMs)通过外部本体记忆层进行扩展。...