[Paper] 聚类与标签一致性
设计高效、有效且一致的 metric clustering algorithms 是一个受到日益关注的重大挑战。传统方法关注……
3322 posts from this source
设计高效、有效且一致的 metric clustering algorithms 是一个受到日益关注的重大挑战。传统方法关注……
Aspect-Category Sentiment Analysis (ACSA) 提供细粒度洞察,通过识别评论中的具体主题及其相关情感。While supervi...
我们引入了一种新颖的 deep learning 算法,用于计算可微凸函数的 convex conjugates,这是一种在 convex analysis 中的基本操作,...
编程对现代科学研究至关重要,但大多数科学家报告称,他们在工作所需的软件开发方面的培训不足。Generati...
数值模拟时变偏微分方程(PDE)是科学和工程应用的核心,但高保真求解器……
我们展示了关于 diacritic restoration 的实验,这是一种对自然语言处理 (NLP) 任务至关重要的 text normalization 形式。我们的研究聚焦于两个 ex...
摘要评估涉及评估生成的摘要在多大程度上反映了源文本的关键思想和意义,这需要对……有深入的理解。
本文介绍了 MauBERT,这是一种 HuBERT 的多语言扩展,利用 articulatory features 实现稳健的跨语言语音表征学习……
虽然Multimodal Large Language Models在许多visual和textual reasoning tasks上已经达到了类人水平的表现,但它们在细粒度spatial…
RAPID-LLM 是一个统一的性能建模框架,用于在 GPU 集群上进行大语言模型(LLM)的训练和推理。它结合了基于 DeepFlow 的前端……
近期在自监督 Joint-Embedding Predictive Architectures(JEPAs)方面的突破表明,正则化欧几里得表示以趋向 iso...
最近,一波具备思考能力的 Large Language Models 出现了,它们在各种推理基准上展示了卓越的能力。...
姿态控制对于许多卫星任务至关重要。然而,Classical controllers 的设计耗时且对模型不确定性敏感,...
我们审视人类与 LLM 交互所带来的 epistemological 威胁。我们发展集体 epistemology,作为一种在个体之间分布的 epistemic warrant 理论……
人工智能已成为全球技术竞争的关键领域,也是欧洲追求技术主权的核心关注点。这……
带有可验证奖励的群体相对强化学习(RLVR)经常浪费它已经拥有的最有信息量的数据——即失败。当所有 rollouts 都是 w...
在本文中,我们在序数回归设置中引入了方向性反馈,其中学习者会收到关于预测标签是否在……的反馈。
我们推出了 Algerian Dialect,一个大规模情感标注数据集,包含 45,000 条用阿尔及利亚阿拉伯方言撰写的 YouTube 评论。我们收集的评论……
大气湍流在包括光学成像、遥感和自由空间光学等广泛应用中构成了根本性的限制。
大型语言模型(LLMs)和多模态LLMs正在改变事件抽取(EE):提示和生成往往能够在零样本情况下产生结构化输出……
预测在连续溶剂组成范围内的反应结果仍然是有机合成和工艺化学中的一项关键挑战。传统的 m...
多样化编程语言的快速激增为开发多语言代码 LLM 带来了机遇和挑战。虽然现有技术……
理解源代码的变更及其对其他代码实体的影响是软件开发中的关键技能。然而,对代码变更的分析以及……
及时且准确的情境报告对于人道主义决策至关重要,然而当前的工作流仍然在很大程度上是手动的、资源密集型的,并且…
推荐系统是实现个性化内容投放(从而带来收入)的关键技术,广泛用于许多大型公司。在过去十年中,深度学习推荐……
我们研究强子线性 MPC 模型与经典的 graph‑centric 分布式模型之间的关系,重点关注 Node‑Capacitated Clique (NCC),一种带宽……
城市地下电缆建设对于提升城市电网的可靠性至关重要,但其高昂的建设成本使得规划变得值得……
Neural code models 已日益被纳入软件开发流程。然而,它们对 backdoor attacks 的易感性带来了显著…
高效利用 GPU 计算对于提升用户体验和降低大语言模型(LLM)服务的运营成本至关重要。然而,当前...
本文通过对研究者编码和对R的论述性贡献的分析,探讨了未被认可的劳动在企业创新系统中的作用,……
去中心化联邦学习(Decentralized federated learning,DFL)使得在边缘设备之间进行协作模型训练成为可能,无需中心化协调,提供了对 ...
Bangla 是一种代码生成的低资源语言,缺乏大规模标注数据集和将自然语言规范转换为可执行代码的工具。
将 over-the-air computations (OAC) 融入联邦学习 (FL) 的模型训练过程是一种有效的方式,以缓解通信……
大型语言模型(LLMs)的进展正显示出对软件开发和编程辅助的有希望的影响。然而,这些模型在……方面仍然存在困难。
自动化前端工程显著缩短开发周期并最小化手动编码开销。虽然 Generative AI 在翻译方面展现出潜力……
对即将到来的项目迭代(sprint)的规划是 Scrum 规划中的关键活动之一。本文中,我们展示了正在进行的关于探索 … 的工作。
动态多模态多目标优化呈现出双重挑战:既要同时跟踪多个等价的Pareto最优集合,又要保持Pareto前沿的……
大型语言模型(LLMs)执行复杂的多轮交互协议,但缺乏正式规范来验证其执行是否符合设计者的意图。我们…
Catastrophic forgetting 在 continual learning 中构成了根本性的挑战,尤其是当模型为了 deployment efficiency 而被 quantized 时。我们系统地……
Vision-Language-Action (VLA) 模型将视觉和语言与具身控制对齐,但当仅依赖于 t 时,它们的对象指代能力仍然有限。
差分隐私(DP)已成为保护推荐系统中用户数据的黄金标准,但现有的隐私保护机制面临着困难……
在生成模型中进行艺术风格迁移仍然是一个重大挑战,因为现有方法通常仅通过 model fine-tuning、additional a...
本工作提出了一种新颖的非线性最优滤波器,即 Ensemble Schrödinger Bridge 非线性滤波器。所提出的滤波器实现了 sta 的结合。
在不相交的数据集上进行训练可以实现两个主要目标:加速数据处理和实现联邦学习。已经确定 Ko...
随着计算从云端转向边缘以降低处理延迟和网络流量,产生的计算连续体(Computing Continuum,CC)创建了一个动态的环境……
多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……
多年来,自动 MT 指标已经在基准上不断攀升,并且在与人工评分的吻合度上表现出强劲且有时达到人类水平的一致性。然而,它们仍然 bl...
我们提出 Gabliteration,这是一种新颖的神经权重修改技术,通过实现自适应多方向……