[Paper] 关于内聚与分离的故事:无标签度量用于日志解析器评估
日志解析将日志消息转换为结构化事件模板,从而实现自动化日志分析并减少人工检查工作量。为了选择最...
3296 posts from this source
日志解析将日志消息转换为结构化事件模板,从而实现自动化日志分析并减少人工检查工作量。为了选择最...
以 GPU 为核心的 AI 数据中心已采用液体冷却来处理极端热负荷,但冷却剂泄漏导致通过 unp... 的大量能量损失。
软件材料清单 (SBOM) 通过记录软件组件的元数据和依赖关系提供透明性。然而,SBOM 的采用取决于工具生态系统……
Performance optimization 是软件开发中一个关键且充满挑战的方面,通常需要对系统行为、algorithmic trad… 有深入的理解。
近期在 array-camera 视频拍摄方面的进展使得实时捕获超高清(Ultra‑HD)视频成为可能,提供了丰富的视觉信息……
新兴的实时应用推动了向多核嵌入式系统的转变,在这些系统中,由于功能需求和资源有限,任务必须共享资源……
检索增强代码生成(RACG)正日益被采用,以提升用于软件开发的大型语言模型,但其安全影响仍然...
Python 的动态类型机制虽然提升了灵活性,但也是大规模软件中大量运行时类型错误的主要来源,这激发了 …
随着移动应用的复杂性呈指数级增长,用户设备环境的碎片化加剧,确保 online application 的稳定性……
高分辨率视频生成虽然对数字媒体和电影至关重要,但由于扩散模型的二次复杂度,在计算上成为瓶颈,...
我们揭示了最先进的视觉语言模型(VLMs)中显著的流行偏差,这些模型在著名建筑上的准确率最高可提升34%……
Masked Diffusion Models(MDMs)提供灵活的非自回归生成,但这种自由带来了一个挑战:最终输出质量对……高度敏感。
计算型现场检测(POC)传感器能够在缺乏医疗资源的紧急、偏远和资源受限地区,实现快速、低成本且易于获取的诊断。
我们提出了 Streamo,这是一种实时流式视频 LLM,充当通用交互式助手。与现有专注于狭窄场景的在线视频模型不同……
Segment Anything Model 2 (SAM2) 是一种视觉基础模型,在基于提示的视频目标分割方面取得了显著进展,但其实际部署仍面临挑战……
我们提出 C2LLM——Contrastive Code Large Language Models,这是一个包含 0.5B 和 7B 规模的代码嵌入模型系列。基于 Qwen-2.5-Coder 骨干,...
在大型全切片图像(WSI)中,对小块(tiles)的解释通常需要更大的图像上下文。我们提出了 TICON,一种基于 transformer 的 tile 表示方法……
像抽象与推理语料库(ARC)和 ARC-AGI 这样的推理基准被广泛用于评估人工智能的进展,并且常常 ...
从噪声中分离信号是实验科学的核心。将成熟的统计方法有效地应用于 LLM evals 需要考虑……
我们提出了并行令牌预测(Parallel Token Prediction,PTP),这是一种用于语言模型中并行序列生成的通用框架。PTP 联合预测多个相互依赖的 t...
最小化 PDE‑残差损失是促进神经算子物理一致性的常用策略。然而,标准形式往往缺乏变分 c...
本文推导了“Scaling Laws for Economic Impacts”——即大语言模型(LLMs)的训练算力与专业……之间的经验关系。
Data processing inequality 是信息论中的一个原理,指出对观测到的信号进行处理时,信号的信息内容不能增加。
在形状上求解偏微分方程(PDE)是许多形状分析和工程任务的基础;然而,现有的 PDE 求解器主要在多边形/三角网格上运行……
图形用户界面(GUI)代理可以通过自动化在移动设备上频繁执行的长延迟任务,显著提升生产力。然而,ex...
急性髓系白血病(AML)由于其极端的分子异质性和高复发率,仍然是临床上的挑战。虽然精准医学已经引入……
Model merging 已成为一种轻量级的替代方案,用于 joint multi-task learning (MTL),但合并模型的泛化属性仍然在很大程度上未被探讨。
结构化数据从表格中提取在扫描文档和数字档案的文档图像分析中发挥着关键作用。虽然已经有许多方法……
现代外科系统日益依赖 intelligent scene understanding,以提供及时的 situational awareness,提升 intra-operative safety。 Within...
Engineering Manuals(EM)的用户发现阅读 EM 很困难,因为它们篇幅很长,格式密集,包含书面文档、逐步 …
现代深度学习方法通常将图像序列视为顺序堆叠帧的大张量。然而,这种直接的表示是否…
工业推荐系统在日志驱动范式下面临两个根本性的限制:(1) 基于ID的项目表示的知识贫乏导致……
AI工具在教育中的日益整合促使先前的研究探讨它们对学习过程的影响。然而,大多数现有研究…
使用大型语言模型(LLM)作为具身指令跟随任务的规划器的方法已变得广泛。为了成功完成任务,LL...
在硬标签黑箱对抗攻击中,仅能访问 top-1 预测标签,巨大的查询复杂度对实际应用构成了主要障碍。
大型语言模型(LLMs)在软件开发中的使用日益增多,但它们在软件安全方面的专业水平仍不明确。本工作系统地……
大型语言模型(LLMs)通过 AI 辅助编码工具彻底改变了软件开发,使得编程经验有限的开发者能够……
人类婴儿仅通过几百小时的语言输入,就能掌握新语言的基本单元,这凸显了与 da... 相比的显著效率差距。
我们展示了如何在模态逻辑中将分布式算法形式化为声明式公理理论。我们在一个简单的投票协议上演示了该方法。
大型语言模型(LLMs)正日益被部署为开放域、多轮对话环境中的对话助理,用户常常提供不完整或……
当前大型语言模型(LLMs)安全方法侧重于显式有害内容,却忽视了一个关键漏洞:无法理解……
医疗AI需要大规模、多样化的数据集,但严格的隐私和治理约束阻止了机构之间共享原始数据。联邦学习 (FL)…
大型语言模型(LLMs)被广泛用于自动代码生成,然而它们表面的成功常常掩盖了预训练目标与实际应用之间的张力。
在大型复杂网络中,超出成对关系的高阶交互通常被建模为 hypergraph。分析 hypergraph 的属性,例如三元……
分布式注意力是扩展大型语言模型(LLMs)上下文窗口的根本问题。当前最先进的方法 Ring-Attention 存在……
随着基础模型规模的增长,对其进行微调的成本也越来越高。虽然 GPU 现货实例提供了一种低成本的替代方案,相比按需资源……
在大型开源软件(OSS)代码库中定位需要修改的文件和函数是具有挑战性的,因为它们的规模和结构复杂性……
大型语言模型(LLMs)的快速增长以及新GPU产品的持续发布,显著提升了对分布式训练的需求……