[Paper] MedAI:评估 TxAgent 在 NeurIPS CURE-Bench 竞赛中的治疗性代理推理
临床医学中的治疗决策是一个高风险领域,AI 指导与患者特征之间的复杂相互作用相互影响……
临床医学中的治疗决策是一个高风险领域,AI 指导与患者特征之间的复杂相互作用相互影响……
大型语言模型(LLMs)正日益嵌入学术写作实践中。虽然已有大量研究探讨了研究人员如何使用这些工具……
Snowflake 风格的分布式 ID 生成器是大规模生成 k-ordered、唯一标识符的行业标准。然而,传统的要求 f...
从大量非结构化的历史报纸档案中提取连贯且人类可理解的主题面临重大挑战,原因是……
介绍 FirecREST v2,它是我们开源 RESTful API 的下一代,用于以编程方式访问 HPC 资源。FirecREST v2 提供了 100 倍的性能提升……
检索增强生成(RAG)模型依赖检索到的证据来指导大型语言模型(LLM)生成器,然而当前系统将检索视为……
编码代理正变得越来越能够完成以前需要人工开发者的端到端软件工程工作流,包括 ra...
我们考虑审计 black-box 大型语言模型(LLMs)的问题,以确保它们在生产环境中部署时能够可靠运行,特别是在……
社交媒体在现代政治中是关键的媒介,因为它既反映了政治家的意识形态,又促进了与年轻一代的沟通。
对牙科中的多模态数据进行可靠的解释对于自动化口腔健康护理至关重要,然而当前的多模态大语言模型(MLLMs)仍面临困难……
在视频理解中,关键帧选择面临重大挑战。传统的 top‑K 选择方法会独立对帧进行打分,往往会失败于……
对边缘设备上实时 DNN 应用的需求日益增长,需要更快地推理日益复杂的模型。虽然许多设备包括 sp...
在不断演进的云计算和网络环境中,服务功能链(SFC)在实现复杂服务方面发挥着关键作用。
使用 closeness centrality 识别中心节点是分析大规模复杂网络的关键任务,但其去中心化计算仍然是 cha...
大型语言模型(LLMs)在自然语言理解和推理方面展现出卓越的能力,但却存在幻觉问题:生成的 f...
专注于代码的大型语言模型(CodeLLM)在生成代码片段、文档和测试用例方面展示了卓越的能力。Howe...
从手工设计的启发式方法向数据驱动的进化算法转变面临一个根本性的两难困境:在实现神经可塑性的同时不牺牲 …
将 C 代码自动翻译成 Java 代码是一项臭名昭著的困难任务,充满了源于根本范式转变(过程式 ...)的挑战。
随着大语言模型(LLMs)在代码生成方面的快速发展,它们在硬件设计中的应用正受到越来越多的关注。然而,e...
在本文中,我们介绍了 GraphSecure,这是一款提供安全扫描结果高级分析和可视化的 Web 应用程序。GraphSecure 使用户……
Rollout-training 解耦正逐渐成为强化学习(Reinforcement Learning,RL)后训练的标准架构,其中内存受限的 rollout 和 compute-b…
测试阶段是软件开发的关键环节,但手动创建测试用例可能耗时。因此,对……的需求日益增长。
当前的 AI 代码生成系统在编译、执行和测试阶段由于 CPU 与 GPU 之间的数据传输而遭受显著的延迟瓶颈……
主动安全算术 MPC 现在已可用于实际应用,但性能和可用性仍受限于框架特定的编译栈,……