[Paper] OODEval:评估大型语言模型在面向对象设计上的表现
近期在大型语言模型(LLMs)方面的进展推动了对软件工程的大量评估。然而,大多数先前的工作集中在代码层面的…
近期在大型语言模型(LLMs)方面的进展推动了对软件工程的大量评估。然而,大多数先前的工作集中在代码层面的…
本研究分析了现代 NVIDIA GPU 中可用的主要隔离机制:MPS、MIG,以及最近的 Green Contexts,以确保可预测的推理时间……
蚁群优化(ACO)是一种著名的群体智能算法,广泛用于路径规划。然而,传统的ACO方法常常表现出 s...
背景:AI 和机器学习(ML)系统在敏感领域的广泛采用引发了对其公平性的严重担忧。已经提出了许多方法来...
交互式和自主 AI 系统的快速发展标志着我们进入了 agentic 时代。对代理在复杂的 agentic 任务上进行训练和评估……
大型语言模型(LLMs)的快速进步及其与自主代理系统的整合,为文档 a...
自主纳米无人机,由基于视觉的 TinyML(微型机器学习)模型驱动,是一种新兴技术,因其广泛的应用前景而日益受到关注。
平方公里阵列天文台(SKAO)因其数据的庞大规模和复杂性而面临前所未有的技术挑战。本文提供…
我们推出 OpenTinker,这是一套用于大语言模型(LLM)代理的强化学习(RL)基础设施,围绕算法层面的关注点分离构建……
自我进化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不佳……
自我演化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不足。
自我进化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不足……
Serverless computing 是一种范式,其中底层基础设施由提供商完全管理,使得应用程序和服务能够在...
决策是核心的工程设计活动,传递工程师的知识并将其转化为行动方案。捕捉这种形式的知识……
多代理 AI 系统(MAS)的快速出现,包括 LangChain、CrewAI 和 AutoGen,已经塑造了大型语言模型(LLM)应用的开发方式……
射电天文学依赖于定制、实验性和创新的计算解决方案。随着下一代望远镜的出现,例如 Square Kilometre Array(SKA),这种趋势将继续。
使用基于 LiDAR 的点云数据和深度神经网络进行 3D 目标检测是自动驾驶技术的关键。然而,部署最先进的...
最近的安全代码生成方法,使用漏洞感知微调、前缀微调和提示优化,声称能够防止大型语言模型生成不安全的……
在本文中,分析并讨论了神经形态计算、脉冲神经网络(SNNs)和忆阻器的基础。神经形态计算是 t...
背景:生成式 AI(GenAI)工具的快速出现已经开始重塑各种软件工程活动。然而,它们在敏捷环境中的采用……
随着漏洞研究日益采用生成式 AI,对不透明的模型输出的关键依赖已经出现,导致安全自动化中的“信任鸿沟”。
日志解析将半结构化日志转换为结构化模板,为下游分析奠定关键基础。传统的语法和语义基础……
校准 Agent-Based Models (ABMs) 是模拟复杂社会系统的重要优化问题,目标是确定最优 …
渗透测试对于在真实对手利用之前识别网页应用程序中的漏洞至关重要。近期的工作已经探索了自动化……