[Paper] 超越 Many-Shot 翻译:扩展 In-Context Demonstrations 以实现 Low-Resource 机器翻译
构建针对低资源语言的机器翻译(MT)系统尤其困难,因为高质量数据稀缺。虽然大型语言模型...
4663 posts from this source
构建针对低资源语言的机器翻译(MT)系统尤其困难,因为高质量数据稀缺。虽然大型语言模型...
本研究针对多目标优化问题(MOOPs)的 metaheuristics 开发,解决了两个关键挑战:指数增长……
large language models 的引入点燃了对 software development models 的大规模改造和重新思考。随之而来的 software engineering 的响应……
Spatial accelerators 由 compute‑memory integrated units 阵列组成,为部署 low latency 的 inference workloads 提供了有吸引力的平台,且…
低密度奇偶校验(LDPC)译码是5G 新无线(NR)物理层中计算强度最高的核心之一,必须在…内完成。
软件工程(SE)代理在支持各种 SE 任务方面展现出有前景的能力。目前的 SE 代理仍然基本上是被动的,做出决策……
在分布式系统中,协调常常受到通信延迟的阻碍,导致性能下降。量子纠缠提供了根本上更强的…
使用 neuromorphic 系统进行感官处理通常是通过使用 event‑based sensors,或在呈现之前将输入信号转换为 spikes 来实现的……
当前的LLM安全方法根本上依赖于一种脆弱的猫捉老鼠游戏,通过guardrails识别并阻止已知威胁。我们主张...
Large Language Models (LLMs) 的出现为自动化算法设计开辟了新前沿,催生了众多强大的方法。然而,这些...
自动程序修复(Automated Program Repair,APR)的快速进展得益于人工智能的突破,尤其是大型语言模型(LLMs)和基于代理的系统。SWE-B…
架构知识管理(AKM)对于在软件项目中维护最新且全面的软件架构知识(AK)至关重要。然而……
我们提出了 SPEAR,一个用于智能合约审计的多代理协同框架,它在现实的安全分析工作流中应用了已建立的 MAS 模式……
尽管可解释人工智能(Explainable AI,XAI)取得了显著进展,但其在边缘(edge)和物联网(IoT)系统中的集成通常是临时且低效的。大多数当前方法 a...
我们介绍了一个简单的初始工作系统,在该系统中,关系(例如 part-whole)通过具有操作和学习规则的架构直接表示。
在本研究中,我们研究了针对 commutativity‑aware、linearizable 的共享对象实现的进度条件。受到以下观察的启发:可交换的 …
我们研究在一种风格化的循环推理模型中推理探针的统计行为,该模型由计算图为完美…的 Boolean circuits 构成。
主成分分析(PCA)是一种强大且流行的降维技术。然而,由于其线性特性,它常常无法捕捉到 th...
事件相机在许多场景中提供了对RGB相机的显著替代方案。虽然最近已有关于基于事件的 novel-view synthesis 的研究,但 dense 3D mesh …
我们开发了一种针对预训练模型的持续学习方法,该方法无需访问旧任务数据,解决了基础模型适配中的实际障碍。
Parallel thinking 已成为一种有前景的推理范式,但它带来了显著的计算负担。现有的效率方法主要是…
设计有效的量子电路仍然是量子计算中的核心挑战,因为电路结构对表达能力、可训练性以及……具有强烈影响。
强化学习(RL)是后训练大型语言模型(LLMs)的关键组成部分。然而,在带宽受限的分布式RL中,可扩展性...
在 pre-production 阶段,电影制片人和 3D animation 专家必须快速 prototype 想法,以在 fullscale production 之前探索影片的可能性,然而传统……
高质量的科学插图对于有效传达复杂的科学和技术概念至关重要,然而它们的手工创建仍然是一个…
Diffusion-based editing models 已成为语义图像和视频操作的强大工具。然而,现有模型缺乏平滑……
人工干预是自主系统在测试期间常见的数据来源。这些干预提供了关于当前 po… 的重要信号。
生物形态学的演化对于理解自然界的多样性至关重要,然而传统分析往往涉及主观偏差……
我们提出了一种基于偏好的新框架,用于条件处理效应估计和策略学习,构建于 Conditional Preference-based Treatme...
基于 Meme 的社交滥用检测具有挑战性,因为有害意图往往依赖于隐式文化符号和微妙的跨模态不一致。先前的…
我们提出 SymPlex,这是一种强化学习框架,用于在没有访问 … 的情况下发现偏微分方程 (PDE) 的解析符号解。
多模态大语言模型(MLLMs)面临严重的训练效率低下问题,这与它们庞大的模型规模和视觉 token 数量有关……
推理大型语言模型(LLMs)实现了测试时的可扩展性,随着 token 预算的增加,数据集层面的准确率会提升,这激发了自适应推理……
在自回归图像生成中,一个关键挑战是如何在并行地高效采样独立位置的同时,仍然对相互依赖进行建模。
在图神经网络(GNN)中的节点分类不平衡是指某些标签远比其他标签更常见,这会导致模型学习不公平……
最近,研究界对使用强化学习(RL)在真实任务上训练大型语言模型(LLMs)表现出浓厚的兴趣,例如……
现代分布式优化方法主要依赖传统的同步方法,尽管在异步优化方面取得了显著的近期进展。我们...
帮助非专业用户开发复杂的交互式网站已成为 LLM-powered code agents 的热门任务。然而,现有的代码代理往往 …
Prompt injection attacks 操纵网页内容,使 web agents 执行攻击者指定的任务,而不是用户原本的意图。现有方法……
使用大型语言模型(LLMs)进行长上下文推理成本高昂,因为 quadratic attention 和不断增长的 key-value caches,这促使了 context compression。在 t...
编程语言的开发涉及复杂的理论和实践挑战,尤其是在通过 modularity 和 reusability 解决模块化和可重用性时……
人类视觉是 foveated 的,具有可变的分辨率,在大视野的中心达到最高;这反映了主动感知的高效权衡,allo...
深度学习(DL)库如 TensorFlow 和 Pytorch 简化了机器学习(ML)模型的开发,但由于其复杂的设计,容易出现 bug。Bug...
Large Language Models (LLMs) 最近因在软件工程任务中的应用而受到广泛关注。与 code generation 相比,refactoring 需要 …
我们分析了 Accelerated Noisy Power Method,这是一种在仅能获得不精确 matrix‑vector products 的情况下用于 Principal Component Analysis 的算法。
Equilibrium Propagation (EP) 是一种受物理启发的学习算法,它利用动力系统的稳态来进行推断和学习。在它的 …
AI-enabled 系统面临各种运行时不确定性,包括动态工作负载、资源需求、模型漂移等。这些不确定…
背景:代码覆盖率被广泛用作软件质量保证的衡量指标。然而,它的效果,尤其是建议的使用量,在两者之间存在争议。