[Paper] “用英文写,没人能懂你的语言”:开源仓库中的非英语趋势研究
开源软件(OSS)社区历来以英语为主要语言,主导代码、文档和开发者互动……
4658 posts from this source
开源软件(OSS)社区历来以英语为主要语言,主导代码、文档和开发者互动……
自主编码代理正日益通过在 GitHub 上提交 pull request 为软件开发做出贡献;然而,人们对这些贡献的了解仍然很少……
iCloud Drive 提供了文件系统接口,但实现的云同步语义在根本上与 POSIX 不同。这种差异并不是 …
表征相似性度量通常要求匹配所有单元,这使它们容易受到神经表征中常见的噪声和离群值的影响。我们……
在当今碎片化且以机构为中心的医疗生态系统中,管理个人健康数据是一项挑战。个人往往缺乏对这些数据的有意义的控制……
本简报介绍了一种运行时自适应、性能增强的向量引擎,具备低资源、迭代式 CORDIC 基础的 MAC 单元,用于边缘 AI 加速。T...
强化学习微调已被证明在引导生成扩散模型朝向图像和分子领域的期望属性方面有效。Graph...
数字协作系统支持对复制数据的异步工作,当并发操作无法明确 integrate 时会产生冲突。
现代AI系统的卓越性能源于前所未有的数据、计算和能源规模——远远超出所需的资源……
Transformer 模型包含大量内部冗余,这源于坐标依赖的表示和连续对称性,无论是在模型空间中还是在……
流式视频理解需要模型能够稳健地对连续视频流进行编码、存储和检索信息,以支持准确的视频查询。
随着具身代理在 VR、远程呈现和数字人应用中变得核心,它们的动作必须超越与语言对齐的手势:代理应该转向 t...
大型语言模型(LLMs)在数学、编码等各个领域的推理任务上取得了显著进展。然而,它们的表现……
自主(噪声不可知)生成模型,例如 Equilibrium Matching 和 blind diffusion,挑战了标准范式,通过学习单一的、时间不变的……
Integral Field Spectroscopy (IFS) 调查提供了一个独特的新视野,可在空间和光谱维度上进行学习,并可能帮助揭示前…
全面检索多样化文档对于处理允许广泛有效答案的查询至关重要。我们提出了 retrieve-verify-retrieve (RVR)…
本研究提出了一种集成技术 SPQ(SVD-Pruning-Quantization),用于大语言模型(LLM)压缩,结合了保留方差的奇异值...
本文提出了一个直接框架,用于在 U(d) 的闭子群上构建具有隐藏状态的序列模型。我们采用最小公理化设置,并推导出递归……
图神经网络(GNN)的表达能力通常通过与 Weisfeiler‑Leman(WL)算法以及一阶逻辑片段的对应关系来分析。
尽管 deep learning 在 computer vision 领域取得了成功,但在识别经历了 group-symmetric transformations 的对象时仍然存在困难,尤其是这些变换很少出现……
准确预测主机功率对于船舶性能优化、燃油效率以及遵守排放法规至关重要。Convention...
生物神经网络(如海马体)可以在内部生成类似于刺激驱动活动的“重放”。最近的 computational models of replay …
我们提出 PRISM-FCP(Partial shaRing and robust calIbration with Statistical Margins for Federated Conformal Prediction),一种对拜占庭容错的联邦协同预测方法。
目标检测器在标称成像条件下表现出强大的性能,但在遭遇模糊、噪声、压缩、恶劣天气或……时可能悄然失效。
Pure Pursuit(PP)因其高效性和几何清晰性而被广泛用于自动赛车的实时路径跟踪,但其性能高度敏感于……
交互感知(Interactive perception,IP)使机器人能够在其工作空间中提取隐藏信息,并通过与物体的物理交互来执行操作计划。
人工智能(AI)系统的质量评估是一项根本性挑战,因为它们本质上具有概率性。ISO/IE 等标准……
定性数据分析工作量大,但商业大型语言模型(LLMs)所带来的隐私风险常常使其在敏感…
现实世界的知识表示通常需要捕捉主观的、连续的属性——例如政治立场——这些属性与成对的…
我们展示了将量子特征提取方法应用于提升用于空间应用的多类图像分类的效果。通过利用 dyna…
在印度等司法管辖区,法院面临大量案件积压,人工智能为法律判决预测提供了变革性的潜力……
尽管 transformer-based language models 取得了显著的实际成功,最近的研究对它们进行 state tracking 的能力提出了担忧。In...
我们描述了一个现代深度学习系统,该系统能够自动识别用于第一语言词汇教学的有信息量的上下文示例(qu{contexts})。
心理语料库在 NLP 中是用于分析人类心理、情感和心理健康的文本集合。这些文本使研究人员能够研究心理……
我们提出了首个用于游戏可玩性测试的虚拟现实(VR)动作生成系统。我们的玩家模型能够生成 VR 头显和手持控制器的运动……
大型语言模型在交互式定理证明,尤其是 Lean 中取得了显著成果。然而,大多数针对基于 LLM 的证明自动化的基准……
随着LLM编码能力的快速提升,基于LLM的自动化软件开发的瓶颈正从生成正确代码转向……
Static security analysis 是一种广泛使用的技术,用于检测软件漏洞,覆盖各种弱点、应用领域和程序语言。
生成式人工智能(GenAI)的采用意味着软件工程将迎来重大变革,既包括技术层面的变化,也涉及专业人员的人文层面……
汽车软件的开发速度日益超过硬件的可用性,迫使后期集成并产生昂贵的硬件在环(HiL)瓶颈。InnoRegioCha…
对锂离子电池内部状态进行准确、实时且无损的估计对于预测退化、优化使用策略至关重要。
人工智能 (AI) 正在日益自动化软件开发任务的各个环节。虽然 AI 已提升了开发任务的生产力……
物联网应用正日益依赖于设备端 AI 加速器,以确保高性能,尤其在连接受限和安全关键的场景中……
我们呈现了一项对开源面向消息的中间件(MOM)系统的全面特性研究。我们遵循了严格的方法论来选择和研究……
近期在 multimodal reasoning 方面的进展使得能够解释 imagery、将其与 language 连接并执行 structured analytical tasks 的 agents 成为可能。Extend...
扩散语言模型(Diffusion Language Models,DLMs)由于迭代去噪导致推理成本高,因而激励高效剪枝。现有的剪枝启发式方法大多继承……
Vision-Language-Action models (VLAs) 旨在将语言指令与机器人控制相结合,但在实践中往往未能忠实地遵循语言。当 pr...
奖励建模是现代对齐流水线的核心组成部分,包括 RLHF 和 RLAIF,支撑包括 PPO 和 TRPO 在内的策略优化方法。如何...