Source

arXiv

4576 posts from this source

排序:

1天前 · ai · - · -

[论文] 从多个思考者学习思考

我们研究从多个思考者那里获得链式思考（Chain-of-Thought, CoT）监督的学习，这些思考者都提供正确但可能系统性不同的解答，例如……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] SpecRLBench：用于规范引导强化学习泛化的基准

Specification-guided reinforcement learning (RL) 为编码复杂、时间延伸的任务提供了一种基于形式规范的原则性框架。

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 基于多任务 BiLSTM 与 AutoML 基准测试的印尼电子商务评论情感与情绪分类

印尼电商平台的评论将标准词汇与俚语、地区借词、数字简写和 emoji 混合在一起，使得 lexicon-based sentiment tools 难以……

#research #paper #ai #nlp
1天前 · ai · - · -

[Paper] WildLIFT：将单目无人机视频提升至3D用于物种无关的野生动物监测

单目RGB相机安装在无人机上被广泛用于野生动物监测，但大多数分析管道仍局限于二维图像空间，l...

#research #paper #ai #computer-vision
1天前 · ai · - · -

[Paper] 学习旋转：时序与语义 Rotary 编码用于序列建模

每个 Transformer 架构都投入巨大的容量来学习语义嵌入空间中的丰富表征——然而所作用的旋转流形……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 长上下文感知再利用：混合 LLM 扩展的新前沿

将高效的Transformer组件与线性序列建模块相结合的混合序列模型是对纯Transformer的有前景的替代方案，但……

#research #paper #ai #machine-learning #nlp
1天前 · software · - · -

[Paper] 当提示词不足规格提升代码正确性：对提示词措辞与结构对基于LLM的代码生成影响的探索性研究

大型语言模型正日益用于代码生成，但其输出的正确性不仅取决于模型能力，还取决于任务的…

#research #paper #software
1天前 · ai · - · -

[Paper] 可扩展的超参数多样化集成训练与大模型的自动学习率探索

使用数据并行随机梯度下降训练大型神经网络时，会分配 N 个 GPU 副本来计算基本相同的更新——这种做法...

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 利用微分平坦性实现约束多输入仿射系统的高效学习型模型预测控制

基于学习的控制技术利用过去轨迹的数据来控制具有不确定动力学的系统。然而，基于学习的控制器往往计算量大……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 基于LLM的代码生成中的任务描述缺陷：检测与分析

大型语言模型被广泛用于代码生成，但它们依赖于一个隐含的假设，即任务描述足够详细且良好……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 绿色护盾：面向可信 AI 的以用户为中心的方法

大型语言模型（LLMs）正被越来越多地部署，但它们的输出对用户在提问时的常规、非对抗性表述变化极其敏感……

#research #paper #ai #machine-learning #nlp
1天前 · ai · - · -

[Paper] 变色龙的极限：研究大型语言模型中的人格崩塌与同质化

基于大语言模型（LLMs）的应用，例如多代理仿真，需要代理之间的人口多样性。我们发现了一种普遍的失败……

#research #paper #ai #nlp
1天前 · ai · - · -

【论文】NeuroClaw 技术报告

具备主动性的人工智能系统有望加速科学工作流程，但神经影像学面临独特挑战：异构的模态（sMRI、fM…）。

#research #paper #ai #computer-vision
1天前 · ai · - · -

[Paper] 治理你无法观察的事物：面向自主 AI 代理的自适应运行时治理

自主 AI 代理即使保持完全授权，也可能因行为漂移、对手适应以及决策模式转变而变得不安全，即使没有任何代码更改……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 利用 LLMs 进行多文件 DSL 代码生成：工业案例研究

大型语言模型（LLMs）在通用代码生成方面表现强劲，但它们在企业领域特定语言（DSL）上的适用性仍然……

#research #paper #ai #machine-learning
1天前 · ai · - · -

[Paper] 基准测试土耳其语中的来源敏感推理：人类和LLMs在证据信任操控下

本文研究了信息来源的可信度是否会影响土耳其语的证据形态学，以及大型语言模型（LLMs）是否能够捕捉这种敏感性。我们……

#research #paper #ai #machine-learning #nlp
1天前 · ai · - · -

[Paper] K-MetBench：用于气象学中专家推理、局部性和多模态细粒度评估的多维基准

针对韩国天气预报员的实用（multimodal）large language model助手的开发受到缺乏多维、exper…的阻碍。

#research #paper #ai #machine-learning #nlp
1天前 · ai · - · -

[Paper] 探究 CLIP 对 360 度文本和视觉语义的理解

从文本即时创建丰富的 360 度全景世界的梦想正迅速成为现实，然而在我们可靠地实现……方面仍存在关键的差距。

#research #paper #ai #computer-vision
1天前 · ai · - · -

[Paper] 少即是多：移动应用中 On-Device Small Language Model 集成的工程挑战

本地小语言模型（SLMs）承诺为移动用户提供完全离线、私密的 AI 体验（无需云端依赖，数据不离开设备）。但是否……

#research #paper #ai #machine-learning #nlp
1天前 · ai · - · -

[Paper] Meta‑CoT：提升图像编辑中的粒度和泛化能力

统一的多模态理解/生成模型通过将细粒度理解融入其Chain‑o…，展示了改进的图像编辑性能。

#research #paper #ai #machine-learning #computer-vision
1天前 · software · - · -

[Paper] 基于LLM的软件工程工具评估：实践、挑战与未来方向

大型语言模型（LLMs）正日益嵌入软件工程（SE）工具中，为代码生成、自动代码审查等应用提供动力，……

#research #paper #software
1天前 · software · - · -

[Paper] 测量不可测的：Markov Chain 可靠性用于 LLM 代理

大型语言模型（LLM）代理正日益作为顺序软件系统运行，但它们的可靠性通常仅通过标量基准指标来概括。Me...

#research #paper #software
1天前 · software · - · -

[Paper] Mono2Sls：通过多阶段流水线和静态分析实现单体到无服务器的自动化迁移

云计算平台提供弹性伸缩、托管基础设施和按使用付费的定价模式，但将现有的 monolithic backends 迁移到它们仍然是一项困难的任务。

#research #paper #software
1天前 · devops · - · -

[Paper] SpotVista：可用性感知的可靠且成本高效的多节点 Spot 实例推荐系统

云服务提供商提供折扣的 spot 实例，以最大化剩余资源的利用率，但这些实例存在突然中断的风险。Trad...

#research #paper #devops
1天前 · ai · - · -

[Paper] 在实践中理解代码审查机器人自动评估的局限性

自动代码审查（ACR）机器人在工业软件开发中被越来越多地使用，以帮助开发人员在拉取请求（PR）审查期间进行辅助。随着采用率的提升……

#research #paper #ai #machine-learning
1天前 · software · - · -

[论文] 软件工程学生在真实世界的 Capstone 项目中如何使用 Generative AI？一项实证基线研究

真实世界的 Capstone 项目（RWCPs）是软件工程教育的关键组成部分，使学生能够为外部客户开发软件，在 aut...

#research #paper #software
1天前 · software · - · -

[Paper] 让问题具象化：通过 PersonaFlow 增强用户对开源软件开发者的共情

开源软件（OSS）开发者常常难以理解和响应用户情境，而现有工具，如 issue trackers（用于处理 bug，...）

#research #paper #software
1天前 · devops · - · -

[Paper] Incisor：Ex Ante 云实例选择用于 HPC 作业

我们提出了 Incisor，一个用于事前实例选择问题的 cloud HPC 作业提交系统：在具有挑战性但常见的环境中选择合适的硬件……

#research #paper #devops
2天前 · ai · - · -

[Paper] SeaEvo：通过策略空间演化推进算法发现

LLM-guided evolutionary search 已成为自动算法发现的有前景范式，然而大多数系统主要通过 e...

#research #paper #ai #machine-learning #nlp
2天前 · ai · - · -

[论文] 无组合的原始递归：动力学刻画，从神经网络到多项式常微分方程

recurrent neural networks、polynomial ODEs 和 discrete polynomial maps 各自为计算带来了什么，它们缺乏什么？All three operate over the co…

#research #paper #ai #machine-learning
2天前 · devops · - · -

[Paper] 精确、高效且可靠的多目标多约束 IoT 工作流调度在 Edge‑Hub‑Cloud 赛博物理系统中

新兴的 IoT 驱动的 cyber‑physical 应用需要在资源受限的 edge 设备上实现 low‑latency、energy‑efficient 和 reliable 的执行，并且这些设备具有 heterogeneous …

#research #paper #devops
2天前 · ai · - · -

[Paper] 大规模多智能体智能辅导的延迟与成本

多代理 LLM 辅导系统通过代理专门化提升响应质量，但每个学生查询会触发多个并发的 API 调用，其延迟...

#research #paper #ai #machine-learning
2天前 · devops · - · -

[Paper] 展开原子尺度世界：跨越年尺度与米尺度的反应堆压力容器钢原子模拟

对反应堆压力容器（RPV）钢的寿命预测需要在原子尺度退化机制与服役尺度的空间和时间范围之间搭建桥梁，...

#research #paper #devops
2天前 · ai · - · -

[Paper] TACO：用于可扩展张量并行 LLM 训练的中间张量高效通信压缩

在大规模 tensor-parallel 训练中处理通信开销仍然是一个关键挑战，因为中间 t 的稠密、接近零的分布……

#research #paper #ai #machine-learning
2天前 · ai · - · -

[Paper] FreeScale：分布式训练用于序列推荐模型的最小扩展成本

现代工业的 Deep Learning Recommendation Models 通常通过分析序列交互历史来提取用户偏好，随后 …

#research #paper #ai #machine-learning
2天前 · devops · - · -

[论文] KubePACS：使用高性能、高可用且成本高效的 Spot 实例的 Kubernetes 集群

云用户旨在通过为其工作负载选择最合适的实例类型，以最小化成本并最大化性能。为了降低开支，spot instan...

#research #paper #devops
2天前 · ai · - · -

[Paper] FlashOverlap：在分布式 LLM 训练中最小化通信重叠的尾部延迟

大型语言模型规模的快速增长迫使必须将计算工作负载在 GPU、TPU 等加速器之间进行划分，...

#research #paper #ai #machine-learning #computer-vision
2天前 · ai · - · -

[Paper] Kolmogorov‑Arnold 网络通用性的必要且充分条件

我们从它们的边函数角度分析 Kolmogorov‑Arnold Networks (KANs) 的通用逼近性质。如果这些函数全部是仿射的，那么 u...

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] Learn&Drop：基于层丢弃的CNN快速学习

本文提出了一种新方法，以提高深度卷积神经网络的训练效率。在训练过程中，该方法评估分数以衡量……

#research #paper #ai #machine-learning #computer-vision
4天前 · ai · - · -

[Paper] 为什么在 Symbolic Regression 中架构选择很重要

符号回归从数据中发现数学公式。一些方法固定操作符树，分配可学习的权重，并通过梯度下降进行训练。Th...

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 少花钱，拟合更好：通过主动实验选择实现预算高效的 Scaling Law 拟合

Scaling laws 被用于规划 multi-million-dollar training runs，但拟合这些定律本身也可能花费数百万。在现代大规模工作流中，组装一个…

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 针对全球多数民族的LLM生成叙事中的表征伤害

大型语言模型（LLMs）正日益用于从日常使用到高风险企业和政府应用的文本生成任务，包括……

#research #paper #ai #nlp
4天前 · ai · - · -

[Paper] Agentic World Modeling：基础、能力、定律及其之外

随着 AI 系统从生成文本转向通过持续交互实现目标，建模环境动态的能力成为一个核心瓶颈……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 基于松弛感知的神经网络代理模型训练

经过训练的 ReLU 神经网络作为代理模型可以精确嵌入混合整数线性规划（MILP）中，从而实现对所学习模型的全局优化。

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 对计划存在性问题的不可判定性证明

计划存在性问题询问，给定一个以模态逻辑公式形式表示的目标、一个初始认知状态（一个指向的 Kripke 模型），以及一组认知…

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 基于神经网络的从现代数据恢复班图语历史词汇结构

我们调查仅在现代形态数据上训练的神经模型是否能够恢复与历史重建一致的跨语言词汇结构。

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] 零样本形态学发现于低资源班图语的跨语言迁移与无监督聚类

我们提出了一种方法，通过将跨语言迁移学习与无监督聚类相结合，来发现低资源班图语言的形态特征。

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] 长尾互联网照片重建

Internet 照片集合呈现出极度长尾分布：少数著名地标被大量拍摄，且易于在 3D 中重建，而 …

#research #paper #ai #computer-vision

Newer posts

Older posts