[论文] SAM 引导的语义与运动变化区域挖掘用于遥感变化标题生成
遥感变化描述是一个新兴且受欢迎的研究任务,旨在用自然语言描述已发生变化的感兴趣内容……
3377 posts from this source
遥感变化描述是一个新兴且受欢迎的研究任务,旨在用自然语言描述已发生变化的感兴趣内容……
文本属性图需要模型能够有效地将强大的文本理解与结构化推理相结合。现有方法要么依赖 …
我们引入了 DiverseVAR,一个在测试时提升文本条件视觉自回归模型(VAR)多样性的框架,无需重新训练……
深度神经网络(DNN)和 Kolmogorov‑Arnold 网络(KAN)因其灵活性和表达能力而成为函数逼近的热门方法。然而……
由于对人工智能(AI)推理的需求日益增长,尤其是在高等教育领域,利用现有基础设施的新颖解决方案正在出现……
在标准 Transformer(TF)架构中,刚性且统一的计算分配可能限制其效率和可扩展性,尤其是在大规模……
最近的分而治之推理方法,尤其是基于思路链(Chain-of-Thought,CoT)的方式,显著提升了 Text-to-SQL 的能力……
误信息经常在在线新闻文章下的用户评论中传播,这凸显了需要有效的方法来检测事实错误的信息。
Lindsey(2025)通过四项实验研究语言模型的内省意识,发现模型有时能够检测并识别注入的……
Web 自动化利用智能代理通过模仿人类与网页界面的交互来执行高级任务。尽管最近的 La...
无关信息(即干扰项)如何影响视觉语言模型(VLM)在测试时的尺度扩展?先前对语言模型的研究已经报告了……
‘以图像思考’已成为推进视觉推理的有效范式,通过注入视觉证据,超越仅文本的思考链……
单元测试是一种必不可少但又费时的技术,用于验证软件并降低回归风险。虽然经典的自动化方法能够有效地…
Aspect-Based Sentiment Analysis (ABSA) 已成为从用户生成内容中提取细粒度情感洞察的关键工具,尤其是…
在不同数据集之间自动化适配软件工程(SE)研究制品对于可扩展性和可重复性至关重要,但它仍然是一个庞大的挑战...
处理受污染的数据在异常检测中构成了一个关键挑战,因为传统模型假设在纯粹的正常数据上进行训练。传统方法 mi...
在训练 transformer 模型时,神经网络权重的稳定性至关重要。查询(query)和键(key)权重尤其成问题,因为它们倾向于增长……
时空视频定位(STVG)需要根据自然语言描述,在未剪辑的视频中同时在时间和空间上定位目标对象。
数值模拟为许多物理和现实世界的问题提供了关键洞见。然而,尽管这些模拟是在完整的3D域上求解的,大多数分析……
内镜(endo)视频表现出强烈的视角依赖效应,例如 specularities、wet reflections 和 occlusions。纯 photometric supervision 会导致对齐错误……
估计点的法线需要构建局部补丁以提供中心‑周围的上下文,但确定合适的邻域大小是……
自然灾害仍然是孟加拉国的一大挑战,因此实时监测和快速响应系统至关重要。在本研究中,我们提出了 BanglaMM-...
对抗逆向强化学习(AIRL)已显示出在通过推断密集奖励函数来解决强化学习(RL)中的稀疏奖励问题方面的潜力。
Recent advances in multimodal large language models (LLMs) have highlighted their potential for medical and surgical applications. However, existing surgical da... 近期在多模态大型语言模型(LLMs)方面的进展凸显了它们在医学和外科应用中的潜力。然而,现有的外科数据……
本文提出了 SIFT‑SNN 框架,这是一种低延迟神经形态信号处理管道,用于实时检测运输中的结构异常。
我们首次系统性地研究了Martin定律——词频与多义性之间的经验关系——在神经语言生成的文本中……
https://arxiv.org/abs/2305.12345 学习跨多模态的联合表示仍然是多模态机器学习中的核心挑战。当前的主流方法主要依赖于...(此处省略其余内容的中文翻译)
Millions of users across the globe turn to AI chatbots for their creative needs, inviting widespread interest in understanding how such chatbots represent diver... 全球数百万用户在创意需求上转向 AI 聊天机器人,这引发了人们对这些聊天机器人如何呈现多样化内容的广泛兴趣……
基于波导的物理系统为实现超越传统电子学的高能效模拟计算提供了有前景的途径。在这种背景下,acou...
尽管大型语言模型(LLMs)在许多任务上取得了最先进的性能,但它们的庞大规模往往导致高计算成本和环境…
本文介绍了首个开放式会话语音数据集(open conversational speech dataset)的开发,该数据集针对伊桑语(Isan language),这是泰国使用最广的地区方言。
关于大型语言模型(LLMs)是否能够作为人类参与者在调查和实验研究中的替代品,仍存在持续的争论。虽然…
推理模型在复杂推理任务中展示了卓越的能力。然而,确保它们在面对对抗性 jailbreak 提示时的安全性仍然是一个挑战……
AI 辅助工具帮助开发者执行认知负荷较高的任务,例如 bug detection 和代码可读性评估。尽管取得了进展,i...
现有的提示学习方法基于 CLIP 模型,利用文本 token 作为锚点来引导可学习的软 token。这种引导能够提升……
Spiking neural networks (SNNs) have emerged as prominent candidates for embedded and edge AI. Their inherent low power consumption makes them far more efficient... 脉冲神经网络(SNN)已成为嵌入式和边缘 AI 的重要候选者。它们固有的低功耗使其效率大幅提升……
虽然对 mobile app 的演进已被广泛研究,但对 app 行为的地理差异仍基本未被探索。本文呈现了一项 large-scale study o...
大型语言模型(LLMs)正日益被用作评估者,以取代人工。虽然具有可扩展性,但它们的判断因特异性不完善和 s...
大型语言模型(LLMs)在通用领域展示了卓越的能力,但它们在抵押贷款金融等专业领域的应用仍面临挑战……
本文调查了用于低资源缅甸语的自动语音识别(ASR)错误纠正的序列到序列 Transformer 模型,重点在于 dif...
大型语言模型在受控文本生成过程中必须满足严格的正字法约束,但系统性的跨架构评估仍然有限……
在像缅甸语这样的低资源语言中,分类任务通常只微调最终的分类层,保持预训练编码器的权重冻结。Wh...
尽管神经网络方法最近取得了进展,检测讽刺仍然是自然语言处理(NLP)领域的一项具有挑战性的任务。目前,...
Zipf 定律在语言中的起源尚未确定,跨学科领域对此存在争议。本研究通过几何机制解释了 Zipf 类行为,而无需语言学的……
离线数据选择和在线自我精炼生成能够提升数据质量,是将大语言模型(LLMs)适配到特定…的关键步骤。
Can in-context learning (ICL) override pre-trained label semantics, or does it merely refine an existing semantic backbone? We address this question by treating... **翻译:** 上下文学习(ICL)能够覆盖预训练标签语义,还是仅仅对已有的语义骨干进行细化?我们通过将……来探讨这个问题。
在大规模代码语料库上进行预训练或微调的大型语言模型(LLMs)已在代码补全任务中展示出强大的性能。然而,它们的…
如今,在现代高速互连网络中,避免在集群通信(例如 Data Centers 和 High Performance Computing)期间进行 system calls……