[Paper] 语义分块与自然语言的熵
印刷英文的熵率被广泛估计约为每字符一比特,这一基准是现代大型语言模型(LLMs)仅仅……
3122 posts from this source
印刷英文的熵率被广泛估计约为每字符一比特,这一基准是现代大型语言模型(LLMs)仅仅……
Video Language Models (VideoLMs) 使 AI 系统能够理解视频中的 temporal dynamics。为了适应最大 context window 限制,当前的方法……
在视频生成中实现有效且可推广的控制仍然是一个重大挑战。虽然许多方法依赖于模糊或特定任务的信号,但我们认为……
有效的水资源管理取决于对水道流量的准确预测。对于投射的气候数据,使用不同的General Circulation…
OMD 及其变体为 OCO 提供了一个灵活的框架,其中性能关键取决于镜像映射(mirror map)的选择。虽然其背后的几何结构 …
验证一种临床可获取的方法,利用单目摄像头和人工智能对上肢可达工作空间 (UERW) 进行量化。
偏微分方程常常包含难以或无法直接测量的未知函数,这阻碍了我们进行预测的能力……
长序列流式3D重建仍然是一个重要的未解决挑战。现有的autoregressive模型在处理长序列时常常失败。它们 t...
软件源代码经常包含“热点”:代码中那些变化频率远高于项目其余部分的小片段,从而集中维护……
随着面部识别(FR)系统的进步,隐私保护面部识别(PPFR)系统因其准确的识别而受到广泛关注,...
本文提出了一种混合障碍规避架构,将在间隙下的Optimal Control与模糊规则系统(FRBS)相结合,以实现 ada...
快速演变的网络攻击要求事件响应系统能够自主学习并适应不断变化的威胁。先前的工作已经广泛探讨了……
近年来,人们对使用神经网络,特别是消息传递神经网络(MPNNs),来求解困难的组合优化问题的兴趣日益增长。
大型语言模型(LLM)unlearning 旨在从已训练的模型中移除特定知识,但实际部署往往需要后训练量化……
语言识别(LID)是从网络数据构建高质量多语言数据集的关键步骤。现有的 LID 工具(如 OpenLID 或 GlotLID)……
Template-free retrosynthesis 方法将任务视为 black-box 序列生成,限制了学习效率,而 semi-template 方法依赖于刚性的……
假设式论证(Assumption-based Argumentation,ABA)是一种成熟的结构化论证形式。基于底层原子语言的ABA框架被广泛研究……
二进制神经网络(BNNs)通过约束其权重,提供了一种低复杂度、节能的替代方案,以取代传统的全精度神经网络。
活语言受到大量相互冲突的内部和外部进化压力的塑造。虽然其中一些压力在所有语言中都是普遍的……
大型语言模型(LLMs)正日益被用作评判者,以取代在成对评估中昂贵的人类偏好标签。尽管它们很实用,LLM j...
近年来,人们对理解神经架构学习执行离散算法的能力日益感兴趣,这一方向的工作常常……
使用 NLP 分析真实的学习者语言有助于构建自动化评估和反馈工具。它还提供了对发展全新且广泛的洞见。
检测图像和视频中的异常是多个现实问题的关键任务,包括工业检测、计算机辅助诊断等。
真正的草根行动主义与自动化影响行动之间的界限正在消失。虽然政策辩论聚焦于 bot farms,但还有一种截然不同的威胁……