ai — 页 18 | EUNO.NEWS

排序:

3周前 · ai · - · -

[Paper] Parcae：稳定循环语言模型的尺度定律

传统的固定深度架构通过增加训练 FLOPs 来提升质量，通常通过增加参数化（parameterization），但代价是更高的内存……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[论文] MoshiRAG：异步知识检索用于全双工语音语言模型

Speech-to-speech language models 最近出现，以提升对话式 AI 的自然度。特别是，full-duplex models 通过 t...

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] MetFuse：隐喻与转喻之间的形象融合

Metonymy 和 metaphor 常常在自然语言中共现，但计算工作大多是孤立地研究它们。我们提出了一个将……转化的框架。

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] CoDe-R：使用 LLMs 通过 Rationale Guidance 与 Adaptive Inference 精炼 Decompiler 输出

二进制反编译是一项关键的逆向工程任务，旨在从已剥离的可执行文件中重建高级源代码。虽然 Large Language Model...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 往返翻译揭示前沿多语言基准的盲点

多语言基准指导前沿模型的开发。然而，前沿模型报告的多语言评估结构类似于流行的...

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] Neural Cellular Automata 中吸引子的稳定性与几何

在关于神经元细胞自动机（NCAs）的文献中，通常理所当然地认为这些系统会学习吸引子。这一点通过演化 th...

#research #paper #ai
3周前 · ai · - · -

问答：MIT SHASS 与 AI 时代的教育未来

MIT 人文、艺术与社会科学学院（SHASS）于 1950 年成立（https://shass.mit.edu/about-the-school/shass-timeline/），以响应“一个新的 …”。

#ai #ai-research #academia
3周前 · ai · - · -

[Paper] 超越输出正确性：对大语言模型在编码任务中的推理进行基准测试与评估

大型语言模型（LLMs）越来越依赖显式推理来解决编码任务，但评估此类推理的质量仍然具有挑战性。Ex...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] GeM-EA：生成式和元学习增强的进化算法用于流式数据驱动优化

流式数据驱动优化（SDDO）问题在许多应用中出现，这些应用中数据持续到达，且优化环境随时间演变……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Vibe Coding 是未来吗？对 LLM 生成代码在建筑安全中的实证评估

vibe coding 的出现，这是一种范式，非技术用户通过自然语言指示大型语言模型（LLMs）生成可执行代码，预…

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Local-Splitter：七种降低云端 LLM Token 使用的策略在 Coding-Agent 工作负载中的测量研究

我们系统性地测量了七种策略，以在小型本地模型可以作为前置分流层的情况下，减少云端 LLM 的 token 使用量。

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] CodeSpecBench：对LLMs进行可执行行为规范生成的基准测试

大型语言模型（LLMs）可以根据自然语言生成代码，但它们在多大程度上捕捉到预期的程序行为仍不清楚。Executable...

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] 去中心化学习通过带跳跃的随机游走

我们研究在网络上进行去中心化学习的情形，其中数据分布在各节点上，没有中心协调者。Random walk learning 是一种基于 token 的方法……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Socrates Loss: 通过利用未知统一置信度校准与分类

深度神经网络尽管具有很高的准确率，但往往表现出置信度校准不足，限制了它们在高风险应用中的可靠性。当前的…

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] EMBER：基于混合 LLM 架构的学习型 Spiking Neural Network 动力学实现自主认知行为

我们提出 (Experience‑Modulated Biologically‑inspired Emergent Reasoning)，一种混合认知架构，重新组织大型语言模型之间的关系……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[论文] AI 能检测生命吗？来自人工生命的启示

现代机器学习方法已被提出用于检测外星样本中的生命，利用其区分生物性与非生物性样本的能力。

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 谁处理方向？特征匹配中的不变性研究

在3D计算机视觉中，寻找图像之间的匹配关键点是一个核心问题。然而，现代匹配器在处理大幅平面旋转时表现不佳。A straightfo...

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 基于物理的状态空间模型用于离网系统的可靠太阳辐照预测

自主离网光伏系统的稳定运行要求依赖遵循大气热力学的太阳能预测算法。Cont...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] OmniShow：统一多模态条件以实现人-物体交互视频生成

在本工作中，我们研究了人-物交互视频生成（Human-Object Interaction Video Generation，HOIVG），其目标是基于 t 合成高质量的人-物交互视频。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 心理概念神经元：神经控制偏差探测与迁移生成能在LLM中实现吗？

利用诸如大五人格等心理构念，大语言模型（LLMs）可以模仿特定的个性特征并预测用户的个性。Wh...

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] SyncFix：通过多视图同步修复 3D 重建

我们提出了 SyncFix，一个在基于扩散的重建场景细化过程中强制跨视图一致性的框架。SyncFix 将细化……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] ClawGuard：针对间接提示注入的工具增强型 LLM 代理运行时安全框架

Tool-augmented Large Language Model (LLM) agents 已经展示了在自动化复杂、多步骤真实世界任务方面的惊人能力，但仍然存在脆弱性……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] HDR 视频生成通过潜在对齐与对数编码

High dynamic range (HDR) 图像提供了对场景辐射的丰富且忠实的表示，但由于其不匹配……，对 generative models 仍然具有挑战性。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] LMMs 与对象中心视觉的结合：理解、分割、编辑与生成

大型多模态模型（LMMs）在通用视觉-语言理解方面取得了显著进展，然而，它们在需要 p... 的任务上仍然受限。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] GenTac：生成建模与足球战术预测

对 open-play soccer tactics 的建模是一项艰巨的挑战，因为比赛具有 stochastic、multi-agent 的特性。现有的计算方法通常 p...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] HistLens：跨概念和语料库的思想变化映射

语言变化既反映又塑造社会过程，而基础概念的语义演变提供了历史和社会的可衡量痕迹。

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] 高斯分布之间的 KL Divergence：变分自编码器目标的逐步推导

Kullback-Leibler (KL) divergence 是信息论中的一个基本概念，用于量化两个概率分布之间的差异。在 the co...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 随机矩阵和确定性矩阵上一阶方法的普适性

通用一阶方法（GFOM）是一类灵活的迭代算法，通过矩阵‑向量乘法和逐元素非线性操作来更新状态向量。

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Winner-Take-All 脉冲 Transformer 用于语言建模

Spiking Transformers 将 Transformers 的可扩展性与 Spiking Neural Networks (SNNs) 的稀疏、节能特性相结合，已实现……

#research #paper #ai
3周前 · ai · - · -

[Paper] Record-Remix-Replay：使用进化搜索的层次化 GPU 内核优化

随着高性能计算和 AI 工作负载日益依赖 GPU，保持在快速演进的硬件代际中的高性能……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] NimbusGuard：一种使用Deep Q网络的主动Kubernetes自动伸缩新框架

云原生架构是关于构建和运行可扩展的微服务应用，以充分利用云环境。托管的 Kubernetes …

#research #paper #ai #machine-learning
3周前 · ai · - · -

神经科学家的 AI 驱动初创公司旨在通过完美、无限的记忆改变人类认知

背景：受哈佛训练的神经科学家、前哈佛医学院教授 Gideon Kreiman 正在领导一家初创公司，旨在为人类提供“完美且……”。

#AI #neuroscience #memory augmentation #large memory models #cognitive enhancement #startup #human cognition #engramme
3周前 · ai · - · -

在 HumanX 会议上，大家都在谈论 Claude

本周在旧金山举办的 HumanX AI 大会上，成千上万的科技专业人士聚集在 Moscone Center，讨论 agentic AI 正在如何重塑 bu...

#Claude #Anthropic #agentic AI #AI chatbots #HumanX conference #enterprise AI #AI agents
3周前 · ai · - · -

构建一个从人工编辑中学习的 AI 聊天机器人（不仅仅是反馈）

问题：Intelligence ≠ Empathy 现代 AI 在海量数据集上进行训练，并通过诸如 reinforcement learning from human feedback 等技术进行精炼。Mo...

#chatbot #reinforcement learning #human feedback #AI training #natural language processing #machine learning
3周前 · ai · - · -

精准定价：AI 如何自动化您的handyman报价

厌倦了花费数小时手动测量照片、查找材料价格并计算报价吗？对于handyman业务来说，这类后台工作是一个主要的痛点……

#AI automation #price quoting #handyman services #computer vision #business logic #cost estimation #machine learning
3周前 · ai · - · -

开发者指南：构建具备技能的 ADK 代理

Agent Development Kit ADK SkillToolset 引入了一种 “progressive disclosure” 架构，使 AI 代理能够按需加载领域专长，从而降低……

#agent development #ADK #skill toolset #progressive disclosure #LLM token optimization #modular AI agents #agentskills.io
3周前 · ai · - · -

提升训练 Goodput：持续检查点如何在 Orbax 和 MaxText 中优化可靠性

Orbax 和 MaxText 中新引入的 continuous checkpointing 功能旨在优化模型训练过程中的可靠性与性能之间的平衡。

#continuous checkpointing #Orbax #MaxText #model training reliability #I/O optimization #large‑scale training #MTBF #checkpointing strategies
3周前 · ai · - · -

理解 Transformers 第5部分：查询、键与相似度

在上一篇文章 https://dev.to/rijultp/understanding-transformers-part-4-introduction-to-self-attention-45bg 中，我们探讨了 self‑attention 概念用于 t...

#transformers #self-attention #queries-keys-values #similarity #deep learning #natural language processing #machine learning
3周前 · ai · - · -

‘Claude Mythos’幻象：创新还是数据收割？

安全借口：Mythos 营销活动的核心是其“zero‑trust”安全架构。Anthropic 坚称该模型的设计旨在 opera...

#Anthropic #Claude Mythos #large language model #AI security #data privacy #LLM access restrictions
3周前 · ai · - · -

图像分类详解——为什么 k-NN 会失效以及线性分类器的重要性

图像分类听起来很容易，直到你记得计算机从不直接看到“对象”。它只看到像素数组。本文解释了这为何使得 k‑NN 成为一种…

#image classification #k-NN #linear classifiers #computer vision #machine learning #deep learning
3周前 · ai · - · -

多层感知器（MLP）：理解神经网络的实用方法

MLP = 一个函数而不是层大多数人认为神经网络是层的堆叠，但他们错了。一个 MLP 是：y = f(x); θ 👉 一个可学习的函数。从简单开始……

#multilayer perceptron #MLP #neural networks #deep learning #machine learning #activation function #nonlinearity
3周前 · ai · - · -

OverthinkAI — 我构建了一个无法回答任何问题的AI

概述：每次我向ChatGPT询问一些简单的问题时，它都会给出干净、直接且自信的答案。我觉得这非常可疑。真正的思考并不是这样……

#AI chatbot #Gemini API #overthinking AI #SaaS #philosophical responses #prompt engineering
3周前 · ai · - · -

优化与正则化——模型如何学习（以及训练为何失败）

真正的问题：低 training loss ≠ 好 model。真正的目标：generalization。Optimization = Learning。Optimization 通过更新 parameters 来降低 loss。没有…

#optimization #regularization #machine learning #gradient descent #model training #debugging #generalization
3周前 · ai · - · -

你的关于 AI 的文章不需要 AI 艺术

《The New Yorker》对 OpenAI CEO Sam Altman 的人物特写的插图是一种惊吓效果。Altman 身穿蓝色毛衣，表情空白。围绕在他头部的……

#AI-generated art #OpenAI #Sam Altman #generative art #illustration
3周前 · ai · - · -

构建 Igris：打造我的个人 AI 代理与 Knowledge Codex

封面图片：Building Igris：打造我的个人 AI Agent 与 Knowledge Codex https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto...

#personal AI agent #knowledge codex #large language model #LLM #chatbot #AI shadow #developer tools #knowledge management
3周前 · ai · - · -

AI模型在足球投注方面表现糟糕——尤其是xAI Grok

“我们评估的每个 frontier model 在整个 season 都亏损，且许多出现了 ruin，” 论文作者如此总结，并指出 AI “systematically underp...”

#AI models #sports betting #soccer predictions #model performance #ROI #Claude #GPT-5 #Gemini #xAI Grok #financial impact
3周前 · ai · - · -

ChatGPT 推出全新 $100 Pro 订阅以挑战 Claude

!https://www.bleepstatic.com/content/hl-images/2023/03/24/ChatGPT-logo.jpg OpenAI 已推出一项新的 Pro 订阅，费用为 100 美元，匹配 Anthropic 的 Claude…

#ChatGPT #OpenAI #Pro subscription #pricing #Claude #Anthropic #AI services
3周前 · ai · - · -

通过 agent skills 弥合知识差距

大型语言模型（LLMs）拥有固定的知识，因为它们是在特定时间点进行训练的。软件工程实践节奏快且经常变化，伴随……

#large language models #agent skills #knowledge gap #software engineering #Google DeepMind #Gemini API #AI tools #SDK updates

Newer posts

Older posts