ai — 页 2 | EUNO.NEWS

排序:

3天前 · ai · - · -

[Paper] GMGaze：基于 MoE 的上下文感知凝视估计，使用 CLIP 与 Multiscale Transformer

凝视估计方法通常使用面部外观来预测人的凝视方向。然而，先前的研究显示了三个主要挑战……

#research #paper #ai #computer-vision
3天前 · ai · - · -

[Paper] RunAgent：解释自然语言计划的约束引导执行

人类通过执行有针对性的计划来解决问题，但大型语言模型（LLMs）在结构化工作流执行方面仍然不可靠。我们提出 RunAgent，一个 …

#research #paper #ai #machine-learning #nlp
3天前 · ai · - · -

[Paper] 当 RAG Chatbots 暴露其后端时：面向患者的医疗 AI 隐私和安全风险的匿名案例研究

背景：面向患者的医学聊天机器人基于检索增强生成（retrieval-augmented generation，RAG），正日益被推广，以提供可获取、基于事实的健康信息……

#research #paper #ai #machine-learning #nlp
3天前 · ai · - · -

[Paper] 实际临床低剂量肝CT的无监督去噪与感知注意网络

随着深度学习的发展，医学图像处理已被广泛用于辅助临床研究。本文聚焦于去噪问题……

#research #paper #ai #machine-learning #computer-vision
3天前 · ai · - · -

[论文] 让你的 LVLM KV 缓存更轻量化

Key-Value (KV) 缓存已成为现代大型视觉语言模型（LVLMs）在推理时的事实标准组件。虽然它提升了大规模解码的效率……

#research #paper #ai #machine-learning #computer-vision
3天前 · ai · - · -

TCS 黑客马拉松冠军 2026 🏆

!Ansh Guptahttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fu...

#hackathon #AI #cybersecurity #TCS #student achievement #MPIT #2026
3天前 · ai · - · -

[Paper] SAVGO: 基于余弦相似度学习状态-动作价值几何用于连续控制

虽然表征学习和相似性学习已经提升了强化学习（RL）的样本效率，但它们很少用于塑造策略更新 di...

#research #paper #ai #machine-learning
3天前 · ai · - · -

[论文] GeoContra：从流畅的 GIS 代码到可验证的空间分析与基于地理的修复

在 GIScience 中，可靠的空间分析需要保持坐标语义、拓扑、单位以及地理合理性。当前基于 LLM 的 GIS 系统生成……

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] Map2World：基于分割地图的文本到3D世界生成

3D world generation 对于沉浸式内容创作或自动驾驶仿真等应用至关重要。最近在3D world generation 方面的进展已经……

#research #paper #ai #computer-vision
3天前 · ai · - · -

[Paper] 可观察的表现并未完全反映系统组织：咬合约束下步态动力学的多层次分析

在生物力学系统中，可观察的性能常被用作底层系统组织的代理。然而，这一假设隐含地假设了一个对应……

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] LASE：语言对抗式说话人编码用于印地语跨脚本身份保持

用于多语言语音克隆的speaker encoder应当对同一说话人保持一致的处理，无论音频使用哪种script。Off-the-shelf…

#research #paper #ai #nlp
3天前 · ai · - · -

[Paper] 定向社会关注：在在线媒体中呈现针对性倡导、反对、援助、伤害与受害

在线平台、影响行动和政治话语中的语言常常引导一种混合的亲社会情感（例如，倡导、乐于助人、合作……）。

#research #paper #ai #machine-learning #nlp
3天前 · ai · - · -

[Paper] 使用人类凝视建模主观城市感知

城市感知描述了人们如何主观评估城市环境，塑造了人们对城市的体验和理解。现有的计算方法……

#research #paper #ai #computer-vision
3天前 · ai · - · -

[Paper] 预算约束组合多臂赌博机中的功绩公平：通过Shapley值

我们提出了一个用于在预算约束组合多臂老虎机（budgeted combinatorial multi-armed bandits）中实现 meritocratic fairness 的新框架，采用 full-bandit feedback（BCMAB-FBF）。不同于 semi-bandit ...

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] 使用 DeepONet 学习 Helmholtz 方程算子用于非参数二维几何

本文研究在非参数域上求解二维 Helmholtz 方程，利用基于 DeepONet 的物理信息神经算子网络。

#research #paper #ai #machine-learning
3天前 · ai · - · -

我的 AI 与 Fashion MNIST 之旅

封面图片：我的 AI 与 Fashion MNIST 之旅 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fde...

#TensorFlow #Keras #Fashion-MNIST #image classification #neural networks #deep learning #computer vision
3天前 · ai · - · -

[Paper] Themis：训练稳健的多语言代码奖励模型以实现灵活的多准则评分

Reward models (RMs) 已成为语言模型 (LM) 后训练工作手册中不可或缺的组成部分，使得策略对齐和测试时扩展成为可能。Res...

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] NonZero：面向多智能体蒙特卡罗树搜索的交互引导探索

Monte Carlo Tree Search（MCTS）在合作多智能体领域的扩展性很差，因为在展开时必须考虑指数级庞大的联合动作集合，……

#research #paper #ai #machine-learning
3天前 · ai · - · -

OpenAI 解释了 ChatGPT 为什么突然喜欢哥布林

背景：OpenAI CEO Sam Altman 目前卷入了一场法庭戏剧 https://mashable.com/article/musk-openai-trial-testimony，但工程师们支持……

#OpenAI #ChatGPT #GPT-5.1 #model behavior #LLM quirks #AI research report #goblins phenomenon
3天前 · ai · - · -

我的 LLM 助手的新流行语是以“be completely candid”开头回复。非常刺耳。

您确定要隐藏此评论吗？它将在您的帖子中被隐藏，但仍可通过评论的 permalink 查看....

#LLM #AI assistants #prompt engineering #user experience #chatbot
3天前 · ai · - · -

[Paper] 基于量子梯度的边缘与角点检测方法（使用 Sobel 核）

Edge detection 指的是在 digital image 中识别强度急剧变化的点，这些点表明 object boundaries 或 structural features。Corners 是…

#research #paper #ai #computer-vision
3天前 · ai · - · -

[Paper] 立场：agentic AI orchestration 应该是 Bayes-consistent

LLMs 在预测任务和复杂推理任务方面表现出色，但许多高价值部署依赖于不确定性下的决策，例如，选择调用哪个工具……

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] 调用还是不调用：评估与优化 LLM Tool Calling 的框架

Agentic AI 架构通过外部工具增强 LLM，释放出强大的能力。然而，工具使用并不总是有益的；有些调用可能是冗余的……

#research #paper #ai #machine-learning
3天前 · ai · - · -

使用 Gemini Embedding 2 构建：Agentic 多模态 RAG 与更进一步

Google 已宣布 Gemini Embedding 2 正式面向公众提供，这是一种统一模型，可将文本、图像、视频、音频和文档映射到单一语义……

#Gemini Embedding 2 #multimodal embeddings #agentic RAG #visual search #content moderation #Google AI #semantic space #Matryoshka dimensionality reduction #multilingual AI
3天前 · ai · - · -

[Paper] FinSafetyBench：评估 LLM 在真实金融场景中的安全性

大型语言模型（LLMs）正日益应用于金融场景。然而，它们可能产生有害输出，包括促成非法活动……

#research #paper #ai #nlp
3天前 · ai · - · -

[Paper] 学习记忆的方式与内容：认知启发的两阶段优化用于进化记忆

大型语言模型（LLM）代理需要长期用户记忆以实现一致的个性化，但受限的上下文窗口阻碍了对不断变化偏好的跟踪。

#research #paper #ai #nlp
3天前 · ai · - · -

[Paper] 学习行动与协作用于分布式黑盒共识优化

Distributed blackbox consensus optimization 是多智能体系统中的一个基础问题，其中智能体必须仅使用局部目标来改进全局目标……

#research #paper #ai
3天前 · ai · - · -

[论文] 脉冲序列机器与 Transformer

序列学习归结为在 temporally indexed representation space 上进行 similarity-based retrieval，这是一种对任何序列模型的约束，而不是模型的属性……

#research #paper #ai #machine-learning
3天前 · ai · - · -

你的 AI 代理发送的 API 调用是你想象的 10 倍——成本隐藏在这里

没人预算的隐藏乘数当我们在2026年初从单轮聊天机器人转向代理式工作流时，首先出现问题的不是代码……

#LLM cost #API usage #agentic workflows #budgeting #GPT-5 #Claude Opus #multi‑turn agents #pricing
3天前 · ai · - · -

[Paper] Tempus：一种时间可伸缩、资源不变的GEMM流式框架，适用于Versal AI Edge

Large Language Models (LLMs) 的尺度定律表明，模型质量随计算规模的提升而提升，但边缘部署对 …… 施加了严格的约束。

#research #paper #ai #machine-learning
3天前 · ai · - · -

[论文] SAGA：用于 GPU 集群上 AI 代理推理的工作流原子调度

AI 代理在每个任务中执行数十到数百次链式 LLM 调用，但 GPU 调度器将每次调用视为独立的，丢弃了数 GB 的中间状态……

#research #paper #ai #machine-learning
3天前 · ai · - · -

为什么 AI 代理需要防火墙：Suprawall 介绍

AI 代理正逐步进入生产环境。但谁在为它们提供安全保障？问题：未受保护的 AI 代理。当 AI 代理出现错误时，后果会非常严重：- Prompt 注入…

#AI agents #security #firewall #Suprawall #prompt injection #PII leakage #LangChain #CrewAI #compliance
3天前 · ai · - · -

[Paper] 空间专家网络：架构与专家放置

利用高效的连续太阳能采集，空间数据中心被设想为执行能源密集型大型任务的有前景平台。

#research #paper #ai #machine-learning
3天前 · ai · - · -

没有任何 AI 模型能够端到端完成创意项目。HCB 刚刚证明了这一点。

没有任何 AI 模型能够端到端完成创意项目。HCB 刚刚证明了这一点。副标题：Contra Labs 在 5 个创意领域中使用 93 条 prompts 对 15 个 AI 模型进行测试……

#creative AI #model comparison #human creativity benchmark #AI workflow #multi‑model pipelines
3天前 · ai · - · -

[Paper] 通过需求感知课程强化学习提升 LLM 代码生成

代码生成旨在根据给定的编程需求自动生成源代码，具有显著提升软件开发的潜力……

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] 技能作为可验证的人工制品：信任模式与双条件正确性准则用于 Human-in-the-Loop Agent Runtimes

Agent skills——结构化的指令、脚本和参考资料包，能够在不修改模型本身的情况下增强大型语言模型（LLM）——...

#research #paper #ai #machine-learning
3天前 · ai · - · -

[Paper] 可扩展学习：在结构化循环脉冲神经网络中无需反向传播

Spiking Neural Networks (SNNs) 为实现节能且基于生物学原理的计算提供了有前景的框架；然而，在深度递归…

#research #paper #ai #machine-learning
3天前 · ai · - · -

Beacon Biosignals 正在映射睡眠期间的大脑

人类大脑仍然是医学中最令人着迷且最令人困惑的谜团之一。科学家仍在努力将神经活动与大脑功能匹配……

#EEG #sleep monitoring #machine learning #brain mapping #healthtech #neurotechnology #clinical trials #Beacon Biosignals
3天前 · ai · - · -

通过语言提升理解

当她还是个孩子时，MIT 四年级学生 Olivia Honeycutt 会在阿拉巴马州伯明翰郊外的祖父母的农场度过夏天。实用的和文化的……

#ai #ai-research #academia
3天前 · ai · - · -

[Paper] 核 Hopfield 网络中吸引子边界的几何分析及存储容量极限

基于核逻辑回归（KLR）的高容量关联记忆表现出强大的存储能力，但其动力学和几何机制仍未被完全阐明。

#research #paper #ai #machine-learning
3天前 · ai · - · -

ChatGPT Images 2.0 在印度大受欢迎，但在其他地区尚未成为大赢家

自上周推出以来，印度已成为 ChatGPT Images 2.0 的最大用户群体。 https://techcrunch.com/2026/04/21/chatgpts-new-images-2-0-model-is-s...

#ChatGPT #Images 2.0 #OpenAI #image generation #multilingual text #AI adoption #India market #avatar creation
4天前 · ai · - · -

子代理已在 Gemini CLI 中推出

2026年4月15日子代理概览子代理允许 Gemini CLI 将复杂、重复或高频任务委派给专门的专家代理。Each s...

#Gemini CLI #subagents #AI agents #Google AI #tool orchestration #prompt engineering #context window
4天前 · ai · - · -

[Paper] Token Arena：统一能量与认知的连续基准用于 AI 推理

公共推理基准在模型和提供商层面对 AI 系统进行比较，但实际做出部署决策的单位是端点：th...

#research #paper #ai #machine-learning
4天前 · ai · - · -

AI会让民意调查更准确吗？

约翰·劳伦森 – 商业记者，巴黎

#AI #opinion polls #sentiment analysis #survey automation #political polling #natural language processing
4天前 · ai · - · -

使用 Gemini Embedding 2 构建：Agentic 多模态 RAG 与更进一步

关键亮点：Google 已宣布 Gemini Embedding 2 正式全面可用，这是一种统一模型，可将文本、图像、视频、音频和文档映射到……

#Gemini Embedding 2 #multimodal AI #semantic embeddings #agentic RAG #visual search #content moderation #multilingual models #Google AI #machine learning
4天前 · ai · - · -

OpenAI 解释了 ChatGPT 为什么曾一度痴迷于地精

!https://www.androidauthority.com/wp-content/uploads/2025/06/chatgpt-reminders-scaled.jpg TL;DR - ChatGPT 最近异常频繁地提到 goblins…

#OpenAI #ChatGPT #GPT-5.5 #system prompt #training quirk #language model behavior #AI personality modes #goblins
4天前 · ai · - · -

【论文】 HERMES++：面向统一的驾驶世界模型用于3D场景理解与生成

驾驶 world models 作为自动驾驶的关键技术，通过模拟环境动态来实现。然而，现有方法主要侧重于……

#research #paper #ai #computer-vision
4天前 · ai · - · -

[Paper] OmniRobotHome：用于实时 Multiadic 人机交互的多摄像头平台

Human-robot collaboration 主要在 dyadic 或 sequential 场景中进行研究。然而，真实的家庭需要 multiadic 协作，其中多个 human……

#research #paper #ai #computer-vision

Newer posts

Older posts