Amazon Science

5天前 · ai

使用强化学习定制多轮 AI 代理

利用现有的环境模拟器和基于可验证真实数据的奖励函数，即使在小模型和小规模训练的情况下，也能提升任务成功率。

#reinforcement learning #multiturn agents #AI agents #environment simulators #reward functions #training data efficiency #Amazon Science
1周前 · ai

构建可靠 AI 代理的幕后工作

“Reinforcement learning gyms” 训练 agents 在许多低层任务上，这些任务必须串联起来以执行客户请求……

#reinforcement learning #AI agents #reliability #training pipelines #Amazon Science #RL gyms #machine learning
1个月前 · ai

AI-native 6G：从网络到智能织体

“Network language models” 将协调智能组件、计算基础设施、接入点、数据中心以及更多之间的复杂交互。

#6G #network-language-models #AI-native #Amazon Science