ai — Page 49 | EUNO.NEWS

2周前 · ai

计算机视觉服务：使用 Oodles 构建智能视觉系统

图像和视频包含海量数据——但要从中提取有意义的洞察需要先进的 AI 系统。Computer Vision Services https://www...

#computer vision #deep learning #AI #image analytics #object detection #OCR #neural networks #visual data
2周前 · it

‘College dropout’ 已成为最受追捧的创业创始人资历

AI 创始人越来越多地在 YC 推介中将自己的“dropout”身份作为一种资历……

#startup #founder #dropout #YCombinator #AI #venture-capital #entrepreneurship
2周前 · it

开源 Qwen-Image-2512 推出，竞争谷歌的 Nano Banana Pro 高质量 AI 图像生成

当谷歌在十一月发布其最新的 AI 图像模型 Nano Banana Pro（又名 Gemini 3 Pro Image）时，它重置了整个领域的期望。首次…

#it #startups #ai
2周前 · ai

[Paper] SpaceTimePilot: 生成式渲染跨时空的动态场景

我们提出了 SpaceTimePilot，一种视频扩散模型，能够将空间和时间解耦，以实现可控生成渲染。给定单目视频，SpaceTimePil...

#research #paper #ai #machine-learning #computer-vision
2周前 · ai

[Paper] GaMO：几何感知多视角 Diffusion Outpainting 用于稀疏视角 3D 重建

最近在3D重建方面的进展在从密集多视图图像捕获高质量场景方面取得了显著进展，但在输入视角…

#research #paper #ai #computer-vision
2周前 · ai

[Paper] 协同类人机器人操作与选择策略

类人机器人在以人为中心的环境中具有巨大的潜力，但实现头部、手部和腿部的稳健全身协同仍然是一个挑战……

#research #paper #ai #machine-learning
2周前 · ai

[Paper] Edit3r：从稀疏未配准图像的即时3D场景编辑

我们提出 Edit3r，一个前馈框架，能够在一次传递中从未配准、视角不一致、经过指令编辑的图像中重建并编辑 3D 场景。U...

#research #paper #ai #computer-vision
2周前 · ai

[论文] 扩展 Open-Ended Reasoning 以预测未来

High-stakes decision making 涉及对未来不确定性的推理。在本工作中，我们训练 language models 对 open-ended 进行预测……

#research #paper #ai #machine-learning #nlp
2周前 · ai

[Paper] FineTec：在时间扰动下通过骨架分解和序列补全进行细粒度动作识别

从 temporally corrupted skeleton sequences 中识别 fine-grained actions 仍然是一个重大挑战，尤其是在 online 的真实场景中……

#research #paper #ai #computer-vision
2周前 · ai

[Paper] 从 Inpainting 到 Editing：自举框架用于情境丰富的视觉配音

音频驱动的视觉配音旨在将视频的唇部动作与新的语音同步，但由于缺乏理想的训练数据，根本上面临挑战：pai...

#research #paper #ai #computer-vision
2周前 · ai

[Paper] Vulcan：实例最优系统启发式通过 LLM 驱动搜索

现代操作系统和分布式系统中的资源管理任务仍主要依赖于手工设计的 heuristics，用于 scheduling、caching 等任务。

#research #paper #ai #machine-learning
2周前 · ai

[论文] 多个思维源自单一模型：贝叶斯Transformer用于群体智能

尽管规模庞大且取得了成功，现代 transformers 几乎普遍被训练为单一目标的系统：优化产生一组确定性的参数……

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts