· ai
[Paper] Chronicals:一种高性能框架,用于 LLM 微调,相比 Unsloth 提升 3.51 倍
大语言模型微调受内存瓶颈限制:一个 7B 参数模型需要 84GB——14GB 用于权重,14GB 用于梯度,56GB 用于 FP32 优化……
大语言模型微调受内存瓶颈限制:一个 7B 参数模型需要 84GB——14GB 用于权重,14GB 用于梯度,56GB 用于 FP32 优化……
我们研究量子软件工程(QSE)生态系统的现状,重点关注学术界和工业界的成就、活动和参与。
Oblivious 负载均衡在网络中涉及使用预定路径将流量从源路由到目的地,且该路径独立于流量,以便……
人工智能通过在海量数据集上使用数千个 GPU 或 TPU 训练的大型神经网络迅速发展。此类训练可能占用…
我们引入APoW,这是一种受Hashcash式nonce搜索启发的新型工作量证明(PoW)构造,它能够通过…审计其他矿工的工作。
预训练大型语言模型(LLMs)日益需要分布式计算,但带宽限制使得在资源充足的情况下进行扩展变得困难。
检测未知的 deepfake 操作仍然是 face forgery detection 中最具挑战性的问题之一。当前最先进的方法未能生成……
我们提出了 VINO,一个统一的视觉生成器,能够在单一框架内进行图像和视频的生成与编辑。它不依赖于特定任务的……
在音乐创作中,快速原型对于探索和完善想法至关重要,但现有的生成工具在用户需要同时具备结构……时往往力不从心。
我们介绍了 Talk2Move,这是一种基于强化学习(RL)的扩散框架,用于文本指令驱动的场景中对象的空间变换。Spatially m...
偏远地区的农民需要快速可靠的植物病害识别方法,但他们往往缺乏实验室或高性能计算的渠道。
本工作介绍了 Falcon-H1R,这是一款 7B 参数的推理优化模型,证明了在 s... 实现竞争性推理性能的可行性。