EUNO.NEWS — Page 247

1周前 · ai

[Paper] Mesh-Attention：一种通信高效、提升数据局部性的分布式注意力

分布式注意力是扩展大型语言模型（LLMs）上下文窗口的根本问题。当前最先进的方法 Ring-Attention 存在……

#research #paper #ai #machine-learning
1周前 · ai

[Paper] 考虑截止期限的在线调度用于LLM微调的现货市场预测

随着基础模型规模的增长，对其进行微调的成本也越来越高。虽然 GPU 现货实例提供了一种低成本的替代方案，相比按需资源……

#research #paper #ai #machine-learning
1周前 · software

停止使用原始 UUID：在 Rust 中实现类型安全、带前缀的 ID（Stripe 风格）

我们都经历过这种情况。你在凌晨 2 点盯着服务器日志，试图调试一个请求，看到这样的信息：Processing request for ID: 550e8400-e29b-41d4-…

#rust #uuid #type safety #prefixed ids #crate #stripe-style IDs #debugging
1周前 · software

使用 Nix 的自定义交叉编译器

文章链接: https://www.hobson.space/posts/nixcross/ 评论链接: https://news.ycombinator.com/item?id=46372771 积分: 7 评论: 0

#Nix #cross-compilation #custom compiler #build systems #reproducible builds
1周前 · ai

[Paper] 一把工具足够：强化学习用于仓库级 LLM 代理

在大型开源软件（OSS）代码库中定位需要修改的文件和函数是具有挑战性的，因为它们的规模和结构复杂性……

#research #paper #ai #machine-learning
1周前 · software

荷兰特斯拉车队在押注马斯克的自动驾驶承诺后破产

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#software #programming #tech-trends
1周前 · devops

[Paper] 深入探讨 3D 并行与异构 Spot 实例 GPU：设计与影响

大型语言模型（LLMs）的快速增长以及新GPU产品的持续发布，显著提升了对分布式训练的需求……

#research #paper #devops
1周前 · it

英伟达的 GPU 集群管理能力能走多远？

NVIDIA收购了高性能计算（HPC）和AI工作负载管理系统“Slurm”的开发公司SchedMD。Slurm Simple......

#it #startups #korea
1周前 · ai

超越模仿游戏：量化与外推语言模型的能力

摘要——研究人员组建了 BIG-bench，这是一个由众多贡献者创建的 204 项任务的集合，用于评估当前和未来的语言模型能力。

#large language models #BIG-bench #model scaling #capability evaluation #bias in AI #AI safety #emergent abilities
1周前 · software

Python 结构篇：列表推导式与“单一操作”

Timothy的“Assembly Line”代码

#python #list-comprehensions #loops #code-readability #programming #software-development
1周前 · ai

[Paper] AirGS：实时 4D 高斯流媒体用于自由视点视频体验

Free‑viewpoint video（FVV）通过允许用户从任意视角观看场景，实现沉浸式观看体验。作为一种重要的重建技术……

#research #paper #ai #machine-learning
1周前 · software

本地 AI 是空想

软件运行在一个部分可观察且不断变化的环境中。我们发现操作系统是解耦资源分配的必要基础设施……

#software #programming #community

Newer posts

Older posts