VHE:GPU 加速的门级仿真,零许可费用
发布: (2026年1月16日 GMT+8 23:41)
2 min read
原文: Dev.to
Source: Dev.to
我们是如何在 Verilator 失效时构建 GPU 模拟器来验证 6.7 M‑gate NPU 的
我们的 NPU 设计达到了 1.4 M 门。Verilator 开始进行卷积测试:
- 运行时间: 1390 亿周期
- VCD 跟踪文件: 56 GB
- 状态: 运行 3 天后被杀死
商业仿真器价格高昂,作为一家位于印度的初创公司,这根本不可行。
VHE(Virtual Hardware Emulator) —— 基于 GPU 的门级模拟器。
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ Yosys │───▶│ Parser │───▶│ Levelizer │───▶│ CUDA │
│ JSON Net │ │ (Python) │ │ (DAG sort) │ │ Kernel │
└─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘
│
▼
┌─────────────┐
│ Simulation │
│ Output │
└─────────────┘
设计
门
门级网表被表示为有向无环图(DAG)。我们对门进行拓扑排序,划分为 层级,使得第 N 层的门仅依赖于第 … 层的门。
- WIOWIZ 网站:
- VHE 项目页面: