使用神经网络预测布法罗市的交通
Source: Dev.to

概览
每年,交通部门都会投入大量资源对道路进行实地调查以测量交通量。许多道路并未被测量。我们构建了一个神经网络,能够预测布法罗‑尼亚加拉地区任何道路的交通量是低、中或高——无需现场调查。
功能
给定道路的地点、类型、方向和所属区域,模型即可即时对其交通水平进行分类,准确率达到 75 %(仍在改进中)。城市规划者可以利用此结果来优先安排道路维修和信号升级。企业则可以在选址前评估街道级别的交通情况。
构建过程
我们在 PyTorch 中训练了一个前馈神经网络,使用了来自 Open Data Buffalo 的 28,567 条真实道路测量数据。关键步骤包括对年平均日交通量(AADT)进行对数变换以处理偏斜、基于规则的特征工程以降低道路名称和市政区等高基数列的维度,以及添加自定义的“距布法罗距离”特征来捕捉空间交通模式。
挑战
最大的挑战是处理拥有 80 多个唯一取值的高基数分类列。我们通过领域驱动的分箱方法解决——将道路名称归类为类型(高速公路、大道、街道),将市政区划分为地理区域,从而降低噪声并显著提升模型收敛速度。
成就
在未见过的测试数据上实现了 75 % 的准确率阈值,模型仅包含 4,515 个参数——证明在结构化表格数据上,简单且精心工程的特征胜过复杂的网络架构。
收获
特征工程比模型复杂度更重要。花时间清洗和转换数据——对数变换、地理分组、距离特征——对提升准确率的影响大于更改网络结构。
使用技术
- Python
- PyTorch
- Scikit‑learn
- Pandas
- NumPy
- Matplotlib
- Seaborn
- Open Data Buffalo