设置

关灯

第592章 获奖论文(第3节)

提升模型的泛化能力。

进展缓慢,且充满反复。有时,一个看似 promising 的模型变体,在验证集上表现提升,却在更复杂的测试场景中一败涂地。有时,精心设计的特征,被证明对最终性能贡献微乎其微。挫败感是常态,但没有人提出放弃。一种奇特的、在共同攻坚中形成的坚韧氛围笼罩着这个小团队。争论时常发生,尤其是王睿的工程思维与苏晚的理论洁癖碰撞时,但目标始终一致:做出真正能用的东西。

转机出现在一个周末的深夜。连续一周的模型调优收效甚微,王睿几乎要抓狂。苏晚在反复审视失败案例后,提出了一个大胆的假设:或许他们过于执着于让模型“理解”高级战术语义,忽略了篮球运动中一些更本质的、物理层面的约束和启发。

“篮球运动员不是粒子,他们的移动受到物理规律、自身体能和比赛规则的限制,同时也受到战术意图的驱动。”苏晚在群里发语音,声音带着熬夜后的微哑,但逻辑清晰,“我们能不能在模型中显式地加入一些基于篮球运动规律的先验知识,或者物理启发的归纳偏置(inductive bias)?比如,球员的移动具有惯性,变向需要时间;球员的视线有方向,通常关注球和关键对手;进攻球员倾向于朝向篮筐移动,而防守球员倾向于阻断进攻路径并面向持球人……”

这个想法,与韩澈早期试图用“面向角度变化率”等特征捕捉意图的思路不谋而合,但苏晚将其提升到了模型架构设计的层面。她提议,不再仅仅将原始的坐标和速度作为节点特征,而是构造一系列反映篮球运动常识和博弈逻辑的中间特征,作为网络的输入。甚至,可以在图神经网络的消息传递过程中,引入基于这些先验知识的约束,引导模型学习更合理的表示。

“比如,在计算两个球员之间的注意力权重时,”苏晚继续说,“不仅可以考虑他们之间的空间距离和运动相关性,还可以加入‘他们是否处于进攻/防守的对位关系’、‘他们是否在彼此视线范围内’、‘

本章未完,请点击"下一页"继续阅读! 第3页 / 共8页