“而且每一个模块应该怎么样使用,在什么样的情况下使用,官方的文档里面,都给了比较详细的示例代码和教程。”
苏晚晴看着他专注的表情,继续发问。
“也就是说,你并不需要理解每一行底层代码的逻辑,也能完成顶尖模型的训练?”
顾超凡非常坦诚地点头。
“是的。外网那些大牛管这个叫深度学习前沿研究。我倒感觉这种操作像是‘炼丹’。”
苏晚晴笑了出声。
“炼丹?为什么这么叫?”
顾超凡也跟着笑了起来。
“因为很多时候,我也不完全确定为什么加了这一层,准确率就会提升。”
“我就是在框架里不断地调整参数。”
“改一改学习率,调一调批次大小,然后把数据喂进去跑。”
“就像古代道士把药材扔进炼丹炉里,看看最后能炼出个什么东西来。”
他收起笑容,语气变得认真。
“但是,能够让我这样不断试错、不断‘炼丹’的前提,是这个丹炉必须足够好用。”
“TenSOrFlOW帮我处理了显存分配、跨硬件调用这些最麻烦的事情。如果让我自己去写CUDA代码来调度GPU,我估计写三年都写不出一个能跑的DemO。”