再调参,处理过拟合,再处理,换框架,换数据增强方式……
然后跑出了那个让他失眠了整整一夜的数字。
但他没法训练更大的模型。
算力不够。
微软亚研院给他划的那块算力有上限,还要跟组里其他项目排队。
他算过了,如果要把网络规模再扩大一倍、数据集再丰富三倍,按现在能用的算力,连续不间断地跑,需要将近四十七天。
他等不起。
不是技术上等不起,是赛道上等不起。
他清楚地感觉到,全球跑在这个方向上的人越来越多。
去年AleXNet一出,全世界顶级实验室就像被点着了一样,一股脑儿往这边涌。
斯坦福、CMU、DeepMind……这些机构手里握着的算力,是他这种人做梦都摸不到的规模。
他必须跑快一点。
所以他来了西安。
“2013年全国计算机视觉与模式识别暑期研讨会”,主办方是西安交大和西工大,协办方拉了一长串,里头有两个国家级的超算中心。
这场会议在学界的分量不算最顶尖,但务实。
任少卿要的也不是顶尖,他要的是那两个超算中心的挂名负责人,以及他提前查过的、挂在西工大计算机视觉重点实验室名下的那一批国防科工委拨款的H系服务器集群。
他的如意算盘是:论文宣讲好,跟西部这边的大拿们混个脸熟,饭桌上开口“化缘”,借一批算力用三个月。
道理上没问题。
学术圈就是这么运转的。
任少卿走进报告厅大楼,扑面而来一股凉气,把他半干不湿的衬衫一下子激透了,打了个哆嗦,稍微舒坦了点,抬头看了眼指示牌。
计算机视觉分会场,三楼报告厅B。
宣讲安排在下午两点,是下午场的第二个报告。
现在是上午十点四十分。
本章未完,请点击"下一页"继续阅读! 第2页 / 共6页