率一直上不去。”
“我认定神经网络才是未来,但是苦于没有一个庞大且标注清晰的图像数据库。”
郭长征说到这里,语气突然变得兴奋起来。
“不过,我今天下午查资料的时候,发现了一个绝佳的契机。”
“什么契机?”楚一航也被勾起了好奇心。
“美国那边有个叫李飞飞的华裔教授,她搞了一个庞大的项目,叫ImageNet。”郭长征说道。
此时,有必要详细拆解一下这个名为ImageNet的庞然大物。
在2009年这个时间节点,人工智能正处于一个不上不下的尴尬期。
传统的专家系统和逻辑推演已经走到了死胡同。
机器学习虽然兴起,但大部分学者都在研究如何精雕细琢算法本身。
大家都在追求用最少的数据,通过最复杂的数学公式来实现目标。
这种思路在当时是绝对的主流。
但李飞飞的思路截然相反。
她认为,想要让计算机认出一只猫,不应该去教计算机猫有几根胡子、耳朵呈什么角度。
而是应该直接给计算机看几百万张猫的照片。
只要看得足够多,计算机自己就能总结出规律。
这个思路在当时被很多传统学术界的大牛嘲笑。
因为收集并标注几百万、上千万张图片,是一项非常繁琐、耗时且看起来毫无技术含量的体力活。
但这恰恰是深度学习爆发的绝对前提条件。
ImageNet项目就是在这个背景下诞生的。
这个项目致力于构建一个包含数千万张图片的庞大数据库。
并且每一张图片都要经过人工的精准标注。
比如这张图片里是一只狗,那张图片里是一辆车。
为了完成这庞大的工作量,李飞飞团队甚至动用了亚马逊的众包平台。
雇佣了
本章未完,请点击"下一页"继续阅读! 第3页 / 共4页