设置

关灯

第229章【一夜爆红的神秘高手(二合一)】(第3节)

大的游戏方式。

而通过自我对弈和强化学习,构成了开放端学习算法的基本范式,学习人的策略,并确保娜芙的智能体在整个游戏过程中不断探索这些策略,从而让“她”获得更大的升级与进步。

此外,由于星际争霸这款游戏具有巨大的动作空间,会让许多先前强化学习方法变得无效。

罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习,使得“她”能从旧有的历史决策的游戏中有效的更新决策。

而罗晟的终极目的可不是让娜芙成为一个“iba”的星际争霸ai玩家,而是以此为起点,让“她”能够胜任复杂多变的其它应用场景。

如果“她”只是在星际争霸的比赛中成为超级高手,换个场景,例如在围棋、语言或其它领域就不行了,那依然是个纯粹的人工智障,和真正的人工智能有着巨大的差距。

……

时间一分一秒的流逝,罗晟猫在他的办公室不知不觉就耗费了三个多小时,为娜芙完成了第二次的优化升级才下班,时间已经不早了。

罗晟在离开办公室之前,又把娜芙放进了暴雪星际战网的天梯中,让“她”与人类玩家不停的对抗。

搞定这一切就没有在管了,下午还要去蔚蓝海岸公司处理一些工作,还有一场会议什么。

而被放养的娜芙就在做一件事情,不断与人类玩家对战。

娜芙的背后支撑“她”的几乎是整个苏城数据中心,消耗的是算力资源,是电费。

事实上如果没有钱,是不可能养得起一个人工智能的,就更别说是开发阶段了。

如果是像ib公司这样的人工智能研发机构,制约其发展的可能是开发者本身,但见证过人工智能的罗晟,对于开发而言反而是最轻松的。

但仍然有问题制约着他。

那就是硬件,娜芙的成长被现在的硬件水平限制了,如果有更好的硬件基础,会迎来一次质的飞跃。

深度网络需要高端gpu在大量数据的合理时间内进行训练,这些硬件非常昂贵,当然在罗晟这里没有贵这个说法。

可问题是现在没有符

本章未完,请点击"下一页"继续阅读! 第3页 / 共8页