先不说孟繁岐的年龄和学历在这家公司里究竟是多么的突兀,单凭他在多次实验之前,对结果的大概预判,就精准得让人难以置信。
要知道,在大型项目和复杂项目的优化当中,最让人痛苦的事情就是各种超参数的调整。
为了确认每个参数的作用和比较适合的大小,往往只能控制变量,不方便同时做太多调整和修改。
参数种类如此之多,想要每一个对对比清楚,搞清楚各个参数调整多少会有怎样的效果,所需要的计算资源和时间非常的夸张。
大多数时候,算法工程师是没有时间和设备去做彻底的优化的。
即便后来有一些比较不错的自动化搜索工具,很多人都没有那个算力和时间来做专门的优化。
就更别提现在了,平台和工具非常不完善,还需要自行写对应的脚本去记录参数和实验结果。
从某种程度上来说,AI算法工程师和围棋棋手差不多,都非常依赖某种直觉和感觉。
这种判断一部分来自于经验,另一部分则说不清到底是什么原理。
有时候感觉就是不怎么讲道理,有的人凭借直觉的判断,总是能快别人好几倍就找到一组比较适合的超参数,使得模型的性能有显著的提升。
在DeepMind众人看来,孟繁岐就是一个这方面的天才。
不仅直觉优秀,在底层的结构设计调整上,更是花招百出。
想新点子比下蛋都快。
绝大部分情况下,当孟繁岐将专门优化过的轻量结构交给对方的时候,对方往往都会震惊于速度的惊人提升,而不会再提出什么其他的想法。
因为这个倍率已经远超他们的想象和预计。
但是这一次,孟繁岐碰到了一个意外,那就是有硅谷钢铁侠之称谓的传奇巨头,马斯克。
当DeepMind众人还在因为算力不够,网络结构参数太多所需计算量太大而感到苦恼的时候,马斯克在思索的事情根本不在一个层级。
四个月前,马斯克的SpaceX将全门板的垂直起飞垂直降落技术应用于新研发的火箭之上,该火箭在成功升空744米后准确降落到发射台上,标志着人类首次制造出可重复利用的火箭。
两个月前,马斯克的SpaceX猎鹰9号,成功发射,将SES-8商业通信卫星送入了预订轨道,首次发射商业卫星成功。
渡过了前期的艰辛,SpaceX和特斯拉如今都到了收获的时刻,马斯克的视线也转移到了人工智能这个最近开始飞速发展的方向上面。
这个话题足够科幻,也足够复杂,正合马斯克的口味。
尤其是最近几个月内,各种人工智能突破人类能力的成果频繁出现。
孟繁岐循着图像类算法的根基,一路做出了一系列惊人成果。
就在马斯克在考虑为特斯拉加上视觉能力的时候,他也同时在思索着人工智能的安全问题。
似乎就在几个月的时间里,人工智能一下子成为了现实。
过去的五六十年里,它一直都只是一个概念,始终没有走出实验室。
可现在,它不仅已经进入了人们的生活,而且是以一种悄无声息的方式。
这让马斯克稍微有一些担忧。
谷歌的搜索引擎已经接入了雏形版本的T方法来协助搜索语义的理解,这种办法的优异效果,让谷歌开始考虑启动其他项目,比如语言翻译。
孟繁岐在DeepMind的任务已经告一段落,很快,他将在三月初抵达硅谷,加入翻译和AI平台等项目。
这些都是谷歌的内部情报,按理说外人不会知晓。
但不巧的是,马斯克与谷歌的两位创始人,佩奇和布林关系颇为亲密。