14年年前的最后几天,孟繁岐一直留在自己尚海公司做各种对照组实验。
看上去非常忙碌,但是和公司的事务基本上关系不大。
老板总是早出晚归,起初给视界的所有员工以不小的压力。不过慢慢相处下来,大家也逐渐发现孟繁岐的确不是一个讲究上班形式的人。
只要工作进展得顺利,他丝毫不关心你是怎么做到的,具体的时间又是怎么安排的。
不过,如果有人做事马虎了事,捅了篓子不及时沟通,而是拖延最后耽误了大家的时间。
那么孟繁岐也不会手软,对于这样心性又或者是能力不行的人,他也已经提前结束了好几位员工的实习。
当初招人的时候,有三位小伙子代码功力不错,在力扣这种平台没有兴起的时候基本功就相当扎实。
“说起来,我叫他们小伙子也真有点好笑。”孟繁岐突然想到他们年龄和自己差不多,有一两个可能还大自己一两岁,不由得觉得有些搞笑了。
他们主要是做一些比较底层基础的工作,前阵子比较忙。加班很多,孟繁岐也不吝啬加班费和调休假,几人干劲十足。
现在框架大都成型,开始渐渐走向正规,他们的工作量就没那么大了。
孟繁岐本来说让夏彦他们几個年前把调休用了,回去好好过个年。
但他们几个小镇出来的苦孩子,很是有一股狠劲拼劲,也很懂得感恩。
在校的时候过得都是一个月几百块的日子,临近毕业,他们对就业的事情关注了很多。
市面上的公司大都是什么样,几个人是清清楚楚。
起初来这初创公司,其实都做好了吃苦难熬的准备了,只是看中了高薪和孟繁岐的技术水平,想要学一些东西,没想过会在初创公司工作太久。
怎么也未曾想,不仅开出的高薪不是画饼,老板发奖金,给休假,平时相处也如此让人如沐春风。
因此,此时此刻,当夏彦,侯捷,徐少聪三人组发现自己的老板正在辛苦忙碌着什么东西的时候,他们很自发地想要用自己的时间提供一些帮助。
“这里确实有一些你们可以做的。”基础的框架构建起来之后,孟繁岐觉得确实有必要开始组建一个自己的人工智能研发实验小团队了。
现在有了一些名气,一些设备,有了一些可靠的名校科班程序员。
确实应该一改第一年单打独斗的风格。
“正好这次全都是实验性的内容,没有什么理论在里面。”孟繁岐知道他们三个结束了手头的工作后,已经在恶补人工智能方面的知识。
但别说短短一两周的时间不够,即便看了三五个月,也很难跟上孟繁岐的实验节奏。
好在这次的内容纯实验性,对科班的名校生来说不难理解。
这些实验的主要内容基本上都是围绕一个主题,那就是不同类型设备上的网络结构,怎么样才能在速度和性能之间取得最好的平衡。
这又是一个影响力非常大的工作,因为这些技巧几乎所有基于深度学习的研究都会用到。
孟繁岐的残差网络已经彻底革命了计算机视觉领域的性能,距离论文和代码公开也有两个月左右的时间了。
前几天,孟繁岐已经看到了一些变种的水文抢跑,这些水文大多是魔改下网络,化简为繁。
把原本孟繁岐故意设计地非常简洁的结构复杂化,从而在特定的数据和任务上实现更好的效果。
那么与此同时,这些改进大都会使得网络更臃肿复杂,速度也就更慢。
“如果要考虑人工智能的实际应用,只是显卡上运行是肯定不够的。虽然目前能够支持复杂,较深人工智能模型的主要训练设备是显卡,但训练和推理毕竟是两码事。”
“推理一个模型所需要的资源远比训练它要来得更小,而且训练模型只需要一次,在实际应用这些模型的时候,却要反复一直推理。我们从企业的视角上,要轻训练,重视推理,我准备的这些东西和实验,就是在做这方面的努力。”
夏彦三人点头称是,在现实世界的应用当中,肯定不会是谁都搞一块大几千块的显卡来跑一个人工智能模型的。
把运算放到云端是一个办法,但这就要求网络,而且网络不能太差,否则会极度影响用户体验。
除非不依赖显卡,而是使用其他的设备本身的能力来做这件事情。
“智能机,无人机,又或者是自动驾驶汽车,乃至机器人,都必须依赖显卡又或者是网络,这就太不酷了。”
“尤其是自动驾驶的汽车,那如果非要联网才能自动驾驶,随便断一下网络不是要了人命了。”
“你们说的都没错。虽然现在困难重重,但这方面的问题还是需要迈出去第一步。”孟繁岐笑了笑:“许多任务都有实际应用标准,往往精确到毫秒,为了达到这个标准,要么提高处理器性能,要么就减少计算量。”
“而提高处理器性能是硬件的事情,靠少数人小团队是没什么戏的。在短时间内是也是无法完成的,因此减少计算量成为了主要的技术手段。只有解决了这方面的效率问题,深度学习才能脱离显卡限制,广泛应用于移动设备。”
“这方面主要有两个技术方向,一个是模型的压缩。把训练好的模型通过技术手段压缩,使得它本身参数更少,存储和计算两方面都会有提升。不过需要多次训练和操作,有一定的难度。”
“另一个就是我现在在做的方向,那就是移动端的模型结构设计。主要思想是设计更加高效率的算子,从而减少网络的参数而不损失网络的性能。”
孟繁岐微笑着说道,这个操作也是一举多得。一方面可以支持阿尔法狗围棋AI的需要,另一方面也可以支持特斯拉方面的需要。
还有一方面,那就是这种纯工业的文章,会对业界产生巨大的影响。
因为它切切实实极大加速了人工智能落地到企业的速度。
“其实主要问题就是各个计算平台的特性不同,显卡的运算单元很多,并行处理大量简单计算很快,而CPU则更擅长处理数量少一些的复杂运算。”
一百道小学题,五十个小学生算得肯定比五个大学生快,但如果上微积分,那可就反过来了。
这些特性的不同,导致不同终端设备的偏好都各不相同。如何设计出不同类型设备上的最佳网络,可是一个大学问。
费时又费力,不知道熬秃了多少工程师才有了后来脍炙人口的一系列经典算子。
这些内容将很快把深度学习去年的成果代入上亿终端设备当中,就像互联网和智能机下沉到每一个人一样。
只是现在被重生人士摘了桃子。