媒体报道
媒体报道
首页 > 媒体报道 > 正和岛 | 这家AI公司有点“硬”,原来都靠这8个字

正和岛 | 这家AI公司有点“硬”,原来都靠这8个字

2023 - Jun - 21
今年3月,美国行业研究机构Zeta Alpha发布了一项排名,全球人工智能论文引用次数与发表论文的数量比率前一百名,OpenAI位列第一,力压谷歌排在第二的是来自中国北京的旷视。

“虽然发表的文章数量不多,但都是高质量”。

作为一家中国人工智能领域的独角兽公司,旷视对于基础研究的投入很多,拥有全球规模领先的计算机视觉研究所,在历次世界顶级赛事中累计赢得42项最高荣誉,每年都有高质量的论文发表。

旷视成立于2011年,至今已11年半的时间,由三个毕业于清华姚班的“天才”少年创办,从技术起家,逐渐走到应用领域。

如果从应用开始做,也许商业化的路径更快一点,但旷视却选择了一条更难的路。

甚至在联想之星的课上,旷视被作为反面案例来研讨,他们本质上是一家“拿着锤子找钉子”的公司。

但怎样才能有好的“锤子”?有了“锤子”,怎样去找“钉子”?找什么样的“钉子”?背后的思考并不简单。

旷视科技联合创始人兼CTO  唐文斌


技术信仰


首先是怎样才能有好的“锤子”。


现在全球人工智能领域最火的公司莫过于OpenAI,在说到OpenAI教给我们什么时,唐文斌说是“信仰”这个词。


其实算法大模型并不新,所有人都在用,经过前几年的不断发展,当模型不断加大、数据量不断增加的时候,大模型的性能也一直在增加。但当到达顶点后,很多人觉得它的性能可能就在那了,然后停下了在这件事情上的探索。


但是OpenAI的信仰就是大力能出奇迹,它不断加大模型,突然就出现了质变,没有人知道为什么会发生质变,唐文斌觉得这个东西就是信仰。


从2011年创业到现在,旷视已经有11年半的时间了。回顾唐文斌他们的创业路,可以看到“信仰”这个词在他们的创业过程中也扮演着很重要的角色。


在创业之初,他们就相信一件事情——未来一定会有很多机器人。当有很多机器人的时候,它们会像人一样需要眼睛、耳朵,来感知外界的信息,所以最关键的一个输入能力就是眼睛。


因此,他们相信机器视觉一定是最有用的东西,也坚信计算机融入视觉会在很多场景里带来价值。


在谈到创业的契机时,唐文斌说到了两个背景事件。一个是2010年微软推出了Kinect的体感交互周边,当时卖了很多台,大家也觉得体感交互器很好玩。


另一个是2011年他阿姨送了他一台iPhone4,是历史上第一次出现前置摄像头。当时很多人在上面开发小程序,赚了不少钱。


于是,唐文斌和印奇有了一个想法,把体感交互移植到手机上。于是他们做了一个用脑袋去操控的游戏,大概是用摇头去控制一个稻草人,唐文斌他们戏称是一个颈椎保健游戏。


这款游戏发布以后,在没花任何钱推广的情况下,创造了APP store中国榜第3名的纪录。后来,有投资人找上门来,他们就走上创业的路。


而他们的创业之路之所以能成功,也离不开3个要素。


1. 创始人的基因

就像芯片一样,如果芯片只是专利,那么就是一张废纸。技术是拿来用的,要应用于生产和生活。
旷视也是在不断寻找如何把技术和场景更好地进行结合,包括唐文斌在内,旷视的三个创始人都是技术出身,所以在需要技术对场景带来差异化的地方,他们可以跟别人做得不一样。

因为不管是计算机视觉,还得现在的AI,都是可以给很多场景带去价值的。


2. 对技术趋势的判断力
在创业之初,旷视在技术方面做了很多思考,从基础的模型算法开始探寻未来的AI算法长什么样子。
最后他们发现这个世界需要的算法是无穷无尽的,不同的场景在不同的地方识别不同的对象,这就需要一个高效的方式形成有效的算法生成。
于是他们做了Brain++,做了AIS算法生产平台,大幅提升了算法生产和交付效率。

基于这些算法,怎么用一些软硬结合的方式,跟传感器芯片结合生成一些硬件设施,是他们从技术层面自底向上的思考。
从旷视的角度来讲,人工智能其实跟人的逻辑是一样的,人有五官,解决的是感知的问题,是如何从外部的世界去获取信息。
于是旷视做了视觉、语音识别等各种传感器,本质上也是在解决感知的问题。
最近大模型、ChatGPT等都比较火,有了大模型,可以对很多信息、知识形成更好的组织模式。

现在很多人在讲AGI(通用人工智能),在唐文斌看来,大模型的技术发展,某种程度上让人看到了通用人工智能AGI的希望,它体现出来的技术能力,是令人非常兴奋的。大模型能够带来很多新应用的可能性,大家都去关注它,去想怎么能够把这个技术用在生产、生活当中,是特别好的事情。

3. 信仰
旷视不是一家从场景和程序出发的公司,而是从技术出发的公司,很重要的一点是,他们认为这个技术能成功,然后再去找场景。
在旷视,有八个字叫“技术信仰,价值务实”。
正如唐文斌所说,“旷视之所以存在是因为他们的技术信仰,如果抛开了对技术的追求,做一个纯粹的信息化和应用公司,旷视没有存在的价值”。
旷视对于核心技术的投入是非常坚定的,并不是说盈利的多少用来做研发投入,这个坚定靠的是信仰。
他们相信AI的可能性,相信技术是可以改变世界的,相信在这些技术上能衍生出更多的工具和能力,能够对不同的场景带来价值。
庄子《外物》篇中有这样一句话:“唯至人乃能游于世不僻,顺人而不失己。”
意思就说,唯有得道的人,做到极致的人,才能悠游于世而不封闭自己,顺乎人情而不丧失自己的本性。
那什么样的人,才可以称得上做到极致的人?就是这种真正有正信仰的人,悠游世俗却又和光同尘,圆同大虚却又纤尘不染。


价值务实


其次,有了“锤子”,怎样去找“钉子”,以及找什么样的“钉子”。


旷视虽然是以技术起家,但更重要的是把技术用在什么样的地方,唐文斌也从创立之初开始反复追问这个问题。


他思考的答案是,最后还是得回到用户价值上,他们做的这个技术能不能够极大地降低用户的成本,或者极大地提升用户的效率,或者极大地优化用户的体验,即降低成本、提升效率、增强体验。也是通过AI的能力为用户提供一个更好的解决方案。


唐文斌他们一直在寻找那些AI可以在场景里极大地带来增值的效应。

在2012年的时候,他们认为人脸是所有视觉里面商业价值最大的,做的第一个场景就是从人脸识别开始,做了face++这个网站,通过精准的身份认证技术,帮助互联网金融类客户实现了更为便捷的线上开户服务模式。

第二个场景是手机的人脸识别技术。苹果在iPhone X的时候推出face ID做人脸解锁,当时所有的安卓手机厂商都开始找这类的供应厂商,于是旷视为它们提供服务,现在大家手机里用的人脸识别技术很多也都是由旷视提供的。

后来,旷视也围绕以手机为核心载体的应用输出做了很多案例。

其实,唐文斌他们一直在思考怎么用技术去解决一些尚未被很好解决的普遍痛点。

在2015年左右,唐文斌和印奇去了一个好朋友的公司,他们是做物流的第三方运营的。有一个商务平台的仓库,大概4万多平米,里面有几百个人,在有人下订单的时候就一人拉着一个小推车,在那儿逛超市似的拣货,最后再发出去。


那些人差不多一天要走40公里左右,就是一天一个马拉松。他们的人员流动性也很大,一年的流失率大概是200%,就是一年换两拨人,因为太辛苦了。


唐文斌他们觉得在这样的场景下,应该是用机器人的方式来提高人的工作效率。于是,在这个机缘巧合下,他们进入到了物流这个场景。


作为技术出身的人,唐文斌觉得他们适合解决的问题,是那些之前就已经存在,但是没有被很好解决,旷视能用一些新的产品和技术更好解决的问题。


比如,去年旷视新推出了一款产品,叫托盘四向车,它是一个跑在货架上的移动机器人,可以用来做托盘的搬运,主要是用来做非常密集的存储,同时又能提供非常高效的进出能力。

旷视四向车在密集库中自动搬运货物


这个产品其实并不是旷视发明的,但他们发现当时市面上的产品还没有很本质地解决问题,比如它原来的车速度不够快,货物更加密集的时候效率很难出来。还有,多台小车在仓库里共同协作,完成货物进出,要做到高效率其实是需要有很强的算法调度能力。


于是,唐文斌他们重新思考这个问题,通过对车体的优化、调度算法的优化,使得解决方案是用户用起来更舒服、效率更高、成本更低的一种方案,跟当时行业里做得最好的产品相比,效率提升了一倍以上。

旷视四向车-最优路径+异常自愈

“技术信仰”不是对技术的一种盲目追求,最深层次的其实是“价值务实”,只是这个价值不是在当下产生,它需要更多的投入,在未来产生价值。
所谓的“价值务实”,也是站在客户和大众的角度,思考如何为他们提供服务,是一种用户思维的体现。

技术只是一种工具


除了“技术信仰,价值务实”,旷视在打造自己的“锤子”和找“钉子”的过程中,还有以下几点值得我们思考。


1. 技术只是一种工具
在上述这些案例中,我们可以看到是需要复合能力的,既需要对场景有所了解,也需要有技术方面的一些能力,两者要能够结合在一起。
“现在技术的发展其实既不是在左的极端,也不是右的极端,是在一种中间的状态”,在谈到技术的发展时,唐文斌说到。
技术能解决一定的问题,但不能解决所有问题,数字化也好,智能化也好,我们都把它看成一种工具,用工具化的视角,来把它产生的价值闭环。
我们需要对它有一个客观的认知,现在很多概念在炒作下容易失去对它的客观认识,我们要清楚你本身的目的是什么。
AI一定是一个工具,不是一个业务。工具是需要载体的,旷视现在做的这些业务,光做算法是不行的,必须结合软硬件、结合合作伙伴打造一个解决方案,或者自己形成解决方案的能力,这样才能给客户创造最终的价值。


2. 开放

唐文斌他们是个学生创业团体,最大的心态就是开放,可以学习新的东西。但最关键的一点是,知道自己什么行什么不行。在自己不行的地方,找懂行的人来相互配合。
这种开放的心态,不仅体现在公司内部,更体现在与客户交流的过程中。
他们不去做客户的老师,因为客户肯定对自己的业务是更了解的,而是和客户进行一个双向的探讨,在思维碰撞的过程中也会产生更好的解决方案,客户也能对技术的认知有所提升。


3. 运气or实力

在采访的过程中,唐文斌有经常提到一个词,“机缘巧合”,甚至开玩笑地说运气是旷视的全部。
所谓的“运气”大多靠的还是“人为”,“运气”会降临在不断往前的你,而不是原地不动的你。
旷视在对场景的应用上是不断思考的。他们拿着“锤子”去找“钉子”的时候,也得知道“钉子”大概有哪些场景。所以他们在不断思考哪些东西可以用到,在行业里有一些交流和输入,去形成一个最全面的认知。
在对问题的洞察变得更加深入之后,然后决定在哪开始投入资源,深度去做的时候,就出现了所谓的“契机”。
机会是留给有准备的人的!

结论:走难而正确的路


OpenAI成立于2018年,5年的时间里ChatGPT引爆了人类体验的革新。


未来的AI是什么样,没有人知道,但总是需要一些人来做行业的引领者。


与西方国家相比,我们在基础技术研究和芯片上,还存在一定差距。我们需要像旷视这样有技术信仰的公司和人,来推动中国AI的发展。


这个世界上不缺正确的事,但正确的事都比较难。可以说,旷视选择的是一条难而正确的路。


时代的浪潮滚滚向前,一切都是未知,一切又皆有定数。


正如亚马逊创始人贝佐斯所说:如果你做一件事,把眼光放到未来3年,和你同台竞技的人很多,但如果你的目光能放到未来7年,那么可以和你竞争的人就很少了。


祝福旷视!