您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻
张勇亲自挂帅,阿里加入大模子中国战事-香港期
一场AI大模子追逐赛,鏖战正酣。
4月11日,阿里云旗下大模子产物通义千问面世。阿里云峰会上,阿里巴巴团体董事会主席兼CEO张勇首次以阿里云智能CEO的身份亮相,先容了通义千问的最新希望。
一直以正装果然示人的张勇,穿了一身休闲装,呼应其新身份——去年年底,他宣布亲自挂帅阿里云,“躬身”营业四个多月后,张勇带来了*待磨练的作品通义千问。他示意,阿里巴巴所有产物未来都将接入通义千问大模子,举行周全刷新。
ChatGPT的问世和迭代速率,重新界说了手艺转变的日新月异。在阿里之前,百度已率先“交卷”,推出基于新一代大语言模子研发的天生式AI产物文心一言,并展示了其在文学创作、商业文案创作、数理推算、中文明晰、多模态天生五个使用场景中的综合能力。
更多不甘落伍的互联网大厂和创业者正在路上。
3月尾,腾讯总裁刘炽平在财报电话会上说,腾讯正在加速推进大模子混元;3月29日,360团体首创人周鸿祎在一次流动上预演示了360尚未正式公布的大模子应用产物,他称:“GPT是场新工业革命,其意义逾越了互联网、iPhone的发现。”
《中国企业家》从靠近字节跳悦耳士获悉,字节跳动版的ChatGPT已在内测,但内测之后,体验效果欠好,预计在9月上线,也有可能提前。不久前,原阿里达摩院大模子M6带头人杨红霞加入字节AI lab,介入语言天生大模子的研发,直接向副总裁杨震原汇报。
随着时间的推进,行业的紧迫感越来越强,节奏越来越麋集,仅在4月10日这一天,就有3家公司宣布推出大模子及应用产物:搜狗首创人王小川正式官宣入场大模子创业,年底公布大模子产物,已获得5000万美元启动资金;商汤宣布推出商汤日日新大模子;昆仑万维和奇点智源相助自研的国产大语言模子将于4月17日启动约请测试。
这场AI大模子之争,让幽静了良久的中国互联网市场突然变得亢奋,纵然在昔时“百团大战”、生鲜电商缠斗最猛烈的时刻,头部大厂也没有拿出“All in”押注未来的架势。对标ChatGPT的大模子,显然被大厂看成开启下个时代的钥匙——谁能*触摸到AI生态的潜能界线,谁就能掌握话语权。
然而,训练大模子并非易事,大厂和创业者们相互竞逐背后是一场财力、手艺、算力、人才等资源的综合较量。但在大厂内部看来,此轮关于大模子的创业,若是只是一个大厂的游戏,说明中国的创新照样没有走出原来的怪圈,AI大模子创业应该是一个万众创新的游戏。
01、手艺、算力、人才的角逐
从公布信息来看,阿里对通义千问的定位,已经不局限于简朴的AIGC观点上,而是若何让AI的能力真正应用在更现实、更多样的场景上。
阿里的大模子分内外部两个蹊径——一方面将与团体内部产物连系,可以预见,通义千问将对天猫、淘宝、高德、钉钉等营业应用带来直接的商业价值,据领会,钉钉、天猫精灵将率先接入测试,将在评估认证后正式公布新功效;另一方面,阿里云示意将开放通义千问的能力,辅助每家企业基于通义千问打造具备自己行业能力的专属大模子。
阿里大模子由阿里云智能CTO周靖人卖力,周靖人结业于中国科学手艺大学,获哥伦比亚大学盘算机博士学位,曾任微软研发合资人,2016 年加入阿里,任阿里云首席科学家。他告诉《中国企业家》,阿里选择在现在宣布通义千问,并非完全为了“赶时髦”。
“阿里从2019年最先,就在投入林林总总训练大模子的研发中。但ChatGPT以一个异常好的产物形态泛起,教育了全社会,现在简直是一个很好的时间节点。若是我们在去年9月、10月讲预训练大模子,也许人人都不会感兴趣。”周靖人说。
事实上,无论是阿里照样百度,能快速推出自己的大模子及应用,都源于两家在过往的手艺积累。
2019年,百度便推出了文心大模子ERNIE 1.0。现在,ERNIE 3.0天天接受数十亿次用户的搜索请求,这让文心一言能够基于一个重大的、高效的数据池,快速地学习和改善;阿里则于2021年延续公布语言大模子 Plug(后更名为AliceMind)和多模态大模子M6,去年9月,两个大模子合并为阿里通义大模子。
再看看文心一言由的团队——由百度CTO王海峰出任总指挥,团队焦点成员还包罗百度团体副总裁吴甜、百度手艺委员会主席吴华等人。王海峰先后卖力百度搜索、百度舆图、百度翻译、百度智能云等营业。他同时是自然语言处置领域天下上*影响力的国际学术组织ACL50多年历史上首位华人主席。
除了人才外,大模子训练也堪称“暴力美学”,需要有大算力、大数据和大模子,每一次训练义务都耗资伟大。
据《中国企业家》领会,文心一言大模子的训练数据包罗万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均挪用数据,以及5500亿事实的知识图谱等。
此外,浙商证券的一份研报指出,支持ChatGPT算力基础设施至少需要上万颗英伟达GPU A100,与之相对应,AlphaGO只需要8块GPU。
这只是*门槛。大模子的发作会导致训练的应用场景越来越多,对训练算力的需求会大幅增进,增进幅度能到达10倍甚至100倍。
02、大模子带来的产业转变
清控银杏北京新基金完成4亿元首轮关账
ChatGPT及相关的大模子应用,除了给小我私人带来事情是否会被取代的担忧外,也给产业带来许多转变。
在李彦宏看来,当人类进入人工智能时代,IT手艺的手艺栈发生了根个性转变。已往基天职为三层:芯片层、操作系统层和应用层。而现在可以分为四层:芯片层、框架层、模子层和应用层。百度现在是在这四层举行全栈结构的人工智能公司。
谈及全栈结构,百度智能云云盘算产物解决方案和运营部总司理宋飞告诉《中国企业家》:“AI产物对于资源的要求越来越高,只有每一层都有自主可控的器械,才有可能纵深地做延续闭环的优化。”
宋飞举例,若是芯片不是自己的,你在优化到底下硬件的时刻,就是个黑盒了,能施展的空间*是有限的,你有什么需求它也纷歧定听你的。若是用自己的框架,有什么需求就很快可以调整。全栈的结构和专门的优化,是百度在基础架构的焦点优势。
AI大模子的盛行,也在衍生众多的商业时机。
在李彦宏看来,对于大部门创业者和企业来说,真正的时机并不是重新最先做ChatGPT和文心一言这样的基础大模子,这很不现实,也不经济,重复造轮子是没有意义的。而是基于通用大语言模子,争先开发主要的应用服务,“就像移动互联网时代,最乐成的商业产物不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等种种超级应用。”
阿里持相同的看法。
周靖人示意,阿里将开放通义千问的能力,辅助每家企业基于“通义千问”打造具备自己行业能力的专属大模子。未来每一个企业在阿里云上既可以挪用通义千问的所有能力,也可以连系企业自己的行业知识和应用场景,训练自己的企业大模子。好比,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模子等。
王海峰以为,大模子时代将发生三大产业时机:
*类是新型云盘算公司。大模子将根个性地改变云盘算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好欠好、模子好欠好,以及模子、框架、芯片、应用这四层之间的协同。
第二类是举行行业模子精调的公司。这是通用大模子和企业之间的中央层,他们具有行业Know-how,挪用通用大模子能力,为行业客户提供解决方案。
第三类是基于大模子底座举行应用开发的公司,即应用服务提供商。现在,基于文本天生、图像天生、音频天生、视频天生、数字人、3D等场景,已经涌现出许多明星创业公司。
03、反思、挑战和局限
略显遗憾的是,现在多数中国大公司在做的大模子和基于模子的应用,均是追随OpenAI的脚步,而且随着ChatGPT的惊人迭代速率,差距越拉越大。
李彦宏在接受36氪采访时示意,百度“文心一言”在研发阶段时,百度手艺团队曾与ChatGPT举行对比测试,那时差距是40分的水平,一个月能追得上。可过了一个月,手艺团队再次测试后,发现差距反而拉大了。
周靖人也坦诚认可,现在通义千问与ChatGPT仍有差距,“GPT照样属于各方面都*的职位”。但他以为“你追我赶”是科技提高的一定阶段,“今天别人的手艺对照*,我们就需要取长补短。也许下一个阶段,通义千问也能孝顺自己的一系列手艺创新”。
在此前的采访中,周鸿祎也曾告诉《中国企业家》,着实海内也很早关注到GPT-1,然而那时的关注照样抱着一种适用主义的看法,以为应该找场景,要解决自己营业中遇到的问题。以是,中国的人工智能都用来解决人脸识别、图像滤镜做得更漂亮。
“若是一小我私人工智能手艺和自己的营业不能连系,可能就会以为没太大意义,以是,没有人想到用GPT NLP的模子解决通用知识明晰和推理的问题,更没有人想到大算力大数据做出一个大模子,能够发生一种连OpenAI自己都想不到的智能化的效果。”周鸿祎感伤道。
固然,中国更广漠的市场需要中国自己的大模子,中国厂商也有自然的本土优势。只是放到中西对比这一更大维度的竞争,海内大厂也有自己的局限。
周鸿祎以为,要把ChatGPT训练好,要用全人类的知识,一定要有开放的思绪。全天下中文网页也许是其他语言网页的1/10,书籍的数目也不足。此外,海内移动互联网的迅猛生长,也在制造更多的数据孤岛。
“外洋虽然APP也取代了Web,但外洋许多APP基本保留了Web版,用浏览器照样能在网页之间跳来跳去,能够自由使用。海内信息都被APP私有化了,若是这些巨头相互掌握着,谁的数据都不全,最后训练出来的大脑一定能力上是比不上的。”周鸿祎表达了一定水平的消极。
事实上,除了语料库之外,算力也是一个伟大的挑战。2022年8月尾,美国政府宣布制止美国公司向中国(包罗中国香港区域)和俄罗斯出口高端GPU,设定的红线是:算力跨越4800 TOPS,且带宽传输速率跨越600 GB/秒,受限产物就包罗英伟达A100和后续产物H100。
面向未来的AI大模子,中国互联网大厂还需更大的勇气和起劲,去突破算力、语料、人才等种种限制。