出品|网易科技《智见访谈》
作者|赵芙瑶
编辑|丁广胜
大脑是如何工作的?我们能否设计一个机器来模拟大脑?
这是1956年,信息论创始人克劳德·香农与发明Lisp语言的约翰·麦卡锡在《自动机研究》开篇提出的问题。如今,Chat GPT使
生成式人工智能带来的全面智能化是一场深刻的革命,企业的治理运行逻辑也或将随之发生深刻变革。
在此背景下,互联网巨头们加码AIGC,纷纷表示想要打造“中国版ChatGPT”。放眼望去,清华系智谱AI宣布开源ChatGLM-6B大模型,百度也终于发布“文心一言”大模型。基于这个话题,360公司创始人、董事长兼CEO
在周鸿祎看来,人工智能会带来一场工业革命,可以重塑甚至颠覆众多企业的现有模式。“GPT已经给大家相当于指明了方向,大力出奇迹。”周鸿祎在接受网易科技专访时指出ChatGPT具有无限可能,并对于ChatGPT的未来发展展开大胆想象。
谈赋能传统行业:ChatGPT可重塑企业生态链
今年政府工作报告提出,要加快传统产业和中小企业数字化转型,着力提升高端化、智能化、绿色化水平。
以“专精特新”为代表的中小企业是数字经济发展的主力军,然而在数字化转型的浪潮中,许多中小企业面临着成本受限、转型能力不足等挑战。
作为一名曾经的创业者,周鸿祎非常能理解中小企业以及小微企业的艰辛,他认为在中小微企业转型数字化过程中真正做到一个也不能少,才能实现数字化战略的共同富裕。“数字化浪潮来的时候,我曾说所有的行业值得重做一遍。实际上重做的难度还是很高的,要采集
同时周鸿祎指出,ChatGPT无疑为企业提供了一条新的思路。“现在很多企业如果用ChatGPT进行生态链重塑就比较容易,只需购买SaaS服务,并把SaaS服务跟现在已有的业务流程进行结合。写稿时如果觉得江郎才尽,可以和ChatGPT聊聊天,或许会脑洞大开。”
周鸿祎坚信,人工智能重塑各个行业、各个企业。目前周鸿祎要求其公司每个团队都得做APP的部署,无论是To B、To C都应该涵盖。假设拥有了强大的大脑后台,将云服务引到APP中,软件一定会焕然一新,而ChatGPT无疑是产业革命的加速器。
谈打造中国版ChatGPT:产学研需“珠联璧合”
ChatGPT背后最为核心的技术,是深度学习的多层变换器Transformer、即GPT中的“T”。其模型也并非完全原创,但是最终产生了1+1>2的效果。目前,对于前沿科技领域,国内很多研究机构还处于追随模仿阶段。
周鸿祎指出国内企业最终还是要靠自主创新,在学术上有所突破。“前沿的人工智能模型和算法,很多都不是我们原创的,这需要科研机构的努力。同时,单单靠研究机构也不行,必须效仿OpenAI与
周鸿祎认为,人工智能大模型的成功一部分是技术,一部分是产品体验,还有一部分是工程化,其中存在许多环节,包括内容的调度、数据的筛选、工程师的标注、人工的训练。而研究者往往容易忽视工程化,这是错误的做法。
在他看来,而这需要进行结合与互补。“搞工程化的公司有时往往又觉得搞研究的人想得太理想主义,所以我认为这次人工智能大模型的成功应该说是微软和OpenAI之间珠联璧合的合作起到了决定性作用。微软提供算力、工程师,帮其解决工程化的问题,而产业化公司比较擅长的是用户体验。此外因为大模型训练的成本很高,如果找不到商业模式,是难以为继的,而这也是产业化公司擅长的。”周鸿祎指出了二者各自的优势,同时也挖掘出了其合作模式。
在周鸿祎看来,微软承接了许多属于产业化公司擅长的工作,使OpenAI可以专注于技术研究,双方在资本上又进行了很好的结合,这给予了我们启发,中国可以将大学、国家实验室、科研机构、科研体系和互联网公司、产业公司结合起来,通过合作的方式来推进。
“别人已经领先了,我们不能再把别人踩过的坑再踩一遍。”周鸿祎感叹道。他认为首先可以建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+Open AI”组合引领大模型技术攻关;其次可以支持设立多个国家级人工智能大模型的长期开源项目,打造开源众包的开放创新生态。建立大型科技企业+重点科研机构为龙头,通过开源、合作、众包和生态的创新模式,引导高校、科研机构和创新型企业形成多个技术路线的创新生态群。这样一来,可以降低错误风险和防止技术垄断风险,避免其变成新时代的数字鸿沟。
谈与国外差距:原创性有差距,两年有望赶上国外
“我觉得中国和国外的差距没有那么大,比光刻机芯片差距都要小很多,主要原因是这方面的论文都是开放的,很多模型算法原来都是开源的,相当于我们有基础。GPT已经给大家相当于指明了方向,大力出奇迹。但是,我觉得这里有很多细节的技术问题,比如灌输知识是容易的,但能力和推理能力,包括各种实际技能的训练较为复杂。所以我认为大概需要两年左右的时间,国内的水平就可以赶上来。”谈及我国的AI企业在资金、人才、底层技术等关键环节与国外存在的差距,周鸿祎这样回答道。
周鸿祎还提出,中国和微软、Google的差距,从模仿角度来看差距不大,从原创角度差距仍然存在。“我们面临几个不利的条件,就是我国缺乏开源的传统,它里面用了很多模型都是前面的公司开源的,没有前面的开源就没有在前人肩膀上的积累,每个公司都要从黑暗中摸索,这对国家整个产业发展速度是不利的。这么牛的技术,也确实不应该被垄断在一两家公司手里。”
他还指出我国目前存在的一些难点。他指出,为了实现对GPT的超越,需要使用更多的数据,而不仅仅是开源数据集。这包括大量的杂志、期刊和图书。公共数据是非常重要的,因为GPT对时效性的要求并不高,它可以使用很早以前的书籍或文章。但周鸿祎也指出数字化的问题是一个难点:“如果大量的中文图书没有数字化,或者没有一定版权的授予,这个版权授予如何进行、国家如果没有政策支持,那么数字化的难度会更大。”
除了版权之外,周鸿祎认为互联网的信息也非常重要,互联网有上万亿个网页,其中有很多都是电子垃圾,这就需要搜索引擎进行调度、处理、过滤和清洗。“但是中国出现一个怪现象,乔布斯发明了APP,大家用习惯了就不怎么用网站了,但是美国还有一个传统,所有的APP背后还有一个Web版本,还是保持了Web化的浏览体验,这样的话这些不涉及用户隐私的数据可以被抓取可以用来做训练,但在中国所有的信息都被APP分割了,APP人为的将互联网分割成了各种信息孤岛。如果你的数据我拿不到,我的数据也不给你,最后大家训练出来的能够真正超越吗?我觉得会比较难。”
同时周鸿祎也规划了一条企业可以选择的路径,他认为打造生态至关重要,ChatGPT目前表面上来看,是打造了一个聊天机器人、个人助理来帮助大家更好的使用工具。而实际上它做了一项工作:秘密挑选了一百家专业公司并扶植其做专业的垂直应用,这一百家公司大部分均为创业公司。
“头部企业才需要搞大模型,大部分企业只需要在大模型的基础上,结合自己的行业场景、专业需求,利用大模型提供AI的能力来赋能自己就可以了。所以,对于很多创业企业应该是一个蓬勃发展的机会。”周鸿祎向网易科技表示。
同时周鸿祎也强调,ChatGPT被称为通用人工智能是因为它构建了一个通用的知识基础,可以为不同的行业和应用场景提供支持,而不是只限于某一个垂直领域。这也是它的产业革命的价值所在。虽然在中文语料方面,ChatGPT的中文表现不如英文表现好,但这是因为中文语料的比例非常低,大约只有百分之几。这意味着要训练更好的中文模型,需要更多的中文语料。
展望未来,周鸿祎认为在追赶美国的过程中,我们要先把自己的“疑难杂症”解决,如果想在一片土壤上长出几棵苍天大树,要长出生态,就先要把土壤环境机制创造好。