No menu items!

    奇迹涌现,属于AI的大时代意外降临

    我最近有时候我觉得很累,过去我很少出现信息过载的状况,我认为我每天读的东西基本都能给消化掉,但最近我经常觉得信息过载,而所有的信息过载都是来自ChatGPT。通过这样的信息过载,但这个过程其实也是一个让人既兴奋又焦虑的这样的一个过程。ChatGPT的出现震惊了世界。尤其是最近两个月,人机交互的机器人带给大家的一个非常大的变化。

    一个属于人工智能的大时代突然就来了

    首先,这是人工智能与人机交互基点临近的以此突破。上次人工智能对大家的颠覆和影响,还是 2016 年的AlphaGo。它在韩国击败了李世石,之后又打败了柯洁。但之后几年,关于人工智能到底能够多么像人类、人工智能能够替我们做什么之类的争论就慢慢平息下来。因为像下围棋这些事都不足以真正撼动我们作为一个人与机器在大部分场景之下的交互方式。

    但是我们每个人都在说话,我们中很多人每天都在生成文字,甚至很多人赖以为生。所以我们看到 ChatGTP 和类似于Midjourney这样的东西在过去几个月展现出的能力。基于自然语义的人工智能的这种能力的涌现之后,人们会直观感受到这种能力的惊艳。

    这对于人的挑战是非常深远的,让我们非常有压迫感。我觉得这个其实是人类文明发展到今天,我们非常意想不到的这样一个时刻就突然来了。

    然后他是我们自然语言达模型的普及应用一个开端,以及神经网络处理 natural languageprocessing(NLP)的一个最高的水准。

    过去这么多年我们做过很多事情,然后很多公司都在搞各种各样的大模型,包括 NLP用于其他的很多领域,比如自动驾驶、客服机器人等。它们做了很多的事情,但从来没有一个像 ChatGPT这样的东西。它其实是神经网络的处理的一个最高的水准,每一个独立的个体都可以用,它是一个非常有意思的开端。

    在 GPT 4它发布之后,只同时配套发布了一篇论文。当时我觉得天哪,怎么回事?这样一个成果难道就只值一篇论文吗?还是你自己隐藏了很多东西?

    后来一想的确到了这个阶段,论文研究不是最重要的,工程是最重要的。

    什么是工程?就是你用多少条的芯片、多少算力,多少台服务器,用怎样的这种基于约束的调优和这种调参的模式,早期建模怎么去做?一次次的反复的尝试,这种不断去做调优调参这样的一个过程。

    它是一个工程学的实践,它不是靠我们做了多少基础研发的突破,它是不断的试出来,所以所以这个事特别有意思。就工程实践这件事情,第一个靠钱,第二个靠意志力,第三个靠团队,也就是靠人。

    有人形容这个事像是炼丹,你喂的那些药草就像语料,火炉的熔炉就是建模模型。加火的过程就是训练指令集调参调优的过程。这中间不断尝试的一个过程,非常的像炼丹。

    我觉得写 Prompt这事像念咒,我不太会炼丹,但我现在正在学会去念咒。炼丹的过程,其实上是人工智能工程实现的一个奇迹。

    这也是工业革命以来人类生产力最强大的一个效率革命。过去经常说人类已经经历了四次产业革命。第一次是蒸汽机,第二次是电力,第三次是计算机革命,第四次当前年代的智能革命。

    但我认为 18 世纪末开启的蒸汽机革命一直到 20世纪中期开启的信息革命是一个阶段。而智能革命其实是一个新的阶段。大语言模型的广泛应用,让人们意识到人们的经验、智力、智能在很多时候可能也是不够用的,可能也是需要一个更强大的东西与人去配合去工作。

    我们去想效率革命这个事情,它极大的提升了我们的效率,也能够激发我们在创造力方面的能力。他会创造一些新的工作机会,或者让人们去重新地认识自己的社会价值和商业价值。

    最近我们公司要搞一个 prompt day活动。让所有人去分成两个组,图片组和文字组,可能会请几个人命题,让团队来参与生成内容。我们现在内部有很多团队都开始接触 AI内容生成。比如视频团队,他们现在也开始用 Midjourney画画了。然后要闻团队也开始用这个东西写一些微博的推广文案,写一些快速的要闻。商务团队,市场团队现在已经在用它去写一些文案,跟客户进行沟通了。当然做深度报道和深度内容的团队,暂时这个东西还替代不了。

    我们搞这个东西,不是要吓唬大家,我们要让大家知道这个事能够提高多少效率,激发我们多干多少事情。能够探索我们作为个体能提升多少生产力,我觉得这是非常有意义的事情。我认为她的确是重新定义职业脑力劳动和体力劳动之间的关系。

    中国为什么需要自己的 ChatGPT 公司?

    为什么中国需要自己的大语言模型产品。文心一言已经发布了,阿里达摩院也带来了通义千问,接下来几周还会有很多类似的产品推出。中国为什么需要自己的ChatGPT 公司,他们不做行不行?不做会不会死?

    我觉得这个事情其实也是我近期思考比较多的东西。

    首先我认为自然语言大模型的本质是基于语言的文化话语权。大家都知道这个世界上尤其是互联网上的主要内容,90%以上的内容是英文内容,中文内容只占其中非常少一个比例。

    这就意味着无论是 OpenAI 的 GPT 也好,谷歌的 Bard也好,还是其他的大语言模型也好。都是基于英文以及自己特定预料语料构建起来的一个模型。建模的过程既是选择语料、调优和调参的过程,也是他们在这个过程当中形成一个自然语言模型的价值观的过程。

    它是基于语言的文化话语权,这也意味着基于英语语言的文化霸权,有可能会通过人工智能和人机交互机器人的方式得到进一步的强化。

    所以全球自然语义处理框架不仅需要中文语义基础和中国语料,也需要中国价值体系与中国解决方案。

    前不久其实我接受过一个调研,问我们怎么能够把大语言模型做好。当时我说首先要在语料库上下功夫,我们要训练好的优质的高质量的中文语料。

    其次,我认为应该形成一个更互动的产学研结合的方式。公司有动力去做模型,而高校有研究人才和研发资源,然后政府有集中这样的资源,为这个事情把握方向的这样一个能力。

    最后就是说我们要训练好的中文语料,我们也要训练英文语料,把英文语料通过我们的模型调优调参训练成输出的方式,成为带有我们的价值体系和解决方案的东西。

    再一个,我认为大语言模型背后是芯片软件和云计算构成的系统。中国是世界上除了美国几乎唯一有能力独立开发的国家。当然要承认,我们算力可能不如人家,系统能力不如人家,投的钱不如人家多。

    但从另外一个维度来看,这个世界上有没有第三个国家的科研机构、企业能够跳出来讲我们来做自己的大模型?没有,是不喜欢吗?其实就是因为这个东西不是所有的国家都有能力去做的。

    芯片我们现在肯定是不是最强的,我们肯定是相对落后的,而且现在随着一些这种不合理的制裁,就这个领域我们可能还要再继续的落后下去一段时间。但是云计算这个领域中国的实力是摆在这里的,我们既然有能力去做,有能力哪怕是世界上的老二,我们就没有理由不去做这件事情。

    我认为自然语言大模型的圣杯之战是中美科技实力竞争的一个重要的维度。我认为人文社会科学就是文化观念的输出,它的载体是语言,到最后本身就是语言的符号化和数学化,其实也是会让它走向桂冠的这样一个过程,这个东西其实我们现在形成的就是一种自然语言的这种模型的研究。这个也是基于前面这个点上非常重要的一个维度。

    最后一个,是我们文化安全、数据安全、国家安全发展安全的重要保障。主要是所谓的安全发展。

    自然语言大模型激发的数据再生产将创造前所未有的数据价值。我们中国过去这么多年积累下来的各个产业的垂直产业的数据,沉浸在各个行业的公司服务器和数据中心。那么这些数据有的是死的数据,但也有很多活的数据,它是可以拿出来被再研究和被用来人机交互和人机沟通的数据。

    其次就是就是基于垂直产业的人工智能的发展逻辑与通用人工智能的化学反应。我前不久写过一篇文章,叫《是谁拖了中国 ChatGTP的后腿》,我把责任主要扣到了中国的 VC 的身上。我为什么这么讲?如果我们回到 2016年那个时间节点,中国和美国在这种人工智能的基础的一些东西上面其实水平差距没有那么大的。但当时的一些做大语言模型的初创团队基本都拿不到很多的投资。

    这个文章出来之后很多投资人都表示反对,说这个东西是投多少钱都见不了底,但这些人现在也都去投这个东西。

    我想讲一个基本的逻辑,通过我们做炼丹的过程产生这种人机交互和对话生成的结果,其实是可以支持更多小模型和小场景发展垂直的人工智能产业发展模型。我们现在会用到很多的小模型,和机器人产生对话,但这些对话目前还是太小了。

    但如果我们去想,他是基于大的模型的语料分析、调参最后形成的人机交互的成果,它是不是有可能真的能够帮你解决更具体、更切实,更能够帮助你的一些问题。

    国内最近有两个趋势,第一个就是类似于像文心一言,包括像阿里达摩院这样的机构,他们这样的巨头公司及其下属机构在推出自然语言大模型的测试。此外,他们也正在积极的在去做一些基于产业、基于垂直领域结合的一些东西。其他比如科大讯飞也好,京东也好,他们也在试图基于打的一些平台上的数据去做一些更大的模型,实现一些更具体的场景。

    这点我们有自信,中国人在做原生产品上可能不是最强的,但是我们落到产业、落到场景上可能会产生一个更好的成果。

    那么这个东西既然这么重要,它会反向激发中国在半导体、云计算操作系统等自主关键领域的创新。如果我们这种自然语言大模型起来了,其实它会反向的去激发很多在半导体领域,在云计算领域,在操作系统里的这种进化和升级,对我们基础的这种架构的数据相应是一个非常有意义的事情。

    <

    p style=”text-align:center;”>

    最后我特别想讲的一个点,它将推动更广泛意义上的数字平等,而不是更广泛的不平等。大语言模型给了很多人机会,他比你学编程要容易,他给了很多的机会让人们去创造更好的东西。当所有人的当一个事情弥合了人们更多的知识差异和技能差异的时候,其他会推动更广泛意义上的数字平等,而不是制造更不平等。

    最后还想多说一句话的话,就是说还是想给中国的 LLM领域和产业鼓一把劲,这个领域能够诞生出很多的新的机会,如果我们把它当做是下一次工业革命去看待的话,它可能意味着更多的东西。

    热点

    发表评论