我的判断是SORA出现意味着AI已经到了动物智能水平,但是离人类还有很远的距离,因为人类理解世界的方式是需要理性的。 Sora Generated Videos
我们需要用语言来交流,我们需要讨论并找出对同样事物的共识,比如牛顿定律、爱因斯坦的相对论都不是记忆预测能够实现的,是人类相互交流、积累的成就。理性让我们能总结出一种普遍规律,有时候甚至可以说,如果有事情不符合这个规律,不是规律错了,而是事情错了,因为很多规律是长期总结出来的。 Sora Generated Videos
很多人担心人工智能快速进步,说通用人工智能离我们不远了,比如周鸿祎就预计还有一两年,通用人工智能就要来了。 Sora Videos
这背后其实是人类发展的历程,我们今天觉得自己的智能水平很高,依赖的其实不是个体进化,而是整个群体的协同进化。也就是说,你的智能的形成和你周围的人是有关系的,如果没有周围的人,你的进化水平就不会提高。 Sora Videos
我认为人工智能可能遵循的是同样的路径,人工智能走到今天是向我们的个体智能致敬的,但是再往下走,要形成通用智能很可能也需要走上群体智能的道路,这是我的一个判断。 Sora Generated Videos
现在有越来越多的证据支持这一点,比如说最近出名的Claude 3大模型,它的各项指标看起来都与OpenAI最强的GPT-4相当,看起来是一个非常不错的大模型。这个模型来自OpenAI前员工成立的Anthropic公司,就是OpenAI的创始员工,现在可以说是第二大的闭源大模型。 Sora Generated Video
这意味着OpenAI很快就会跟上来。我们可以预期的是未来AI竞争会更加激烈,OpenAI的领先性不会独占,更不用说后面还有一大堆的开源模型在等着。 Sora Videos
2.SORA为什么重要?
Sora Generated Video
离通用智能有差距,并不影响单项智能的价值。 Sora Videos
这就是 Sora 出现价值巨大的原因。 Sora Generated Video
为什么这么说呢? Sora Generated Video
吴恩达和李飞飞年初就分享过,24年的重要看点就是会有大视觉模型的崛起。
Sora Videos
ChatGPT出来的时候我们以为大语言模型已经是AI的一个终点,当时OpenAI已经展现出同一个模型处理文字、图片的能力,通过数据预处理实现图片和语言数据统一化,也就是所谓的token化。 Sora Generated Video
现在 Sora 的进步,很重要的地方就是在token化上再进一步,提出了patch的处理方法。Patch具体是什么我就不详细展开说了,简单说就是把一段视频看作大方块,把它切小变成一个个小包,也就是Pacth交给AI学习,最后结合diffusion model 生成视频。 Sora Generated Video
底层还是大语言模型,但是工程方法有了很大的变化,这意味着不同的类型的数据预处理方式有了很大的差别,这就影响了智能形成的方式。 Sora Videos
这是 Sora 给我们带来的一个非常重要的启示。这和我们人类其实非常相似,并且让我们也能看到潜在的发展方向。 Sora Generated Video
一方面,我们的大脑和大模型很像,它有一个统一的机制,人类的新皮质有六层,和卷积神经网络上百层相比简单多了。但是用更简单的东西能够高效地处理事情,实际上是更高级的体现。所以我们的大脑的运算能力实际上比现代的人工智能要高级。 Sora Generated Videos