人工智能发展到ChatGPT惊艳登场,一方面面临历史性转折,另一方面进入重重迷雾。澄清迷雾明确转折方向,成了人工智能通用化发展的当务之急。迄今为止,人工智能经历了两个重要发展阶段,一是以专家系统为最典型标志,根植于人类知识的人工智能;二是以ChatGPT为最新标志,基于大数据的人工智能。“迄今为止,国际上对人工智能是什么仍众说纷纭。比较有共识的似乎是对人工智能的代际划分,即第一代人工智能是基于知识的,第二代人工智能是基于数据的。”而张钹等则进一步涉入机制:“第一代知识驱动的人工智能, 利用知识、算法和算力3个要素构造人工智能, 第二代数据驱动的人工智能, 利用数据、算法与算力3个要素构造人工智能。”根据知识和数据的关系,知识驱动和数据驱动的确概括了目前为止人工智能发展的两个层次。鉴于数据驱动的人工智能可以生成机器知识,知识驱动的人工智能也涉及作为信息编码的数据;而在信息编码层次,人工智能经历了复杂的发展过程,通过人机大数据软融合才达成人工智能发展的范式转换,人工智能发展的第一和第二个层次可以更具体地表述为“人类知识层次人工智能”和“信息编码层次人工智能”。从人类知识层次到信息编码层次,构成了人工智能进一步发展的重要指向。由于机器智能大数据运用优势的充分展示,ChatGPT在自然语言领域的泛化发展趋势似乎使人看到了迷雾中的人工智能“圣杯”——通用人工智能,从而引发了两种对立观点。一方面,ChatGPT甚至被视为通用人工智能;另一方面, 大型语言模型被认为是通用人工智能发展的误区。观点的两相对立为人工智能发展及其与人类智能关系的理解提供了强大张力。而在作为感受性关系的信息层次,则不仅可以理解关于ChatGPT与人工智能通用化观点对立的根源,而且可以根据人工智能发展的前两个层次,在更深层次看到人工智能发展的通用化进抵。从人类知识层次人工智能到信息编码层次人工智能,凸显了深化理解知识和数据及其关系的重要性;由此可见人工智能发展和信息理解之间的两方面重要关联。从目前呈现的两个层次,可以看到人工智能发展的理解深化涉及知识和数据关系的更深层次厘清,而知识和数据与信息的内在关联则决定了这一关系的厘清必须建立在信息理解深化的基础之上。这意味着一个重要双向机制:一方面,进一步到位地理解信息是人工智能当代发展的内在要求;另一方面,以人工智能和大数据为主要代表的信息科技发展正不断为深化信息理解提供新的时代条件,信息科技的发展空前开显了信息。当代研究表明,信息不是物质或能量,而是感受性关系,即物能发展出感受性之后,涌现出的感受性关系过程或过程关系。把信息理解为感受性关系,对信息编码及其与信息的关系就可以有一个清晰的认识:信息是感受性关系,信息编码则是信息的物能化和观念化。信息编码有两种基本类型:信息的物能编码和信息的观念编码。由此,可以真正厘清信息、信息编码和知识的层次关系。从知识到数据再到信息,从人类知识层次到信息编码层次,人工智能发展的进一步前景在其所呈现的趋势图中赫然闪现:信息层次人工智能。由此,人工智能的发展与生物智能的进化恰好构成逆向过程,呈现出一个更高层次的双向循环机制。正是由这一双向循环,可以在机制层面不仅清楚地看到人工智能发展的第三个层次,而且进一步窥见其通用化进抵。在具有人类知识的条件下,以其为基础就是人工智能发展自然而然的起点。由于由此实现的人工智能直接发轫于人类知识层次,知识是智能的核心表现得最为典型。作为人类知识的机器集成运用,人类知识层次人工智能与符号主义进路正相匹配,它是人工智能发展的第一层次。符号主义进路本身意味着只能表征可符号化的明述知识,这一进路人工智能的实现和发展在某种程度上正是探索知识表征的过程。由于包括人类感觉经验等在内的默会知识都难以为机器所表征,由此生成的更确切地说是人类明述知识层次人工智能。人类知识层次人工智能与符号主义进路密切相关,对此斯坦福大学教授尼尔松(Nils J. Nilsson)有已纳入教科书的表述。符号主义进路也叫“符号加工进路”,这种方式的人工智能通过陈述句表征关于问题域的“知识”。当应用于“实际”问题时,这种进路需要该领域的大量知识,因此通常被称为“基于知识的进路”。由人工智能的当代发展,可以更清楚地看到第一层次人工智能的人类知识层次性质。在第一层次人工智能研究中,可以看到典型的人类知识层次的性质和特点:“必须写出许多存放知识的程序,同时还需要专门的高级标记法来完成它。”这里已经可以看到人类知识层次人工智能的内涵。深谙符号主义进路局限的德雷福斯兄弟,清楚地看到第一层次人工智能的人类知识层次性质:“智能被定义为有关适合于一领域的一组特定的联系的知识,根据一个技能领域中许多高度抽象的特征之间的关系总是可以对智能加以说明”。这是对人类知识层次人工智能及其性质的典型表述。正因为这种性质,第一层次人工智能也被称为“知识工程”,涉及知识的获取、学习、表达等问题。正是由于处于人类知识运用层次,第一层次人工智能与符号主义研究进路自然而然都是人工智能发展最初阶段的产物。由于发轫于人类知识,这一层次的人工智能是其发展自然而然的第一步。作为第一步,其局限性也相应最为明显。符号主义进路所意味着的智能机制,在机器能表征的知识层次具有特定运演优势,同时本身又具有根本局限。作为机器智能,人工智能的最底层基础是规则与逻辑,但规则与逻辑本身并不能直接产生智能。“以推理作为机器智能的机制,要求人类把知识以逻辑的形式告诉计算机,然而人们很快就认识到,这样靠人工获取知识的手段是机器智能的一大瓶颈。”由人工获取知识不仅意味着这一层次的机器智能是典型的“人工智能”,而且充分体现了其知识表征远不如人的机器性质。以计算和搜索为核心机制,对于人类知识层次人工智能来说,最大的问题之一是指数爆炸。由于主要建立在符号运算的基础之上,人类知识层次人工智能不可能超越指数爆炸,指数爆炸正是由计算的指数增长构成的。而人类智能之所以不存在指数爆炸问题,就因为其核心机制不是基于穷尽搜索的计算方式,而是基于整体观照的智慧方式。虽然整体观照不像计算那么精确,但其重要意义在于原则上可以处理所有问题。人类知识层次人工智能的根本局限在其核心机制,它集中表现为其相对于人脑的极低效率能耗比。仅仅通过计算机制生成的智能,其层次从“暴力计算”概念及其效率能耗比就可以获得初步理解。“暴力计算”既意味着强大算力,又意味着与人类大脑相比的低效率能耗比。这种可以称之为“速度悖论”的悖理性并不是由运行速度产生,甚至也并不是一个简单的串行和并行计算的问题,而是与智能运行的核心机制局限密切相关。人类知识层次人工智能之所以具有明显局限,从技术上说是由于人类知识的机器表征及其计算搜索机制局限。从根本上说则主要是在人类明述知识层面,由于未涉及大数据而没能完全展开机器智能不同于人类智能的特性,只体现了其速度和搜索优势,更割离了其作为感受性关系过程的信息根基,不可能具有处理常识问题的感性层次。这就已经涉及知识、数据和信息及其相互关系理解的系统深化,而信息的到位理解则是其基本前提。从感受性关系的物能化和观念化,可以看到信息的感受性关系理解为信息编码的系统研究提供了前提性基础。作为信息的物能化,信息的物能编码如物理信号和DNA中的生物基因;作为信息的观念化,信息的观念编码如作为自然类概括产物的概念及其形式化的符号等。信息的符号编码有一种特殊的方式:信息的数字编码。其之所以特殊,就在于它既可以是作为信息观念编码的符号编码,同时又可以是作为信息物能编码的物理编码。作为数字编码,“0”和“1”是信息观念编码中的符号编码;而与之相应的“开”和“关”又是物能编码中的物理编码。因此数据不是信息本身而是信息编码,比特不是与原子相对的信息而是信息的数字编码。在信息的理解未完全到位的情况下,信息编码及其与信息的关系必定处于混沌未明状态,因此信息普遍被理解为信息编码,比如将比特看作信息本身。正是信息的信息编码理解,构成了信息理解的天花板。信息理解的信息编码天花板不仅限制了信息理解的深度,而且屏蔽了信息编码的研究及其深入。正是信息编码特别是信息观念编码的系统研究,在更深层次涉及信息与知识的关系,从而涉及人类知识层次人工智能理解的深化。由于信息理解的局限,信息的观念编码研究处于一种奇特状态:整个来说几乎是一片处女地,而其中的数字编码却以数字化的名义爆炸式发展。目前只有在信息的数字编码中,才能既看到信息观念编码的“神龙见首不见尾”现状,又看到其重要性。事实上,正是信息的观念编码构成了知识的直接基础,知识正是基于信息观念编码的观念体系。人类知识体系正是在信息观念编码的基础上推导出的层次越来越高的概念构成的,因此在人类知识体系中并非所有的概念都是信息的概念编码,信息的概念编码只是作为具体的自然类概括的产物。正是由此,可以清晰看到知识、数据和信息三者的层次关联,进而看到人工智能发展的相应规律性关系。信息的感受性关系理解为信息编码特别是观念编码的澄清和系统研究提供了前提,从而在深化理解人类知识层次人工智能基础上,为深化理解人工智能的发展规律进而理解其进一步发展,甚至人工智能发展与人类智能进化的关系提供了新的条件。人类知识是基于信息观念编码的观念体系,而信息的观念编码不仅有概念编码和符号编码,而且有图像编码和经验编码等前概念编码。信息的概念编码和符号编码及基于其上的概念体系和符号体系可以进行机器表征,然而机器表征不能涉入信息的前概念编码,比如不能进入信息的经验编码及基于其上的经验系统。正因为如此,虽然人类知识是碳基智能发展的高层次产物,但只是在通过表征抽离其感性经验基础的人类明述知识层次,所实现的人工智能不仅割断了人类知识与人类智能作为感受性关系的信息的关联,而且无缘于人类智能中的前概念编码。正是由于远离作为感受性关系的信息甚至信息前概念编码,人类知识层次人工智能不可能真正处理自然语言,更不可能具有解决常识问题的能力。因此,就人类知识层次人工智能而言,在基于信息观念编码的知识和作为感受性关系的信息之间,基本上是理解的盲区,其根本症结就在于信息理解处于悬浮状态。在符号主义进路的人工智能研究中,信息甚至被理解为知识。认为信息是知识,就是把在信息的观念编码基础上建立起来的观念—知识体系当作信息本身。将信息理解为知识,就意味着将人类知识的直接运用视为信息加工;而从信息的感受性关系理解则可以看到,符号主义进路所表征的人类知识和作为感受性关系的信息之间不仅具有层次差别,而且局限于人类知识层次会存在智能理解的天花板。由于数据是信息编码,而知识则建立在信息的观念编码基础之上,符号主义进路直接生成的人工智能不仅没有深入到作为知识基础的信息编码,更没有深入到作为信息编码前提性基础的信息,只能是人工智能的初级形式。这既更具体地表明将其称为人类知识层次人工智能更为确切,也更清晰地呈现出第一层次人工智能与人类智能的机制关系。由于人类知识层次人工智能与符号主义进路相联系,符号主义进路基础上人工智能的发展意味着机器智能发展的相应性质;由于核心机制具有根本局限,人类知识层次人工智能很快就遇到了发展瓶颈。“几十年前,人工智能研究主要聚焦于开发知识规则和关系创造所谓专家系统。但事实证明,这些系统的建造极其困难。因此,知识系统让位于数据驱动路径:基于统计概率和模式,挖掘大量数据进行预测。”这就意味着,要真正实现人工智能由人类知识层次到信息编码层次的范式转换,必须有大数据的发展。在人类知识层次人工智能发展阶段,数据发展的局限决定了不可能通过信息数字编码发展产物的大数据建立起与人类智能的更深层次关联,更不可能直接从外部世界获取知识。机器从外部世界直接获取知识,意味着智能机制不仅必须进一步深入到比知识更基础的层次,而且必须在大数据发展的条件下。正是在大数据发展的条件下,探索已久但受数据规模限制的联结主义研究进路获得了必不可少的发展条件,人工智能的发展突破人类知识层次人工智能的局限,深化到了信息编码层次。在大数据发展基础上,信息编码层次人工智能正不断给人带来惊喜。从人类知识层次到数据层次,人工智能核心机制的发展主要是基于神经网络的机器学习。正是机器学习,使人工智能从利用人类知识发展到直接利用数据。由一般专家系统到深蓝,由AlphaGo到AlphaZero再到ChatGPT的发展,正体现了通过机器学习实现人工智能从人类知识层次到数据层次发展的重要进程。信息编码层次之所以构成与人类知识层次不同的人工智能范式,不仅因为从基于信息观念编码的知识深入到了作为信息编码本身的数据,而且由于机制上通过大数据纳入人类具有经验语境的语料并进行机器学习深耕,实现了人机大数据软融合发展深及自然语言的范式转换。只有发展到大数据才能真正体现硅基智能和碳基智能的根本不同,正是由于二者相应处理能力上的根本差异,大数据构成了人工智能发展范式重要转换的基础。从人类知识层次到信息编码层次,人工智能发展所达到的层次的确更深,但是就小数据而言,两个层次的人工智能并不构成范式区别,不仅机器智能与人类智能没有处理速度之外的根本不同,而且人类智能由于其概念体系提供的整体观照,在很多方面比人工智能更具优势。只有发展到大数据才由于建立起了人机深度软融合的人工智能发展条件,构成了其发展的重要范式转换。对于信息编码层次人工智能来说,关键的基础是数据。而大数据则为机器学习提供了全新的信息编码条件,使硅基智能的独特优势得以充分发挥。大数据的发展带来了人工智能发展的革命性范式转换,不仅意味着从作为基于信息编码的观念体系深入到了作为信息编码本身的数据,而且通过作为人类数字足迹集合的大数据纳入人类语境发展到了一个更深层次:深及自然语言语境的人机大数据软融合及其进化。从基于人类知识的专家系统到“数据智能”,再到基于大数据的ChatGPT,意味着一系列重要的机制性深化。关于信息编码层次人工智能,从近年来根据其本性概括生成的数据智能(data intelligence)概念可以得到更具体的理解。