大数据和创构认识论

Big Data and Creatructive Epistemology

  作者简介:王天恩(1954- ),男,江西莲花人,上海大学马克思主义学院、社会科学学部教授,博士生导师(上海 200444)。

  原发信息:《上海大学学报:社会科学版》第20211期

  内容提要:新一代人工智能的发展,在更深层次展示了大数据的重要性。正是在大数据基础上,汇聚了信息科技发展过程中生发的新认识论旨趣。从电子计算机到智能算法的哲学研究,新的认识论旨趣相继出现,不仅在计算机哲学研究中有程式认识论,而且在智能算法的哲学研究中提出了算法认识论,这些都是不同于面对既存自然世界认识的认识论旨趣,属于相对于描述认识论研究的创构认识论探索。创构认识论旨趣源自创构活动,创构是信息创生意义上的整体建构,而创生是无中生有的创造。基于大数据的创构活动展示了从认识世界和改变世界到创构世界的发展,其中不仅意味着从描述性认识到创构性认识,而且意味着从描述认识论到创构认识论的镜像扩展。

  The advancement of the new generation of artificial intelligence further demonstrates the important role of big data in a profound way.It is on the basis of big data that new epistemological purports have arisen from the process of information technology development.New epistemological purports have emerged one after another,from the “procedural epistemology” in the philosophical research of computer to “epistemology of the algorithm” in the philosophical research of intelligent algorithm.These purports are not identical with the epistemic ones oriented towards the existing natural world,but creatructive(creative-constructive)epistemology in contrast with descriptive epistemology.The purport of creatructive epistemology originates from the activity of self creatruction(creation-construction),a concept of holistic construction of creating new things out of nothing.The creatructive activities based on big data show the development from understanding and changing the world to creatructing the world,which means not only an expansion from descriptive to creative cognition,but also an extension from descriptive to creatructive epistemology.

  关键词:大数据/创构/描述认识论/创构认识论/big data/creatruction/descriptive epistemology/creatructive epistemology

  标题注释:国家社科基金重点项目(17AZX003);教育部人文社会科学研究重大课题攻关项目(18JZD013)

 

  电子计算机的诞生,使认识论旨趣开始发生重要分化。基于计算机程序,人们提出了程式认识论(procedural epistemology);根据算法的发展,关于算法的哲学研究又提出了算法认识论(epistemology of the algorithm)。而作为创构活动的更高层次基础,大数据使程式认识论和算法认识论等共同认识论旨趣汇聚成同一发展进路,呈现出相对于描述认识论的创构认识论路径。

  一、大数据作为创构的基础

  信息科技的发展,使具有创生性和整体性的创构概念应运而生。[1]29创构不同于一般意义上的创造,它具有整体性,而且这种整体性趋向造世规模,这是以大数据和人工智能为标志的信息文明发展趋势;创构也不同于一般的建构,它具有创生性,创生是无中生有的创造,这与信息的本性密切相关。作为信宿和信源间的感受性关系,[2]信息与物能的根本不同,在于物能是守恒的,而信息却可以在物能基础上创生。创构意味着的整体性创生,只有在大数据基础上才成为可能。大数据基础上的创构不仅是一个物数据化和数据物化的过程,而且是数据通过虚拟技术等手段对象化的过程。

  人类文明伊始,我们面对自然界,就开始形成数据,甚至屈指数数、结绳记事和石子进位等就已经是物数据化的最原始方式,只是在漫长的人类文明发展史上,人们得到的都是小数据、样本数据。但是,即使再原始的数据,也意味着一个物数据化的过程。与物数据化过程相对应,人类实践中也早就有数据物化的过程,按照蓝图(不管是思维中的还是图纸上的)修建桥梁,根据图纸设计建造房屋等,就是最日常的早期典型例子。工程领域和所有物能性创造发明,都是与单纯描述不同的创建和构造活动,只是在大数据的基础上,具有创生性的信息具有越来越重要的地位,特别是3D打印的出现,数据物化及其与物数据化所构成的重要关系和机制才得以清晰呈现。事实上,物数据化和数据物化这两个过程可以构成一个双向循环,只是这个双向循环唯有在大数据基础上才能看得更清楚:一方面,我们朝着量化世界的目标走得越深入,物数据化和数据物化的双向循环就越完整;另一方面,这个重要双向循环越是完整,大数据就离我们越近,越具有整全性。

  大数据通常被看作规模大到传统数据库技术不能处理的数据集合,这是大数据的技术定义。但大数据不是一种单纯的技术,而是基于信息的存在。作为一个重要的基本事实,信息存在的重要性随着大数据的发展越来越凸显。在信息文明时代,信息存在具有与物能存在一样的存在论意蕴。

  信息科技特别是大数据的发展越来越清晰地表明,关于信息的研究,成了当代最基本的重要课题。由于信息成了必须在科学和哲学一体化发展中才能理解到位的复杂问题,关于信息的界定学界先后提出了一百多个定义,但仍未达成共识。而在一百多个信息的定义中,维纳的信息阐释,成了信息科学和哲学一体化研究的出发点。维纳将信息和物能并列,认为“信息就是信息,不是物质或能量”。[3]与物能并列的信息,不仅具有与物能同样的存在论意义,而且具有物能存在所不具有的本性。正是由于信息,大数据成了人类信息文明的基础。[4]作为信息文明的基础,大数据具有决定信息文明不同于物能文明的重要特性:规模整全性、实时流动性、结构开放性和价值生产性。

  大数据的规模整全性指的是大数据的“大”不是纯粹的量的概念,这个“大”的意味是全。大数据的“大”之所以远不仅仅是一个量的大小问题,是因为单纯的数据量大并不构成大数据与小数据的原则性区别。大数据与小数据的根本不同,在于其基本特征是趋向规模整全。大数据不仅意味着数据大,而且意味着维度全。大数据之所以维度全,就是因为大数据的获取只有最基本因而也是最少的在先预设。

  所有数据的获取都有在先预设,关键是在先预设的层次。在先预设的层次一方面取决于取样所设置目标的具体程度,另一方面取决于基本理论预设的层次。样本数据的获取都具有科学理论层次的在先设定,而大数据由于不必有像取样那样的具体预设,其在先预设一般都将基础确定于存在论层次,这是最基本的哲学层次。在先预设越基本,预设就越少,数据相应维度越全。虽然不存在完全意义上的全数据,就像不存在十全十美的事物,但以人类使用为标准,则可以就使用需要把大数据看作是趋向于全数据的存在。由此,在信息文明层次,大数据可以进一步看作不仅在规模上大到而且在维度上全到就使用需要而言的全数据。正是在这个意义上说,大数据与小数据的根本区别,就在于大数据不是根据预先设定的具体目的,由抽样形成的干枯数据标本,而是活的实时数据。抽样形成的数据,就像动植物标本,是干枯失活的。一张平面照片,角度和动作等都是固定的。而作为动态反映事物相互作用过程的数据流,大数据则具有与现实过程同步关联的实时性。

  实时性是大数据的另一个重要特性,这与技术设备的数据处理速度密切相关。对于人类来说,作为人类信息文明的基础,大数据的存在不仅取决于数据本身,而且取决于技术设备的数据处理速度,因为数据处理速度决定了实时数据流状态。在这个意义上,大数据涉及其与人类使用的关系,涉及大数据的人类使用。这是信息与物能甚至与人类直接相关的重要体现,也是人与世界联系更为密切的方面。样本数据在取样后就从现实世界割离开来,从而与现实进程没有了实时关联,而大数据则是实时数据流。在小数据时代,人们只是获取标本;而在大数据时代,我们所获得的则是一个生成的数据基础。正是高速流动的数据,为大数据提供了趋向与现实生活同步的过程性。数据流速是个至关重要的维度,它造就大数据的实时流动性。这种不是凝固而是自然生成的数据流,随着信息文明的发展,不仅越来越成为人类生存的直接基础,而且是一个面向人类发展不断扩大开放的世界。

  作为人类新的生存和发展基础,大数据还具有至关重要的结构开放性。大数据的结构开放性源自实时数据采集只有最基本的预设,正是这一特征使大数据构成信息文明的创构基础。随着信息科技的发展,大数据远不只是最初的文本,而是越来越多来自商业过程、机器、网络特别是像智能手机等移动设备那样的人和物、人和人乃至物和物的互动,包括电子邮件、照片、音频、视频和监视设备等。大数据来源和类型的多样性,所带来的不是我们在数据库时代所理解的结构化数据、半结构化数据和非结构化数据,而是结构开放的数据,这意味着数据结构的开放性。人类关于数据结构的认识,不是完全决定于数据本身,而是涉及大数据相关关系的理解。由于大数据的特点之一是数据太多但信息不足,大数据“难”在理解,因而数据挖掘与人的理解能力密切相关。正因为如此,大数据对于人类的关系和意义才那么复杂丰富,价值才那么与众不同。

  大数据的规模整全性、实时流动性和结构开放性,意味着大数据具有价值生产性,它构成信息文明的意义生产基础。作为大数据的技术理解,相对于取样数据价值密度低,数据挖掘是沙里淘金,但在哲学层次可以看到,大数据的意义与人的需要的关联性,决定了大数据的价值取决于价值生产,取决于人对大数据相关关系的理解,取决于人对大数据所反映的自身需要及其发展的理解,甚至取决于人对自身发展的选择。也正是这些,决定了大数据具有与人及其需要的重要关联,即大数据与人及其需要的发展内在相关的价值生产性。[5]正是大数据的价值生产性,构成了大数据之于人类的特殊存在论意义。

  大数据的规模整全性,对于既存具体事物的认识以及全新事物的创构,均具有量化的整体观照功能。大数据的结构开放性,为创构全新事物敞开了一个无限的可能性空间。大数据的实时流动性,则为创构全新事物、把握人类需要及其发展提供了现实的可能性和具体手段。正是规模整全性、实时流动性和结构开放性,造就了大数据特有的价值生产性,为创构全新事物奠定了价值基础。大数据价值的关键,就在它取决于人类对这一关系的把握:大数据相关关系组合与人的需要及其发展之间的关系。大数据时代一个新的存在论基础,就是大数据相关关系。

  大数据相关关系给人类提供了一个前所未有的平台,使之得以根据需要及其发展并基于相关关系而创构出新的硬件和软件,这就是创构世界的重要进程。在创构世界的过程中,其关键不再局限于人使用的工具和所处的环境,而是人本身的信息化,人越来越以信息的方式存在。[6]人本身和周遭世界的创构,必定生成一个新的世界层次,一个真正意义上的属人世界。这样在哲学层面就有了一个新的发展:从改变世界到创构世界。传统哲学主要强调人类能够认识世界,马克思特别强调人类能够改变世界。“哲学家们只是用不同的方式解释世界,问题在于改变世界。”[7]关于马克思这一观点的内在逻辑,我们可以作进一步展开:在信息文明时代,改变世界已经发展到创构的规模,或者说,我们今天不仅是在认识和改变世界,而且是在此基础上创构世界。

  从解释世界和改变世界到创构世界,这一发展的重要基础正是不同于物能的信息,不同于大自然的大数据。大自然是既存的天然基础,大数据是创生的创构基础。由于信息具有物能所没有的创生本性,大数据相关关系蕴含着创构世界比特层次的无限可能性空间。创构世界一方面在既存自然世界的基础上,另一方面又不是直接对既存物能存在的改造,而是基于物能存在的信息性创生,由此所发生的新的物能改造只是信息物化的结果。正是信息性创生,使大数据基础上的创构活动既不同于人类一直就有的物能建造,也不同于对既存对象的描述。

Big Data and Creatructive Epistemology

  作者简介:王天恩(1954- ),男,江西莲花人,上海大学马克思主义学院、社会科学学部教授,博士生导师(上海 200444)。

  原发信息:《上海大学学报:社会科学版》第20211期

  内容提要:新一代人工智能的发展,在更深层次展示了大数据的重要性。正是在大数据基础上,汇聚了信息科技发展过程中生发的新认识论旨趣。从电子计算机到智能算法的哲学研究,新的认识论旨趣相继出现,不仅在计算机哲学研究中有程式认识论,而且在智能算法的哲学研究中提出了算法认识论,这些都是不同于面对既存自然世界认识的认识论旨趣,属于相对于描述认识论研究的创构认识论探索。创构认识论旨趣源自创构活动,创构是信息创生意义上的整体建构,而创生是无中生有的创造。基于大数据的创构活动展示了从认识世界和改变世界到创构世界的发展,其中不仅意味着从描述性认识到创构性认识,而且意味着从描述认识论到创构认识论的镜像扩展。

  The advancement of the new generation of artificial intelligence further demonstrates the important role of big data in a profound way.It is on the basis of big data that new epistemological purports have arisen from the process of information technology development.New epistemological purports have emerged one after another,from the “procedural epistemology” in the philosophical research of computer to “epistemology of the algorithm” in the philosophical research of intelligent algorithm.These purports are not identical with the epistemic ones oriented towards the existing natural world,but creatructive(creative-constructive)epistemology in contrast with descriptive epistemology.The purport of creatructive epistemology originates from the activity of self creatruction(creation-construction),a concept of holistic construction of creating new things out of nothing.The creatructive activities based on big data show the development from understanding and changing the world to creatructing the world,which means not only an expansion from descriptive to creative cognition,but also an extension from descriptive to creatructive epistemology.

  关键词:大数据/创构/描述认识论/创构认识论/big data/creatruction/descriptive epistemology/creatructive epistemology

  标题注释:国家社科基金重点项目(17AZX003);教育部人文社会科学研究重大课题攻关项目(18JZD013)

 

  电子计算机的诞生,使认识论旨趣开始发生重要分化。基于计算机程序,人们提出了程式认识论(procedural epistemology);根据算法的发展,关于算法的哲学研究又提出了算法认识论(epistemology of the algorithm)。而作为创构活动的更高层次基础,大数据使程式认识论和算法认识论等共同认识论旨趣汇聚成同一发展进路,呈现出相对于描述认识论的创构认识论路径。

  一、大数据作为创构的基础

  信息科技的发展,使具有创生性和整体性的创构概念应运而生。[1]29创构不同于一般意义上的创造,它具有整体性,而且这种整体性趋向造世规模,这是以大数据和人工智能为标志的信息文明发展趋势;创构也不同于一般的建构,它具有创生性,创生是无中生有的创造,这与信息的本性密切相关。作为信宿和信源间的感受性关系,[2]信息与物能的根本不同,在于物能是守恒的,而信息却可以在物能基础上创生。创构意味着的整体性创生,只有在大数据基础上才成为可能。大数据基础上的创构不仅是一个物数据化和数据物化的过程,而且是数据通过虚拟技术等手段对象化的过程。

  人类文明伊始,我们面对自然界,就开始形成数据,甚至屈指数数、结绳记事和石子进位等就已经是物数据化的最原始方式,只是在漫长的人类文明发展史上,人们得到的都是小数据、样本数据。但是,即使再原始的数据,也意味着一个物数据化的过程。与物数据化过程相对应,人类实践中也早就有数据物化的过程,按照蓝图(不管是思维中的还是图纸上的)修建桥梁,根据图纸设计建造房屋等,就是最日常的早期典型例子。工程领域和所有物能性创造发明,都是与单纯描述不同的创建和构造活动,只是在大数据的基础上,具有创生性的信息具有越来越重要的地位,特别是3D打印的出现,数据物化及其与物数据化所构成的重要关系和机制才得以清晰呈现。事实上,物数据化和数据物化这两个过程可以构成一个双向循环,只是这个双向循环唯有在大数据基础上才能看得更清楚:一方面,我们朝着量化世界的目标走得越深入,物数据化和数据物化的双向循环就越完整;另一方面,这个重要双向循环越是完整,大数据就离我们越近,越具有整全性。

  大数据通常被看作规模大到传统数据库技术不能处理的数据集合,这是大数据的技术定义。但大数据不是一种单纯的技术,而是基于信息的存在。作为一个重要的基本事实,信息存在的重要性随着大数据的发展越来越凸显。在信息文明时代,信息存在具有与物能存在一样的存在论意蕴。

  信息科技特别是大数据的发展越来越清晰地表明,关于信息的研究,成了当代最基本的重要课题。由于信息成了必须在科学和哲学一体化发展中才能理解到位的复杂问题,关于信息的界定学界先后提出了一百多个定义,但仍未达成共识。而在一百多个信息的定义中,维纳的信息阐释,成了信息科学和哲学一体化研究的出发点。维纳将信息和物能并列,认为“信息就是信息,不是物质或能量”。[3]与物能并列的信息,不仅具有与物能同样的存在论意义,而且具有物能存在所不具有的本性。正是由于信息,大数据成了人类信息文明的基础。[4]作为信息文明的基础,大数据具有决定信息文明不同于物能文明的重要特性:规模整全性、实时流动性、结构开放性和价值生产性。

  大数据的规模整全性指的是大数据的“大”不是纯粹的量的概念,这个“大”的意味是全。大数据的“大”之所以远不仅仅是一个量的大小问题,是因为单纯的数据量大并不构成大数据与小数据的原则性区别。大数据与小数据的根本不同,在于其基本特征是趋向规模整全。大数据不仅意味着数据大,而且意味着维度全。大数据之所以维度全,就是因为大数据的获取只有最基本因而也是最少的在先预设。

  所有数据的获取都有在先预设,关键是在先预设的层次。在先预设的层次一方面取决于取样所设置目标的具体程度,另一方面取决于基本理论预设的层次。样本数据的获取都具有科学理论层次的在先设定,而大数据由于不必有像取样那样的具体预设,其在先预设一般都将基础确定于存在论层次,这是最基本的哲学层次。在先预设越基本,预设就越少,数据相应维度越全。虽然不存在完全意义上的全数据,就像不存在十全十美的事物,但以人类使用为标准,则可以就使用需要把大数据看作是趋向于全数据的存在。由此,在信息文明层次,大数据可以进一步看作不仅在规模上大到而且在维度上全到就使用需要而言的全数据。正是在这个意义上说,大数据与小数据的根本区别,就在于大数据不是根据预先设定的具体目的,由抽样形成的干枯数据标本,而是活的实时数据。抽样形成的数据,就像动植物标本,是干枯失活的。一张平面照片,角度和动作等都是固定的。而作为动态反映事物相互作用过程的数据流,大数据则具有与现实过程同步关联的实时性。

  实时性是大数据的另一个重要特性,这与技术设备的数据处理速度密切相关。对于人类来说,作为人类信息文明的基础,大数据的存在不仅取决于数据本身,而且取决于技术设备的数据处理速度,因为数据处理速度决定了实时数据流状态。在这个意义上,大数据涉及其与人类使用的关系,涉及大数据的人类使用。这是信息与物能甚至与人类直接相关的重要体现,也是人与世界联系更为密切的方面。样本数据在取样后就从现实世界割离开来,从而与现实进程没有了实时关联,而大数据则是实时数据流。在小数据时代,人们只是获取标本;而在大数据时代,我们所获得的则是一个生成的数据基础。正是高速流动的数据,为大数据提供了趋向与现实生活同步的过程性。数据流速是个至关重要的维度,它造就大数据的实时流动性。这种不是凝固而是自然生成的数据流,随着信息文明的发展,不仅越来越成为人类生存的直接基础,而且是一个面向人类发展不断扩大开放的世界。

  作为人类新的生存和发展基础,大数据还具有至关重要的结构开放性。大数据的结构开放性源自实时数据采集只有最基本的预设,正是这一特征使大数据构成信息文明的创构基础。随着信息科技的发展,大数据远不只是最初的文本,而是越来越多来自商业过程、机器、网络特别是像智能手机等移动设备那样的人和物、人和人乃至物和物的互动,包括电子邮件、照片、音频、视频和监视设备等。大数据来源和类型的多样性,所带来的不是我们在数据库时代所理解的结构化数据、半结构化数据和非结构化数据,而是结构开放的数据,这意味着数据结构的开放性。人类关于数据结构的认识,不是完全决定于数据本身,而是涉及大数据相关关系的理解。由于大数据的特点之一是数据太多但信息不足,大数据“难”在理解,因而数据挖掘与人的理解能力密切相关。正因为如此,大数据对于人类的关系和意义才那么复杂丰富,价值才那么与众不同。

  大数据的规模整全性、实时流动性和结构开放性,意味着大数据具有价值生产性,它构成信息文明的意义生产基础。作为大数据的技术理解,相对于取样数据价值密度低,数据挖掘是沙里淘金,但在哲学层次可以看到,大数据的意义与人的需要的关联性,决定了大数据的价值取决于价值生产,取决于人对大数据相关关系的理解,取决于人对大数据所反映的自身需要及其发展的理解,甚至取决于人对自身发展的选择。也正是这些,决定了大数据具有与人及其需要的重要关联,即大数据与人及其需要的发展内在相关的价值生产性。[5]正是大数据的价值生产性,构成了大数据之于人类的特殊存在论意义。

  大数据的规模整全性,对于既存具体事物的认识以及全新事物的创构,均具有量化的整体观照功能。大数据的结构开放性,为创构全新事物敞开了一个无限的可能性空间。大数据的实时流动性,则为创构全新事物、把握人类需要及其发展提供了现实的可能性和具体手段。正是规模整全性、实时流动性和结构开放性,造就了大数据特有的价值生产性,为创构全新事物奠定了价值基础。大数据价值的关键,就在它取决于人类对这一关系的把握:大数据相关关系组合与人的需要及其发展之间的关系。大数据时代一个新的存在论基础,就是大数据相关关系。

  大数据相关关系给人类提供了一个前所未有的平台,使之得以根据需要及其发展并基于相关关系而创构出新的硬件和软件,这就是创构世界的重要进程。在创构世界的过程中,其关键不再局限于人使用的工具和所处的环境,而是人本身的信息化,人越来越以信息的方式存在。[6]人本身和周遭世界的创构,必定生成一个新的世界层次,一个真正意义上的属人世界。这样在哲学层面就有了一个新的发展:从改变世界到创构世界。传统哲学主要强调人类能够认识世界,马克思特别强调人类能够改变世界。“哲学家们只是用不同的方式解释世界,问题在于改变世界。”[7]关于马克思这一观点的内在逻辑,我们可以作进一步展开:在信息文明时代,改变世界已经发展到创构的规模,或者说,我们今天不仅是在认识和改变世界,而且是在此基础上创构世界。

  从解释世界和改变世界到创构世界,这一发展的重要基础正是不同于物能的信息,不同于大自然的大数据。大自然是既存的天然基础,大数据是创生的创构基础。由于信息具有物能所没有的创生本性,大数据相关关系蕴含着创构世界比特层次的无限可能性空间。创构世界一方面在既存自然世界的基础上,另一方面又不是直接对既存物能存在的改造,而是基于物能存在的信息性创生,由此所发生的新的物能改造只是信息物化的结果。正是信息性创生,使大数据基础上的创构活动既不同于人类一直就有的物能建造,也不同于对既存对象的描述。

转载来源:中国社会科学网

未经允许不得转载:思问哲学网 » 大数据和创构认识论

分享到: 生成海报