English
您所在的位置:首页>马克思主义基本原理

张建云:互联网时代大数据的本质分析——基于马克思主义的视角

发布时间:2021-06-07
字体: 打印
分享:

                     

         

 

当今时代,没有哪一项科技成果能与互联网技术体系相比给人类带来如此广泛而深刻的变革。互联网技术体系包括大数据、互联网、云计算、区块链及智能机器等一系列新技术,其中大数据是基础和核心要素。“巧妇难为无米之炊”,没有数据就没有了一切。互联网时代的数据即大数据,它是人类社会数据积累从量变到质变的必然产物。立足于马克思主义视角,探讨互联网时代大数据的本质、特性、价值及其给社会生产生活带来的变革,无疑具有重要的意义。

 

一、大数据是在线的数字化信息

互联网时代大数据就是在线的数字化信息,而信息在人的实践活动中具有根本性意义,它是人的实践活动成功的内在的必要条件。

(一)信息在人的实践活动中的根本意义

什么是信息?总体上说,信息就是主体对客体的反映结果,包括人们对客观世界(包括自然界、人类社会和人自身)的一切反映结果,是人们的感觉、知觉、记忆、表象、思维等一切意识形式的活动结果,它借助于语言、文字、符号、代码以及声音、气味、表情、行为、情绪情感等来表达,通过一定的物质载体或能量载体来传递,表现为信号、消息、知识等等。

从生成机制看,信息的生成过程就是主体对客体的反映过程,而反映开始于感觉。感觉是神经系统对客观事物的个别属性的反映,感觉是人类一切知识的唯一来源,是对客观世界认识的开始。列宁指出:“不通过感觉,我们就不能知道实物的任何形式,也不能知道运动的任何形式。”感觉器官是外界进入意识的惟一通道。没有感觉器官,外界信息就不能进入人脑,人也不能了解自己身体的状态,人会像动物一样无法生存。因此,正常经验到的各种感觉信息的输入是动物和人的正常活动所必需的;认识环境从而获得基本信息是人的一种比物质享受更迫切、更强烈的本能需要。

实践活动是人的自觉的有目的有计划的活动。在实践中,人们总是根据对相关信息的尽可能全面把握,来进行具体改造活动。有能力的主体只有掌握了这些信息,才能决定自己的活动如何展开才能取得最大效益。感觉以及在此基础上形成的知觉、记忆、表象、思维等意识活动形成的各类信息是人的实践活动成功的内在条件,贯穿在人的实践活动中的全过程。人们获得的外界信息越多、越全面、越准确,人们藉此作出正确判断的能力也就越强,人的实践活动也就越容易成功。相反,获得的信息越少、越模糊,判断越难,实践活动也越容易失败。信息是保证实践活动成功的必要条件。

(二)大数据的产生

1、大数据概念的由来

数据并不是一个新概念,人们很早就在“数值”意义上使用这个概念了。《现代汉语词典》中关于数据的定义是:“进行各种统计、计算、科学研究或技术设计等所依据的数值。”传统意义的数据是由记数、测量而得来的数值,作为“数量”而存在,它追求精确,人们通过对这些数值的统计、计算、研究、分析等来获取新的有价值的结论。“大数据”概念保留了传统“数据”的核心内涵,即大数据也是用于统计、计算、分析、研究等,以此获取新价值。但是,相比传统“数据”,大数据的内涵发生了质的变化。被誉为“大数据时代的预言家”的英国教授维克·托迈尔-舍恩伯格认为,大数据中的“大”,一是指全部的数据(而不是样本数据),二是指纷繁的数据(而不是精确数据),三是指相关的数据(而不是因果数据)。

与传统“数据”概念相比,大数据之“大”首先直观表现在量上:在互联网时代,一切皆被记录,一切皆是数据,数据体量呈现指数级爆炸式增长。特别是近两年,海量数据的增长量更是惊人,据著名咨询机构IDC估测,人类在最近两年产生的数据量相当于之前产生的全部数据量之和;并且这还仅仅是开始!其次,大数据之“大”还表现在种类上,大数据类型除了事先定义好的结构化数据(由二维表结构来逻辑表达和实现的数据),还有大量的非结构化数据(无法用二维表结构来逻辑地表达和实现的数据),如音频、视频、照片、图像、所有格式的办公文档、文本、各类报表等等。大数据的海量的数据规模、快速的数据流转、多种类表达方式,是传统数据概念所没有的。大数据的内涵无论从量上、种类上还是从深度上,都超越了传统数据概念,已不仅仅是某种“数值”,而是提升为“信息”。大数据是被数字化的信息。

2、信息数字化:大数据产生的前提和基础

数据是信息,但不是所有的信息都是大数据,只有数字化的信息才会是大数据。

生活中,一个人获得的信息是极为有限的,为了获得更全面、更准确的信息,人们之间需要交流。信息交流既包括同时代人们之间的交流,也包括今人与古人的交流;既包括人们之间此时此地的当下交流,更大部分是彼时彼地的非当下交流。非当下的信息交流需要物质载体,物质载体的性质决定了信息交流的广度和深度。

人类社会早期,人们将内涵信息的记数、符号、图画、文字等刻画或书写在甲骨、兽皮、竹片等上面来传递、交流信息。其后,造纸术的发明使信息的载体摆脱了自然状态,进入到了技术创新时代,极大促进了人类信息的传播和交流。但是纸质载体并没有使人类摆脱信息传递和交流的此时此地的当下性,当下信息只能通过驿送、信鸽等经过一段时间、费尽一些周折才能传递到别的地方。信息传递的非即时性、非当下性是一直困扰人们的难题。

电发明后,人类开始了用电作为信息载体的历史,信息的电子化使人类信息传递与交流开始进入到“即时”时代。信息电子化是从电报的发明开始的,是由美国画家摩尔斯发明的。当摩尔斯最早听说“不管电线有多长,电流都可以瞬间通过”时,就想到可以利用电流来异地即时传递信息,进而发明了“摩尔斯电码”。在此基础上,人们发明了模拟信号,将大自然中各种物理信号,如声音、温度等通过各种传感器转换成电信号传输出去。20世纪70年代以后,人们开始用数字信号来代替模拟信号,数字信号可以很方便地连接到计算机上,电脑就可以处理这些数据了。由此,纷繁复杂的现实世界就可以计算、可以度量,可以量化分析。信息的数字化使人类社会进入了大数据时代。

3、移动互联网使传统数据成为大数据

数据之成为大数据是计算机、互联网的发明和普遍使用的结果。

计算机的发明起源于人们计算的需要。数字化的信息在计算机上不仅可以进行数值计算、逻辑计算,还具有存储记忆等功能,已经成为自动、综合、高速处理海量数据的智能电子设备。

互联网的发明源于人们交换、共享数据信息的需要。互联网是将计算机技术与通信技术相结合的技术;数字化信息借助计算机互联网带来了人类知识与智慧的第一次大爆炸。目前,互联网经历了两个发展阶段:传统互联网与移动互联网。传统互联网只有在与网络线路相连的计算机上才能上网,否则就处于离线状态,而离线状态下人与世界就是分离的。移动互联网使数据在线成为现实,在线意味着人与世界是一体的,人的一切活动可以随时随地成为数据,万物互联,一切连接一切,海量数据即时即地产生。

大数据的价值是在信息共享和交流中生产的。而数据只有在线才能实现真正大规模、全面的共享与交流。“从本质上来说,连上互联网意味着你和全世界的服务器连接了,而手机在线意味着你和全世界的人连接了。一个是和一台计算机连接,一个是和全世界的服务器与人连接,二者的意义完全不同。”移动互联网不仅是收集、处理、获取信息的工具或者渠道,而且更是人们自由自在地交流和共享信息的平台;信息不再仅仅是“死的”不动的数据,而成为“活的”能创造价值的资源。在线使数字化的信息成为大数据,大数据就是互联网时代在线的数字化信息。

(三)云计算与大数据的价值

大数据的价值不在于其本身,而在于“使用”。“数据价值的关键是看似无限的再利用,即它的潜在价值。收集信息固然至关重要,但还远远不够,因为大部分的数据价值在于它的使用,而不是占有本身。”所谓使用,就是通过对海量大数据的统计、计算、分析、整合等获得有价值的新信息。这个有价值的新信息的产生源于数据信息交流、分享的创造。人的意识不同于动物,人具有概念、判断、推理等的思维能力,因而人们在交换、分享信息的过程中,会将他人的信息融合到自己已有的信息中,根据自己的需要进行观念再造,创造一个比原来的信息量更大、更有价值的新信息。这就是大数据的价值产生之源。

但是,面对互联网时代的海量大数据,任何一个人、任何一台计算机的计算、分析能力都是有限的,力不从心,无法胜任。互联网时代大数据的计算、分析是通过云端(即云基础设施)提供的服务来实现的。云计算本质上源自超大规模分布式计算,融合了虚拟化技术、海量数据存储和管理、分析技术等,通过互联网将计算结果以服务的方式提供给用户使用,从而使用户能根据自己的需要获取信息服务。通过云计算,人们就能够方便、快捷、低成本地使用数据信息资源。

今天接入云就如同过去我们说插上电借助云计算分析,海量在线大数据变成如同电、水、石油等一样的有价值资源,进入到了人们的生产和生活中,成为人类实践活动必不可少的条件,成为互联网时代最重要的生产资料。

 

二、大数据是互联网时代的新生产资料

当前,互联网业界达成了一个基本共识——大数据是一种新型生产资料。“我们正在进入一个新的资源整合的时代,这个时代的核心资源已经不仅仅是石油,还包括大数据的管理、分析和应用。” 大数据是一种什么样的生产资料?

(一)马克思劳动过程“简单要素”的内涵

1、劳动过程“三要素”

在《资本论》第一卷第五章讲劳动过程时,马克思指出:“劳动过程的简单要素是:有目的的活动或劳动本身,劳动对象和劳动资料。”表明,劳动过程三要素包括劳动者的劳动、劳动对象和劳动资料。

劳动对象是指在劳动过程中被加工的对象,马克思指出:所有那些通过劳动只是同土地脱离直接联系的东西,都是天然存在的劳动对象,而“已经被以前的劳动可以说滤过的劳动对象,我们称为原料。”

劳动资料是指的人们在劳动过程中使用的工具、手段、途径、方式和方法等等。马克思指出:“劳动资料是劳动者置于自己和劳动对象之间、用来把自己的活动传导到劳动对象上去的物或物的综合体。”  表明劳动资料是改造对象的一系列物质工具体系,它是衡量生产力发展的测量器,也是劳动借以进行的生产关系的指示器。这实际上是狭义的劳动资料概念。

生产资料是劳动资料和劳动对象二者的统称。马克思指出:“如果整个过程从其结果的角度,从产品的角度加以考察,那么劳动资料和劳动对象二者表现为生产资料,劳动本身则表现为生产劳动。”

 2、生产资料“三要素”之外的其他要素

马克思讲劳动过程时首先说明:“劳动过程首先要撇开每一种特定的社会的形式来加以考察。”也就是在撇开社会生产关系因素后,劳动过程由三个要素构成,即劳动对象、劳动对象和有目的活动,这是任何劳动过程本身必备的“简单要素”。因此,所谓“简单要素”,是指最一般的、最抽象、最具有普遍意义的要素,是任何社会生产都不能缺少的最低限度的要素。这是马克思着眼于整个人类社会历史的发展,强调从原始社会、奴隶社会、封建社会、资本主义社会直到未来社会的生产劳动,都离不开这三个简单要素。忽略“简单”一词,将这“三要素”等同于劳动过程的全部要素,这种理解显然是错误的。

马克思指出,劳动过程不仅包括最基本的三要素,随着社会生产的不断发展,劳动过程中会增加新的要素,如分工、协作、管理、科学技术进步等等。正如马克思指出:“就劳动过程只是人和自然之间的单纯过程来说,劳动过程的简单要素是这个过程的一切社会发展形式所共有的。但劳动过程的每个一定的历史形式,都会进一步发展这个过程的物质基础和社会形式。”也就是说,随着社会生产的发展,劳动过程会相应增加新的要素。马克思多次谈到过:分工、协作、科学技术、管理等要素在生产中的重要作用,例如:“增加劳动的生产力的首要办法是更细地分工,更全面地运用和经常地改进机器。”再如:“科学这种既是观念的财富同时又是实际的财富的发展,只不过是人的生产力的发展即财富的发展所表现的一个方面,一种形式。”马克思强调分工、协作提高生产力、科学技术也是生产力、改善管理可以发展生产力等等。

(二)大数据作为信息属于广义的劳动资料范畴

劳动资料是不是只包括人们制造的物质工具体系即马克思在狭义的劳动资料概念中所定义的“物或物的综合体”呢?不是的,马克思提出了“广义的劳动资料概念”。在1861-1863年的《经济学手稿》中,马克思就曾提出:“与劳动材料不同的劳动资料不仅包括生产工具、即从最简单的工具或容器到最发达的机器体系,同时也包括物的条件,没有这些条件,劳动过程就根本不可能进行,例如用来进行工作的房屋,或用来播种的土地等等。它们不直接加入劳动过程,但它们是条件,没有它们,劳动过程就不可能进行,因而它们是必要的劳动资料。它们表现为全过程得以进行的条件,而不是表现为过程内部起作用的因素。”也就是说,凡是劳动过程必须的条件,——即没有这些条件劳动过程就不可能进行,这些条件都属于劳动资料的范畴。正如前文中强调的,信息是劳动过程的必要条件。信息不同于科学技术、管理、分工、协作等。科学技术、管理、分工、协作等是社会生产力发展到一定阶段的产物,是劳动过程内部起作用的因素。而信息则是人类一开始劳动、从制造第一把“石刀”起就必须具有内在条件,是贯穿在人的活动全部过程的客观的物质条件,是劳动一开始就必须具有的必要条件。

当然,信息的价值和根本意义并不是一开始就被人们普遍认识到的,而是随着生产力的发展、科学技术的进步而逐渐被认识到的。尽管在当时生产力条件下,马克思、恩格斯没有明确指出信息是生产资料,但是在谈到劳动资料时他们明确强调,广义的劳动资料还包括劳动过程正常进行所需要的一切物质条件。在《资本论》中,马克思再次强调:“广义地说,除了那些把劳动的作用传达到劳动对象、因而以这种或那种方式充当活动的传导体的物以外,劳动过程的进行所需要的一切物质条件也都算作劳动过程的资料。它们不直接加入劳动过程,但是没有它们,劳动过程就不能进行,或者只能不完全地进行。”注意!马克思这里所说“物质条件”中的“物质”,并不是指物质实体,而是指物质的根本特性即客观实在性。也就是说,劳动过程正常进行所需要的一切不以人的意志为转移的客观条件,都属于生产资料范畴。尽管信息不属于充当活动的传导体的物,但是信息属于劳动过程中必不可少的客观条件。没有信息,人们改造客观对象的活动就不能正常进行,或者用马克思的话说就是“只能不完全地进行”。

综上,我们说,互联网时代大数据作为信息是新的生产资料,这是符合马克思关于生产资料的定义的。

有人认为,人类历史上每一次生产力的重大突破,都会发生针对核心生产资料的争夺甚至战争,但目前还没有迹象表明,人们会为数据的控制权而发生激烈争夺,所以大数据还没有达到最重要生产资料的战略高度。——实际上,这是从狭义上理解生产资料、因而把大数据等同于传统生产资料而得出的结论。事实上,大数据作为生产资料根本不同于物质形态的生产资料,它有自身的独特性。

三、大数据生产资料的独特性及其现实意义

大数据是21世纪的石油,是21世纪最重要的生产资料,但大数据不同于石油,它有不同于传统资源的独特性。这一特殊的生产资料给人类的生产、生活带来了革命性变革。

(一)大数据生产资料的独特性

大数据生产资料的独特性包括以下几个方面。

1、非现实性

大数据作为在线的数字化信息,以计算机等物质设备为载体,但它不同于物质实体本身。控制论的奠基人维纳指出:“信息就是信息,不是物质也不是能量。”这个定义实际上把信息与物质存在进行了划界。大数据作为信息,不同于石油等物质实体资料,它即不是物质也不是能量。大数据信息本质上是对物质实体世界的反映,因而是一个观念世界,是非现实世界。在“物质与意识”这对范畴中,大数据属于“意识”范畴,因而是第二性的存在。数字化信息再真实,也不是物质实体世界本身;数字照片再清晰,也不是本人;数字视频再全面,也不是现场。当然,真实的数据总是对现实世界的准确反映,数据越是符合对象本身,越是正确地反映了客观世界的本质和规律,也越是可靠的信息。

2、分享增值性

你有一桶石油,我有一桶石油,我们交换,各自获得的还是一桶石油;你有一个数据信息,我有一个数据信息,我们交换,各自都将获得一个比原来的信息量更大、更有价值的新信息。因为大数据作为信息具有非现实性,属于人的思想、观念范畴。在信息交换中,人们总是根据自己的利益和需要把对方提供的信息中有用的部分融合到自己的信息中,形成一个更大更有价值的新信息。因此,信息(数据)的交换、分享不同于物品的交换、分享;物品交换、分享会造成价值减少,而信息交换、分享后,将获取一个比原来的信息量更大、更有价值的新信息。数据信息分享越多,其价值也就越大。因此,信息(数据)具有天然的共享性,数据共享会带来更大的价值。

3、非稀缺性

地球上的石油等自然资源数量是有限的,用一点儿少一点儿。而大数据是由人生产的,可以源源不断地再生。随着互联网、云计算、区块链等技术的不断发展,数据的形成、存储、传输、交流、共享以及计算、分析、使用等既方便又快捷。数据的非现实性特点,使数据在分享、交换过程中能够创造出比原来更大的价值,而云计算技术使交换、共享的数据计算、分析、使用既方便快捷又低成本,从而使数据成为可以反复使用的、取之不尽的新资源。数据越是交流、共享,数量越是增加;数据越是计算、分析、使用,越是有价值。因此,大数据不同于石油等自然资源,不会越用越少,只会越用越多。数据越是使用,越有价值,越能创造价值。地球上的石油等自然资源是有限的,石油终有资源枯竭的时候;而大数据近乎无限。可以说,大数据信息资源真正是取之不竭、用之不尽的资源。

4、非排他性

表现在:一方面,数据可以同时或者非同时地为多个主体使用。同一桶石油,你用了,我就没有用的了;但是同一堆数据,你用,我也可以用,大家可以一起使用。数据不同于石油,并不是你多使用一点儿,我就得少占用一点儿。正相反,数据必须共享和流动,必须使用;只有在使用中,数据才会产生价值。数据的管理很难做到中心化,因此谁都有可能获得数据、使用数据。另一方面,数据的非排他性还表现在,同一个数据可以反复使用。石油等自然资源用完了,消耗掉了,就没有了;但数据并不是使用过了之后就没有了,而是可以不断重复使用,用作各种不同的用途。

综上可见,大数据是根本不同于传统资源的全新生产资料,它推动互联网生产力发生质的飞跃,也必将给人类社会生产和生活带来根本改变。

(二)大数据生产资料的价值及其现实意义

第一,大数据促进生产与消费的一体化

在前互联网时代,由于缺乏信息的即时即地互联互通,生产与消费是两个被分隔的领域,需要经过中介商人才能将两个领域联通。因为信息获取成本高,数据有限,企业决策等生产活动往往是由高层领导依赖个人经验和直觉判断,所以决策失误是常见的事;同时,对消费者来说,由于缺乏信息,消费者也很难直接找到生产者的产品满足需要。需求方和服务方的信息不对称导致生产与消费两个领域的分离和对立。在互联网时代,大数据使人们获得信息日益方便快捷又低成本,使生产者与消费者之间实现信息的无限互联互通,从而日益促进生产与消费的一体化。在大数据互联网时代,海量在线数据信息可以通过数据整合、加工、分析,得出一个客观、正确的决策;大数据无限提高了人们的预测水平,使决策量化,使人们对自己未来的行动都尽在掌握之中,提高人的活动的自主性,减少盲目性。同时,大数据互联网也日益为消费者直接参与生产创造条件,提供技术支持。因而,在大数据互联网条件下,生产者日益实现按需生产、消费者日益实现直接消费,生产与消费日益一体化,按照需要进行计划生产将成为现实。

第二,大数据生产资料将从根本上促进经济创新发展

互联网时代大数据作为生产资料具有非现实性、分享增值性、非稀缺性和非排他性,决定了数据(即信息)的最大价值在于因共享而创造新价值。正如有学者指出的:“大数据的真正意义还在于大价值,价值主要是通过数据的整合、分析和开放而获得。大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来‘大知识’、‘大科技’、‘大利润’和‘大智慧’等发展机遇。”大数据的根本价值在于信息共享带来的创新,大数据的共享性将从根本上促进经济的创新发展。在互联网时代,数据创新驱动将超越资本驱动,成为经济发展的新引擎。大数据创新、价值的增加必将突破传统经济的线性增长模式,取而代之的是非线性增长模式。

第三,大数据日益促进各业融合,推动互联网生产力质的飞跃发展推动社会生活发生根本改变。大数据借助互联网,渗透进传统各行各业之中。“连上网”、“接入云”正在使传统的农业、工业、服务业、知识业等产业发生翻天覆地的变化,从根本上促进传统制造业转型升级,提高效率,创造更大的财富。同时,各种资源和能力实现“云化”之后,能实现大范围匹配后的精准分配或科学分工,将更好地实现“人尽其才,物尽其用”。

如今,大数据不仅融入到经济生活、产业发展各个领域,而且渗透到社会生活、政治生活、文化生活方方面面,电子商务、移动支付、远程医疗、云办公、健康码、在线教育、共享用工等等日益兴起并被人们普遍应用,日益推动构建建立在大数据互联网基础上的现代生产体系和治理体系,提高效率,全面促进生产力的快速发展,促进社会的全面进步。

 

网络编辑:保罗

来源:《兰州学刊》2020年第8