特别是,随着万物互联网与人工智能技术的融合发展,个性化算法和机器学习的应用已取得巨大进步,能为用户提供丰富多彩的智能新媒体服务,但也引起了人们对隐私、技术透明性和人为控制的强烈关注。一是健康类应用程序可能带来的个人隐私伤害,医疗大数据中的个人隐私问题,人类基因数据共享可能带来的隐私风险。二是在万物互联网的智慧城市应用场景中,房屋、汽车、公共场所和其他社会系统正在被不断地相互连接,人们的位置和活动数据被收集和利用。这些数字应用有望显著改善医疗保健、运输服务、公用事业和环境健康。不过,这些效率和服务改进的代价是增加了隐私漏洞和风险。三是数字设备(机器)之间通讯和数据交换带来的个人数据安全问题被广泛关注。智能手机是使用最广泛的电子设备,具有整合和连接万物的功能。但当前的智能手机管理用户敏感数据的能力明显不足,用户的数据常常被过度收集。数据过度收集,意味着智能手机应用在许可范围内收集用户数据的能力超过了其原始功能,正在迅速成为万物互联网时代最严重的潜在安全隐患之一。
但现有成果暂未开展万物互联网时代的个人数据安全和隐私问题的系统性研究。本文拟探讨和回答三个问题。一是万物互联网时代个人数据的内容和结构如何?二是个人数据在万物互联网中是如何传播的,将对个人的隐私安全带来哪些威胁?三是我们应该如何防范万物互联网环境下个人数据的泄露和滥用风险?为此,本文的第一部分将建构万物互联网环境下的个人数据内容结构;第二部分将探讨个人数据在万物互联网中的云传播机制;第三部分拟分析个人数据在云传播过程中的隐私安全隐患;第四部分拟探讨万物互联网时代个人数据的隐私保护机制。
01 万物互联时代个人数据的内涵和结构
万物互联网的本质是“连接一切”,在此过程中也在向“采集人的一切数据”方向发展。在万物互联网环境下,个人数据的内涵和结构正在被不断扩展。个人数据涵盖原始的机器数据和元数据,以及关于抽象性的个性特征表征数据。根据安全级别,将个人数据划分为一般个人数据和敏感个人数据。但关于个人数据到底包括哪些内容,众说纷纭,特别是万物互联网环境下,个人数据具有什么样的结构还未定论。这是进一步分析个人数据的安全和隐私问题的重要前提。
从信息科学视角看,个人数据可被定义为描述自然人的属性、运动状态及其变化方式的数据。个人数据本身是客观存在的,随着技术的进步,越来越多的个人数据被数字化的采集和存储。在一定程度上,个人数据的聚集能形成一个完整意义的“数字个人”。我们讨论的个人数据常常是指数字化的个人特征和行为,也即个人数据的本质是“数字个人”的数据。“数字个人”的数据主要由表征个人自然属性特征的数据和表征个人行为属性特征的数据构成。但人类还不可能感知和采集所有的自然人数据。
表征个人自然属性特征的数据。
自然人属性数据主要用于描述“这个自然人到底是谁”,主要包括自然属性数据、精神属性数据、社会属性数据。自然属性主要描述物质世界中的“人”;精神属性主要描述精神世界中的“人”;社会属性主要描述现实社会中的“人”。
1.自然属性数据。自然属性数据主要用户描述人的生理特征、肉体特征和健康状况的数据。在传统社会环境下,人的自然属性特征基本属于隐私范畴,较少被数字化采集,但在基于人工智能的万物互联时代,人类的生理特征和肉体特征越来越多地被数据化。当前已经或正在被数字化的个人数据包括:人脸数据、人体数据和指纹数据。从普遍意义上而言,构成“生理人”的全部人体器官都有被数字化的趋势。人脸识别技术和人体识别技术的发展使得人类能够感知和采集越来越多的人脸数据和人体数据。
现有的人脸识别系统主要用于对人脸的属性判别,能识别的人脸数据主要包括人脸框、人脸的关键点信息,人脸的姿态估计、人脸的自然属性(性别、年龄、种族、微笑、颜值,是否带墨镜,是否带眼镜,人脸是否遮挡,是否有胡子),以及人脸的情绪(惊讶、高兴、悲伤、生气、平静)等属性的分析。