但是在大数据分析的过程中,跟安全是不是有些冲突?哪些数据可以分析?哪些数据、哪些人可以用来进行分析?展现或者是分析的力度到底是什么样的?大数据和安全之间如何选择一个有效合理的平衡点?
第四,数据安全的管理。可能最初的时候大家做一个两个、十个八个系统,可以很清楚地说清楚我的数据在哪里?应用谁来管?当你的系统发展成100个、200个,甚至我们的规模已经超过500个系统之后,没有人真的能说清楚各个应用系统之间数据是什么关系。
我的数据如何流转,应该如何保护?当面对这么大的变化的时候,怎么样才能够进行有效的落地,我相信很多这类的问题,各个公司都会遇到。
顺丰还有有两个特点:首先,顺丰员工差不多有40万人,分布在全球50多个国家和地区,尤其在大陆的人员是最多的。同时,因为行业本身的问题,从大家有印象开始,实际上你自己的信息,寄方的信息都是在运作的过程中必然被员工接触到的。
它不像别的行业,这个数据是保密的,可能只有几个人能接触到。当你接触到快递的时候,你会发现客户隐私和整个的运作是息息相关的。面对这种挑战如何解决这种问题?
刚才也提到了大数据上的风险,最后当你想解决这些数据安全带来的问题的时候你会发现,针对结构化的数据如何去保护?业界能够发现的方案或者是能够使用的方案,一是比较匮乏,二是成本可能会很高。当面临这些问题的时候如何选择?
其实我们在众多的安全目标里面,今天就选择了一个跟大家做一个分享。我们很重要的一个目标,就是要实现客户的隐私数据,尤其是电话号码,在整个生产运作环节中是对员工不可见的。
大家可能觉得这个事情很小,但是你想想我们有500套系统超过40万员工,又有行业本身的特点,这件事情如何去做?这件事情想要治本,一定要回到最基础的部分:一是业务,第二就是数据本身。
我们罗列出来的这个流程实际上是一个快递公司非常基本的过程,前面有下单、收件,中间有收派和售后,还有三线的运营过程,我们按照业务流程,以及业务如何改造,系统端如何改造,介绍一下顺丰在落地过程中做的事情。
创新快递单
很多朋友应该非常熟悉这种四连单,这是几年前邮政或者快递行业通常使用的模式,大家所有的信息都是记在这张单上的,寄方信息、你的信息、保价信息、个人签名都在上面。
我们在做最早的数字化的时候是在做什么?按照标准的流程是手写下单,进行相关的扫描,然后有一个非常重要的环节就是要人工录单,把所有快递单的数据要及时录到系统中。相当于白天取完件,马上有业务员把它做批量的扫描,扫描件会给到后面的输单人员,进行数据的传输。
那个年代开始顺丰就已经很客户的隐私,怎么保证一张运单不会被任何一个人拿到中间完整的信息,从而做一些欺骗或者是诈骗的行为?这张图上写了很多编号,代表着这张图在扫描之后,当时就在上面可以拆成十块,每一张扫描图自动会被拆成十个部分,十个部分给不同的供应商负责数据的录入,相当于没有任何一家可以看到完整的面单。这是顺丰在纸质面单时代采用的办法。
为了完成这件事情,有300多家供应商、几千人在负责输单。我们跟腾讯合作的第一件事情,就是所有手写的汉字自动化输入、自动化识别。结合OCR的技术,以及顺丰在地图、地址上的能力,基本可以做到手写的地址以及信息识别率达到99%以上,来解决人在中间参与可能接触到数据带来的风险。
然后,顺丰是第一家推出二维码扫码寄件的公司,在这之后电子面单就成了大家现在看到的快递包裹上的主流形式。左图的面单是2017年发布的顺丰的“丰密面单”,做这个事情的目的非常简单,就是在一张能打出来的面单上,收方、寄方通过信号脱敏处理,包括小哥在日常处理过程中,包括客户在处理剩余面单纸的时候,不会出现电话号码的泄密。
发布之后的一年,2018年8月8号就出现了右边的这块业务,如果大家拿出手机在里面选顺丰速运的话,会发现其中有一个选项叫“隐址件”。