1. 数据输入阶段的原始数据隐私可能泄露

在数据输入阶段如果对敏感信息不采取标记和去隐私处理,那么有关个体的私人信息可能会被服务商窃取,就会造成输入阶段隐私泄露。

2. 云服务提供商鱼龙混杂不可信

为了扩展云服务器产品的推广和销售,服务提供商常提供一些免费的云服务器试用,可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务,例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。服务质量在选择时难以评判。

3. 数据消费者往往可以获取到隐私数据

数据消费者端经过数据所有者授权,对数据具有使用权。他们可以直接访问部署在云平台的服务,也可以向云平台提交自编程的应用程序请求计算服务。比如个性化服务场景,用户允许服务提供商收集个人信息,以获取更精准的推荐服务等。这时他们可能可以推断出隐私数据,或以个人行为引起隐私泄露。

4. 多种可获取数据的渠道使屏蔽数据也会泄露个人信息

如果数据屏蔽没有得到恰当的使用,大数据分析很容易揭示数据被掩盖的实际个体。例如90年代中发生再美国马赛诸塞州的隐私泄露事件,破解者利用未被屏蔽的关键字段,加上其他有效资源成功匹配出了数据。

5. 大数据分析并非100%准确

如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷,那么就会造成大数据分析的预测和结论并非完全准确。这样的情况下大数据可能会做出错误或不适当的判断、甚至对使用者造成伤害。比如拒绝为使用者提供某项服务、误诊、或标签化个人。

基于以上,首先在商业使用中,必须将隐私安全纳入流程;也需要不断升级技术途径进行计算或抵抗攻击。

参考文献:

大数据环境下的隐私保护技术. 中国网信网.

Rebecca Herold. 大数据分析所面临的10个最重要的隐私风险. 腾讯云.

钱文君,沈晴霓,吴鹏飞,董春涛,吴中海. 大数据计算环境下的隐私保护技术研究进展[J]. 计算机学报.

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐