
5个大数据分析中的隐私问题
数据消费者端经过数据所有者授权,对数据具有使用权。为了扩展云服务器产品的推广和销售,服务提供商常提供一些免费的云服务器试用,可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务,例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷,那么就会造成大数据分析的预测和结论并非完全准确。在数据输入阶段
1. 数据输入阶段的原始数据隐私可能泄露
在数据输入阶段如果对敏感信息不采取标记和去隐私处理,那么有关个体的私人信息可能会被服务商窃取,就会造成输入阶段隐私泄露。
2. 云服务提供商鱼龙混杂不可信
为了扩展云服务器产品的推广和销售,服务提供商常提供一些免费的云服务器试用,可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务,例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。服务质量在选择时难以评判。
3. 数据消费者往往可以获取到隐私数据
数据消费者端经过数据所有者授权,对数据具有使用权。他们可以直接访问部署在云平台的服务,也可以向云平台提交自编程的应用程序请求计算服务。比如个性化服务场景,用户允许服务提供商收集个人信息,以获取更精准的推荐服务等。这时他们可能可以推断出隐私数据,或以个人行为引起隐私泄露。
4. 多种可获取数据的渠道使屏蔽数据也会泄露个人信息
如果数据屏蔽没有得到恰当的使用,大数据分析很容易揭示数据被掩盖的实际个体。例如90年代中发生再美国马赛诸塞州的隐私泄露事件,破解者利用未被屏蔽的关键字段,加上其他有效资源成功匹配出了数据。
5. 大数据分析并非100%准确
如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷,那么就会造成大数据分析的预测和结论并非完全准确。这样的情况下大数据可能会做出错误或不适当的判断、甚至对使用者造成伤害。比如拒绝为使用者提供某项服务、误诊、或标签化个人。
基于以上,首先在商业使用中,必须将隐私安全纳入流程;也需要不断升级技术途径进行计算或抵抗攻击。
参考文献:
大数据环境下的隐私保护技术. 中国网信网.
Rebecca Herold. 大数据分析所面临的10个最重要的隐私风险. 腾讯云.
钱文君,沈晴霓,吴鹏飞,董春涛,吴中海. 大数据计算环境下的隐私保护技术研究进展[J]. 计算机学报.
更多推荐
所有评论(0)