5个大数据分析中的隐私问题

数据消费者端经过数据所有者授权，对数据具有使用权。为了扩展云服务器产品的推广和销售，服务提供商常提供一些免费的云服务器试用，可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务，例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷，那么就会造成大数据分析的预测和结论并非完全准确。在数据输入阶段

魏直都宣你

1147人浏览 · 2023-03-21 09:26:23

魏直都宣你 · 2023-03-21 09:26:23 发布

1. 数据输入阶段的原始数据隐私可能泄露

在数据输入阶段如果对敏感信息不采取标记和去隐私处理，那么有关个体的私人信息可能会被服务商窃取，就会造成输入阶段隐私泄露。

2. 云服务提供商鱼龙混杂不可信

为了扩展云服务器产品的推广和销售，服务提供商常提供一些免费的云服务器试用，可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务，例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。服务质量在选择时难以评判。

3. 数据消费者往往可以获取到隐私数据

数据消费者端经过数据所有者授权，对数据具有使用权。他们可以直接访问部署在云平台的服务，也可以向云平台提交自编程的应用程序请求计算服务。比如个性化服务场景，用户允许服务提供商收集个人信息，以获取更精准的推荐服务等。这时他们可能可以推断出隐私数据，或以个人行为引起隐私泄露。

4. 多种可获取数据的渠道使屏蔽数据也会泄露个人信息

如果数据屏蔽没有得到恰当的使用，大数据分析很容易揭示数据被掩盖的实际个体。例如90年代中发生再美国马赛诸塞州的隐私泄露事件，破解者利用未被屏蔽的关键字段，加上其他有效资源成功匹配出了数据。

5. 大数据分析并非100%准确

如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷，那么就会造成大数据分析的预测和结论并非完全准确。这样的情况下大数据可能会做出错误或不适当的判断、甚至对使用者造成伤害。比如拒绝为使用者提供某项服务、误诊、或标签化个人。

基于以上，首先在商业使用中，必须将隐私安全纳入流程；也需要不断升级技术途径进行计算或抵抗攻击。

参考文献：

大数据环境下的隐私保护技术. 中国网信网.

Rebecca Herold. 大数据分析所面临的10个最重要的隐私风险. 腾讯云.

钱文君,沈晴霓,吴鹏飞,董春涛,吴中海. 大数据计算环境下的隐私保护技术研究进展[J]. 计算机学报.

永洪数据分析社区

永洪科技，致力于打造全球领先的数据技术厂商，具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐

销售数据分析方法、如何写好一个专题分析报告、Hive大数据知识体系教程、大数据分析平台总体架构方案……| 本周精华...

▲点击上方卡片关注我，回复“8”，加入数据分析·领地，一起学习数据分析，持续更新数据分析学习路径相关资料~（精彩数据观点、学习资料、数据课程分享、读书会、分享会等你一起来乘风破浪~）回复“小飞象”，领取数据分析知识大礼包。关注微信公众号：木木自由，更多产品、运营与数据分析干货以及经验分享【数据分析-领地】知识星球，每周会产生大量精华内容，每周将整理《数据分析-领地：一周星球内参》，让你不错过任何一

永洪数据分析社区

Web报表软件的集成方案

报表开发只是应用程序中的一部分，而非全部，因此Web报表软件的集成性就显得非常重要了。　传统的Web报表软件无一例外地都提供了一个独立的报表服务器。采用独立服务器时的，应用结构如下图：　采用独立服务器的不便：• 独立的报表服务器，与应用程序的沟通是通过网络协议，严重降低性能；• 无法享受应用服务器的各项优势功能，包括集群能力、连接池的管理...