数据保护 > 概览:大数据的困难与机遇

概览:大数据的困难与机遇
2019-03-15 14:18:49 阅读

该系列旨在概述我们在LeMO项目中进行的有关运输部门大数据的法律,道德和社会挑战及机遇的研究结果,该报告发表在两份报告中,即一份题为“法律报告”的报告。 “问题”和“关于道德和社会问题的报告”均可在www.lemo-h2020.eu/deliverables/在线获取。这些条款还将酌情提供运输部门的说明。

整个系列将提出关键问题,例如“GDPR的隐私概念是否适合大数据?”,“可以应用匿名技术,同时保持大数据分析的可接受水平的可预测性和实用性吗?”,“是与数据所有权相关的现行法律框架是否令人满意?“,”竞争法可能对大数据的使用产生影响的主要领域是什么?“或”也可以“获取技术和教育或技能方面的社会差异”导致数据驱动的歧视?“

更具体地说,每篇文章都将讨论与大数据相关的特定主题,即:

    隐私和数据保护
    匿名化和假名化
    安全和网络安全
    与违反义务有关的义务
    提供数字内容和服务
    数据的自由流动
    知识产权
    打开数据
    数据共享义务
    数据所有权
    数据共享协议
    责任
    竞争
    信任,监督和自由意志
    隐私,透明度,同意,控制和个人数据所有权
    区别

下面,我们将在阅读即将发表的文章时提供一些有用的背景信息。

“大数据”的概念

虽然本系列文章的目的不是深入研究大数据的技术方面,但它仍然强调,如果需要,大数据的一些特殊性以及上面提到的每个法律,道德和社会问题都将通过大数据分析进行检验。技术在想。

对“大数据”的定义没有真正的共识。然而,经常听到的描述是包含不同类型数据的大型数据集,这些数据集已经超出了使用传统工具进行管理和分析的能力。[1]实时处理如此大量的可变(非)结构化数据需要采用和使用新的方法和工具(例如,处理器,软件,算法等)。[2]

如果不强调大数据的一些关键特征,通常用一系列“V”来表达,就不能讨论大数据的概念,特别是:

卷:指获取,存储,搜索,共享,分析,可视化,生成和/或管理的大量数据。大数据技术在分布式系统的帮助下显着地支持了大型数据集的存储和使用,其中部分数据存储在不同的位置,通过网络连接并通过软件汇集在一起​​。[3]
    速度:指处理速度,这在大数据环境中是至关重要的。更具体地说,它指的是数据的存储和分析速度,以及生成新数据的速度。[4]
    多样性:指可以分析的异构类型的数据,结合结构化但非结构化的数据集。有一致的发现是,今天生成和分析的大多数数据都是非结构化的。

除了这三个关键特征之外,一些作者还提到了“准确性”,它涉及分析包含较少可控和准确数据的数据集的能力。[5]大数据的一些关键特征正在挑战准确性。实际上,“大数据应用程序通常倾向于收集来自不同来源的数据,而无需仔细验证所收集数据的相关性或准确性。”[6]这通常会带来法律问题,但也会产生与信任,隐私或透明度相关的道德问题。 。

“价值”的“V”也被强调为指将数据转化为价值的可能性。[7]虽然可以说数据本身没有价值,但处理它会创造价值。换句话说,仅仅收集和存储的数据不可能产生任何价值,除非它被一些“智能”软件算法使用,这些算法分析数据,从数据中学习,以及制定或建议决策或预测。此外,数据中的价值还可能在于人类组织数据所花费的时间,创建算法或使用人为生成的示例和答案训练此类算法。同样,个人在日常生活中提供的(个人)数据(例如通过使用社交媒体平台或使用行程申请)也具有价值。事实上,欧洲委员会在2015年关于提供数字内容合同的拟议指令中明确承认“市场参与者经常并越来越多地将有关个人的信息视为具有与金钱相当的价值”。[8]它进一步发现“数字内容通常不是为了换取价格而是为了反对除货币以外的反作用,即通过提供个人数据或其他数据。”[9]在此基础上,委员会建议协调合同的某些方面。提供数字内容,以高水平的消费者保护为基础。[10]

最后,在研究与大数据相关的法律,社会和道德问题时,值得考虑其他颠覆性技术,如人工智能(“AI”)及其子分支,包括机器学习,深度学习或神经网络,这些都是基于算法的。这种算法方法依赖于大量数据(大数据)来查找趋势,模式和预测并产生期望的结果。

运输部门的大数据

在运输行业中,每天都会产生大量数据,例如通过乘客计数和车辆定位系统中的传感器以及票务和票价收集系统,仅举几例。

大数据为定义“智能”移动和运输解决方案开辟了新的机会。通过利用大数据工具和预测分析,数据分析可以帮助运输利益相关者做出更好的决策,改善运营,降低成本,简化流程,最终更好地为旅行者和客户提供服务。[11]

政策框架

欧盟和/或国家层面的立法者已采取政策,以规范与数据或运输部门有关的若干方面,同时也打击最显着和持久的道德问题或制定社会规范。

虽然没有针对大数据的政策,但立法者已经采取了一些旨在保护公民隐私的立法,鼓励私营和公共部门实体之间的数据共享,并制定支持运输部门数字化的政策。交通部门最近政策的一些关键领域是智能交通系统的实施,开放数据政策的增加,自动驾驶和智能交通。[12]

除了这些公共政策外,公司 - 包括运输部门 - 已采取或决定遵守私营部门政策。更具体地说,私营部门已经开始将大数据技术的使用政策纳入其自身的业务模式,作为流程或产品创新。随着数字化成为交通运输领域的一个主要趋势,潜在的应用是多种多样的。[13]

尽管存在公共和私人政策,但使用新技术(例如在这种情况下采用大数据驱动技术)会产生新的道德和政策问题,需要采用新政策或替换现有政策。

分配责任

数据价值周期可能相当复杂,涉及众多利益相关者。这些利益相关者中的许多人可能会承担某种责任,例如,他们创建或生成数据或算法,或者因为他们使用,编译,选择,构建,重新格式化,丰富,分析,购买,获取许可证,或为数据增加价值。

这种复杂性增加了确定谁可能在法律上,道德上或社会上承担责任以及对任何不法行为和损害负责的困难,或者可能被要求将法律,道德和社会原则纳入其流程的困难。计算机系统设计人员(例如软件开发人员,软件工程师,数据科学家,数据工程师),数据提供者(例如数据经纪人和市场,个人,公共机构),甚至不同的参与者都有责任吗?

确定与运输部门的大数据相关的法律问题

目前欧盟和成员国目前生效的立法并不多,因此要记住大数据等颠覆性技术。实际上,立法程序往往很长,而且往往似乎最终落后于技术进化。因此,包括运输业在内的任何行业对大数据的采用都将不可避免地面临法律障碍。

因此,本系列文章的第一部分阐述了(大)数据的使用和新数据驱动技术的部署如何引发与法律错综复杂相关的讨论。虽然特别强调运输部门的大数据,但所提出的挑战和机遇也可能对其他领域有效。

更具体地说,在LeMO项目的背景下进行的研究使得能够识别以下关键法律问题,这些问题被认为与大数据特别相关,包括运输部门:(i)隐私和数据保护; (ii)(网络)安全; (iii)与违反义务有关的义务; (iv)匿名化和假名化; (v)提供数字内容和服务(特别是个人数据作为反作用); (vi)数据的自由流动; (vii)大数据环境中的知识产权; (viii)公开数据; (ix)数据共享义务; (x)数据所有权; (xi)数据共享协议; (xii)责任; (xiii)竞争。

确定与运输部门的大数据相关的道德和社会问题

与交通中的道德(和社会)问题相关的讨论并不新鲜。早在1996年,Barbara Richardson教授就已经提出建立一个新的研究领域和分析方法的必要性,这个领域将被称为“交通伦理学”。从那时起,运输部门的变化就是巨大的技术发展,特别是大数据和人工智能。因此,今天比以往任何时候都更需要研究在运输部门使用数据驱动技术(包括大数据和人工智能)的道德和社会影响。[14]

因此,本系列文章的第二部分讨论了(大)数据的使用和新数据驱动技术的部署如何对道德和社会(等)讨论产生强烈影响。虽然特别强调运输部门的大数据,但所提出的挑战和机遇也可能对其他领域有效。

更具体地说,在LeMO项目的背景下进行的研究使得能够识别以下关键的道德和社会问题,这些问题被认为与大数据特别相关,包括运输部门:(i)信任; (ii)监督; (iii)隐私(包括透明度,同意和控制); (iv)自由意志; (v)个人数据所有权; (vi)数据驱动的社会歧视和公平; (vii)环境问题。

结论

本系列的下一篇文章将重点介绍上面列出的16个主题。然而,这并不意味着其他法律,道德和社会问题无关紧要。实际上,依赖数据驱动技术的新服务(如运输部门)的发展引发了无数的技术,经济,法律,道德和社会问题。

文章来源:https://www.lexology.com/library/detail.aspx?g=c6d47d60-8cb0-488a-ae49-063d3910dc99

【上一篇】GDPR第一案中值得吸取的... 【下一篇】2019数据安全观察