AI研究人员计划向患者支付数据费用 将数据存储区块链保护系统中

AI研究人员计划向患者支付数据费用 将数据存储区块链保护系统中
2019年08月12日 11:30 睿虎科技

原创不易 请随手点击关注

本文由Rehoo团队Tin原创,无授权禁转!(图片来自网络)

斯坦福大学眼科医生罗伯特•张(Robert Chang)通常会忙于进行眼科手术。但几年前,他决定在自己的领域崭露头角:利用人工智能。像Chang这样的医生经常依靠眼部成像来追踪青光眼等疾病的发展。他推断,通过足够的扫描,他可能会发现可以帮助他更好地解释测试结果的模式。

也就是说,如果他能掌握足够的数据。Chang开始了许多寻求机器学习的医学研究人员所累计的经验。他从他自己的患者开始远远还不够,因为训练AI算法可能需要数千甚至数百万的数据点。他填写了补助金,并呼吁其他大学的合作者。他去了捐赠登记处,人们自愿将他们的数据带给研究人员使用。但很快他就碰壁了。他需要的数据与复杂的数据共享规则联系在一起。Chang说:“我基本上是在乞求数据”。

Chang认为他可能很快会解决患者数据问题,他正在与加州大学伯克利分校的教授Dawn Song合作,为患者创建一种安全的方式,让他们与研究人员分享他们的数据。它依赖于由Song创立的Oasis Labs的云计算网络,其设计使研究人员永远不会看到数据,即使它用于训练AI。为了鼓励患者参与,他们将在使用他们的数据时获得报酬。

该设计的影响远远超出了医疗保健。在加利福尼亚州,州长Gavin Newsom最近提出了一项所谓的“数据红利”,将财富从该州的科技公司转移到其居民,而美国参议员马克华纳(D-Va。)已提出一项法案,要求公司提出每个用户的个人数据的价格标签。该方法依赖于越来越多的人认为科技行业的力量源于其庞大的用户数据库。这些举措会通过声明您的数据是以公司应该付费使用它来录入该系统。

但实际上,快速拥有数据的想法开始看起来有点模糊。与汽车或房屋等实物资产不同,您的数据在网络上无关紧要地与其他来源合并,并且越来越多地通过机器学习模型。随着数据转换形式,其价值成为任何人的猜测。此外,当前处理数据的方式必然会产生相互冲突的激励。

Song认为,要使数据所有权发挥作用,整个系统需要重新思考。数据需要由用户控制,但仍可供其他人使用。“我们可以帮助用户保持对数据的控制,同时使数据能够以隐私保护的方式用于机器学习模式,Song说,健康研究是开始测试这些想法的好方法,部分原因是人们已经经常获得参与临床研究的报酬。

本月,他们正在斯坦福开始对该系统进行试验,他们称之为卡拉技术。Kara使用一种称为差异隐私的技术,其中用于训练AI系统的成分与所有相关方的可见性有限。患者上传他们的医疗数据图片,比如眼睛扫描,像Chang这样的医学研究人员提交他们需要数据训练的AI系统。这些都存储在Oasis基于区块链的平台上,该平台对数据进行加密和匿名化。所以研究人员从未看到他们正在使用的数据。该技术还借鉴了先前的研究,以帮助确保软件在事后提取用于训练的数据不能进行逆向工程。

Chang认为,隐私意识的设计可以帮助处理医学数据弊端,从而阻止数据在各个机构之间共享。患者及其医生可能更愿意上传他们的数据,因为知道其他人不会看到他们。它还会阻止研究人员将您的数据出售给制药公司。

理论上听起来不错,但是你如何激励人们真正拍摄健康记录的照片?谈到培训机器学习系统,并非所有数据都是平等的。在为人们付费时,这是一个挑战。为了评估这些数据,Song的系统采用了诺贝尔经济学奖获得者劳埃德·沙普利(Lloyd Shapley)于1953年提出的想法。想象一下,数据集是一个需要合作才能达到特定目标的团队。每位成员的贡献是什么?斯坦福大学生物医学数据科学教授詹姆斯·佐(James Zou)解释说,这不仅仅是挑选MVP的问题。其他数据点可能更像团队成员。他们对整体成功的贡献可能取决于其他人在做什么。

Zou说,在一项使用机器学习的医学研究中,有很多理由说明你的数据可能比我的更多或更少。有时它是数据的质量,质量差的眼睛扫描可能会使疾病检测算法弊大于利。或许您的扫描显示与研究相关的罕见疾病的迹象。其他因素更模糊。例如,如果您希望算法在一般人群中运作良好,那么您在研究中需要同样多样化的人。因此,一组人中的Shapley值常常被排除在临床研究之外,比如在某些情况下可能会相对较高。在数据集中经常过多的白人男性的价值可能会降低。

丹佛大学的生物伦理学家Govind Persad表示,人们在临床研究中获得不同的报酬并不罕见,特别是如果一项研究依赖于引入难以招募的科目。但他警告说,需要仔细设计激励措施。患者需要了解他们将获得什么样的支付,并获得有效的研究目标,以及他们的数据如何被重视的充分理由。

Persad指出,更具挑战性的是让数据市场按预期运行。这对于各种区块链公司来说都是一个问题,这些公司承诺用户控制的市场 。医学研究人员会担心数据的质量以及是否有合适的数据。他们还必须引导用户可能对他们的数据如何使用的限制。另一方面,患者需要相信Oasis的技术和承诺的隐私保证可以像宣传的那样工作。

临床研究的目的是开始解决其中的一些问题,患者首先测试应用程序。随着市场的扩大,研究人员可能会调用特定类型的数据,而Song设想与医生或医院合作,这样患者就无法完全了解要上传的数据类型。她的团队还在研究人工智能系统培训之前,研究如何估算特定数据的价值,以便用户通过让研究人员获得访问权限,大致了解他们将做出多少贡献。

Song承认,更广泛地采用数据所有权理念还有很长的路要走。目前,公司主要选择如何存储用户数据,而他们的商业模式主要依赖于直接公司持有。Zou表示,在评估数据的任何智能数学技巧有用之前,监管机构需要整理数据存储和共享的规则。政策界和技术界之间在衡量数据价值的方面存在差距,我们正在努力为这些政策决定注入更多严谨性。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部