跳转到主要内容

观点的文章

前面。大数据,2023年2月06
秒。医学和公共卫生
卷6 - 2023 | https://doi.org/10.3389/fdata.2023.1095119

新鲜呈现五个健康数据共享域:质量、隐私、公平、激励,和可持续性

  • 1中心医学伦理和健康政策,贝勒医学院,休斯顿,美国TX
  • 2财团对科学、政策和成果,亚利桑那州立大学,美国华盛顿特区

随着世界各地的实体投资促进健康数据共享存储库和其他基础设施,可伸缩解决数据共享挑战是必要的。我们进行了半结构化访谈24专家探讨意见潜在问题和相关政策选择健康数据共享。在这个角度看,我们描述一些非传统见解共享我们的受访者相关问题的五个领域:数据质量、隐私、公平、激励,和可持续性。这些见解的问题关注守门的颗粒质量标准;挑战的热情多数派的风险信息披露实践;唤起注意权力动力学可能危及病人的声音;鼓励相信新一代的科学家的分享倾向;个人性格和支持会计选择的长期合作伙伴。我们认为每个观点的优点和广泛的目标,鼓励创造性思维解决数据共享问题。

介绍

人们普遍同意,共享健康数据将翻译有益于病人和人口和科学发展至关重要美国国家科学院医学研究所,2013年;社论,2020;威彻尔et al ., 2021)。被广泛引用和支持公平指导原则提供了宝贵的基础数据管理和管理(威尔金森et al ., 2016)。然而,技术、激励和政策壁垒,共享健康数据二次研究坚持(国家科学学院、工程和医学(NASEM), 2018年]。作为公共和私人实体增加存储库和其他基础设施投资来促进健康数据共享、可伸缩的方法来克服这些障碍急需(美国国家科学院医学研究所,2013年;威彻尔et al ., 2021)。

应对这种需求,我们进行了一次修改政策德尔福过程识别和优先考虑的问题和相关政策选择共享数据(癌症基因变体Majumder et al ., 2021)。癌症基因组学是我们研究的重点领域的重大努力使大规模数据集可用于二次研究的目的,除此之外,解决问题不确定意义的变体(临床癌症基因组的任务团队基因和健康的全球联盟,2017年)。在第一个三轮德尔菲,小组成员优先问题和生成的潜在选项,我们分为五个领域:数据质量、隐私和安全、公平、激励,和可持续性。扩大范围的角度考虑小组成员在Delphi的最后一轮中,我们进行了半结构化访谈24专家没有参与德尔福过程(表1)。方法招募受访者,进行采访,采访中描述的数据分析补充材料

表1
www.雷竞技rebatfrontiersin.org

表1。面试的特点参与者(N= 24)。

在这个角度看,我们描述和说明选择的见解受访者的数据共享,我们发现有趣的和生成的丰富的讨论在我们的研究团队(表2)。重要的是,这些见解并不仅限于癌症基因组学,但有关的任何努力,分享健康数据。我们并不认为这些观点之前从来没有被播出,而是因为他们离开(在某些情况下显著)从传统思维,我们称他们为“新鲜。“虽然一些可能会引起争议,我们相信每个人都有足够的价值来证明探索。更普遍的是,通过播放这些新鲜的需要,我们的目标是鼓励考虑共享健康数据的新方法。

表2
www.雷竞技rebatfrontiersin.org

表2。共享的受访者的见解对健康数据共享问题(N= 24)。

数据质量:质疑守门的关注颗粒质量标准

第一个关注新的共享数据的结果被认为是低质量。传统方法是以标准的指定数据为高或低质量与生成的目标,主要高质量的数据共享和重用。然而,一位被采访者担心广义使用指标删除或者阻止数据存储库,基于根据这些指标判断,他们是低质量的,因为“所有数据有疣。”根据研究的具体目标和需求可能重用数据,受访者认为,一个数据集的特殊瑕疵可能不是重要的甚至是相关的。帮助研究人员决定重用数据、标准应该为描述为什么以及如何开发数据生成,和他们所做的事情,不要描述,促进了解自己的长处和局限性为特定的二次使用上下文。

符合质量为适合使用的概念,信息系统专业人员所描述的质量维度从数据的角度来看用户,包括外在语境恰当的指标,如相关手头的任务和完整性,除了内在指标,如精度(小王和强大,1996年)。医学研究人员也认识到注释的数据便于重用,但数据质量框架通常专注于发展和符合质量标准或指标。在系统回顾数据共享的框架内consortium-wide国际卫生研究平台,例如,数据共享的原则和规范包括开发和实施质量标准或阈值指标(卡尔曼et al ., 2019)。我们被采访者的非传统的观点是,初级researchers-e.g的“书”。,the rich, narrative descriptions of how the data were originally generated, coded, and interrogated (Bauchner et al ., 2016)——甚至比颗粒质量标准更有用的辅助人员,特别是那些专注于识别和量化质量“缺陷”作为被排除在数据共享的基础。更广泛,值得考虑是否使用术语“质量”促进简单判断数据,适当抑制重用。

隐私:具有挑战性的多数派的披露数据共享的风险

第二个研究参与者的隐私的担忧,以及新的挑战和保持他们的数据机密一旦共享。因为它通常是不可能保证数据不会进入拥有未经授权的人或被用于非法目的,包括reidentification,传统观点认为,披露更多信息隐私风险通常是比更少。透明度也被认为促进信任。我们的受访者之一,然而,认为隐私相关信息披露可以产生相反的效果,引起怀疑。以此类推,你描述了一个附近的咖啡店保证顾客咖啡是无毒的。因为客户通常不会怀疑他们的咖啡是含有砷,保证让客户担心,问,“等……为什么你告诉我这是没有毒吗?”因此,应聘者建议,“如果你想建立信任……不要谈论太多隐私。”

最近的一项研究表明,公众愿意捐赠自己的健康数据,研究认为,透明度如何使用他们的数据将帮助他们相信数据共享企业(米尔恩et al ., 2021)。然而,人们的看法和行为在隐私和相关的权衡更不确定,韧性,比通常是公认的上下文相关的(阿奎斯蒂et al ., 2015)。事实上,有限的注意力,“积极关注”远离不愉快的信息,和有偏见的评估的概率可以减少甚至扭转隐私相关信息披露的影响(Loewenstein et al ., 2014)。此外,组织可以有不同程度的预先存在的担忧隐私影响披露如何影响信任。尽管如此,一些倡导披露可能吸引注意事项如尊重作为透明度的理由无论任何对信任的影响(McGuire et al ., 2019)。总之,许多因素复杂信息披露之间的关系及其对信任的影响和责任(Loewenstein et al ., 2014)。智慧的金块是好奇,占人类心理学当获得同意分享健康数据和提防maximalism草率的披露。

股本:调用注意权力动力学可能影响病人的声音

第三个新鲜的花是域的权益。增加多样性和对病人和社区的需求和关注最近的重点在生物医学研究(Aguilar-Gaxiola et al ., 2022)。符合这些优先事项,有些人支持生物和数据存储库系统和流程,公众参与,病人和病人在数据治理的代表(奥多尔蒂et al ., 2011;Kaye et al ., 2018;McGuire et al ., 2019)。但我们的受访者之一警告称,“有病人的声音在餐桌上“本身并不足以实现权益。这是由于患者和研究者之间固有的权力差异也可能是治疗医生。我们可能会认为那些急需帮助避免这样做可能会疏远那些研究人员。因此,应聘者观察,病人可能不使用他们的真实的声音和甚至可能只是鹦鹉研究人员告诉他们说什么时候邀请表。

被采访者的问题相关调用认知不公正(米兰达•弗里克弗里克,2003)。认知不公正可能发生当一个听者(例如,医生或研究人员)分配低可信度扬声器(例如,病人或照顾者)的偏见源于不同的社会身份,特别是在听者之间的差异的特点是不平等的权力和演讲者(弗里克,2003)。它也可以发生先发制人当演讲者保持沉默害怕不相信(李,2021)。我们被采访者的小说是这样的沉默可以发生害怕破坏现有的关系作为一个结果被相信。因此,为了防止(有时是无意的)过滤或病人的主导地位的声音,上游的解决方案需要更好地识别和管理相关的动力学。例如,可以结构化数据治理需要许多患者和医护人员的输入,而不是少数。

激励措施:努力关注新一代又一代的科学家

第四个新鲜带地址数据共享的偏差专业研究人员的激励机制。这个著名的问题的传统方法是奖励数据共享,减少职业激励数据囤积,铭记作为一种制度和文化规范的数据共享。有很多努力的例子已经采用了这种方法,包括使用共享徽章的期刊和财团来增强广告的数据的可见性的数据集和声誉信用的创造者(雷竞技电竞体育竞猜平台Devriendt et al ., 2021)。我们的受访者之一,然而,怀疑这些方法是必要开放科学规范的受欢迎程度在追求高级学位”的科学家们在过去的10年。“他们解释说:“我认为这是一个问题,就是照顾自然的熟悉新的工作方式,数字,纠正自己的错误。“这些要求如何加速这一变化,你继续说,“我可能回复:值得努力加速,还是值得推广,帮助这些人操作的新模型是成功的吗?”

因为incentive-related健康数据共享壁垒已被证明尤其难以克服,等待的方法认可这个应聘者有不可否认的吸引力。这也是事实存在广泛的热情开放的科学,就是明证全球倡议促进获取研究数据,方法,和产品(国家科学学院、工程和医学(NASEM), 2018年]。然而,超过1300名科学家的调查发现,年长的同事相比,年轻的科学家们不愿意分享他们的研究数据没有限制,虽然他们更可能同意缺乏对数据的访问是这一进程的主要障碍在科学和限制他们的能力来回答科学问题(Tenopir et al ., 2011)。其他学者认为这一发现可能经历更多的强烈的竞争压力扮科学家相比,他们的终身同事(进来时et al ., 2015)。更普遍的是,文献表明,激励和规范应该维持行为(在同一方向移动尼古拉斯et al ., 2019),所以它似乎并不明智的减资数据共享的激励机制。不过,被采访者的洞察力是有用的在思考如何最大化的影响这些投资:而不是努力改变抗老卫士的行为,重点支持新一代的科学家们可能更乐于分享。

屏幕可持续性:支持个人性格作为合作伙伴

最后一个新鲜的担忧与维护相关的金融和人力资源挑战数据存储库和共享项目。一种标准方法来促进可持续发展与个人和机构合作是基于他们对资源的访问,以及他们的专业知识和声望,这有助于吸引外部资金。但是我们的一个受访者推荐包括额外的屏幕为个人性格。具体来说,他们解释说,重要的是要保持“相当强硬让混蛋。”被采访者的阐述:“[T]这里有一些毒药的人,任何财团,你不能让他们参与进来。”

出版之后萨顿(2004,2007)具有里程碑意义的哈佛商业评论论文在2007年2004和后续的书,“没有混蛋规则”已成为著名的在管理圈。这条规则是为了保护组织文化通过否认入口(通常是就业的形式)甚至高分个人如果他们知道展览虐待或其他困难的行为。应聘者的新颖的见解是识别其相关性超出业务招聘上下文和应用它来决定合作伙伴长期和大规模的科学合作。此举引发更广泛的问题:哪些课程对长期运营的成功可能从业务管理数据共享的努力收集文献?

结论

与开发相关的棘手问题并保持仓库和其他基础设施,以促进健康数据共享,我们认为值得关注的这些和其他非传统的观点。他们有可能产生新的和更好的解决方案通过借鉴文学在不同领域,突出优势和隐藏的情况下,甚至重构问题。而不是每个新鲜最终将有助于促进健康数据共享,征求并播放他们可以帮助确保这项工作的方式进行,富有创造性,思想开阔。

数据可用性声明

本文中给出的数据并不容易获得受访者的机密性质的参与和符合IRB-approved协议在这项研究中。请求访问数据应该指向guerrini@bcm.edu

道德声明

涉及人类受试者的研究回顾和贝勒医学院的机构审查委员会批准。书面知情同意参与这项研究并不需要按照国家法律和制度需求。

作者的贡献

小点,CG,毫米,和设计本研究的构思。CG,毫米,RC-D JB,詹和AG)参与数据收集由JR和MB。CG提供的支持下,毫米,JR, MB, MS分析数据。CG,毫米,小领导起草的手稿。资助这项研究被RC-D我获得。所有作者的文章和批准提交的版本。

资金

这项研究是由美国国家癌症研究所支持的美国国立卫生研究院的R01 CA237118奖号码。

确认

作者要感谢阿米拉达乌德的工作支持手稿和受访者的准备与我们分享他们的见解和观点。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

作者免责声明

完全的责任作者和内容并不代表美国国立卫生研究院的观点,作者的雇主,或者任何他们或附属机构。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fdata.2023.1095119/full补充材料

引用

阿奎斯蒂、。,Brandimarte, L., and Loewenstein, G. (2015). Privacy and human behavior in the age of information.科学347年,509 - 514。doi: 10.1126 / science.aaa1465

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Aguilar-Gaxiola, S。艾哈迈德,s M。茴香,。,Azzahir, A., Baker, K. E., Cupito, A., et al. (2022). Assessing meaningful community engagement: a conceptual model to advance health equity through transformed systems for health.南教谕。doi: 10.31478 / 202202 c

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Bauchner, H。,Golub, R. M., and Fontanarosa, P. B. (2016). Data sharing: an ethical and scientific imperative.《美国医学会杂志》315年,1237 - 1239。doi: 10.1001 / jama.2016.2420

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Devriendt, T。大家都会,M。,和Borry, P. (2021). Data sharing in biomedical sciences: a systematic review of incentives.Biopreserv。生物。19日,219 - 227。doi: 10.1089 / bio.2020.0037

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

编辑(2020)。开放的爆发。Nat。。38岁的377人。doi: 10.1038 / s41587 - 020 - 0499 - y

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

他进来,B。,Friesike, S., and Hebing, M. (2015). What drives academic data sharing?《公共科学图书馆•综合》。10,e0118053。doi: 10.1371 / journal.pone.0118053

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

弗里克,m (2003)。认知正义和美德的政治认识的作用。Metaphil。34岁,154 - 173。doi: 10.1111 / 1467 - 9973.00266

CrossRef全文|谷歌学术搜索

国家科学院医学研究所。(2013)。分享临床研究数据:车间总结。华盛顿特区。:国家科学院出版社。

谷歌学术搜索

卡尔曼,S。,Mostert, M., Gerlinger, C., van Delden, J. J. M., and van Thiel, G. J. M. W. (2019). Responsible data sharing in international health research: a systematic review of principles and norms.BMC医学伦理。。20岁,21岁。doi: 10.1186 / s12910 - 019 - 0359 - 9

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

凯,J。,Terry, S. F., Juengst, E., Coy, S., Harris, J. R., Chalmers, D., et al. (2018). Including all voices in international data-sharing governance.嗡嗡声。基因组学。12、13所示。doi: 10.1186 / s40246 - 018 - 0143 - 9

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

j.y.(李,2021)。预期认知不公。Soc。Epistemol。35岁,564 - 576。doi: 10.1080 / 02691728.2021.1924306

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Loewenstein G。,Sunstein, C. R., and Golman, R. (2014). Disclosure: psychology changes everything.为基础。启经济学。6,391 - 419。doi: 10.1146 / annurev -经济- 080213 - 041341

CrossRef全文|谷歌学术搜索

Majumder, m·A。空白,m . L。Geary, J。,Bollinger, J. M., Guerrini, C. J., Robinson, J. O., et al. (2021). Challenges to building a gene variant commons to assess hereditary cancer risk: results of a modified policy Delphi panel deliberation.j·珀耳斯。地中海。11日,646年。doi: 10.3390 / jpm11070646

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

McGuire, a . L。,Majumder, m·A。,Villanueva, A. G., Bardill, J., Bollinger, J. M., Boerwinkle, E., et al. (2019). Importance of participant-centricity and trust for a sustainable medical information commons.地中海j .法律,道德。47岁的12-20。doi: 10.1177 / 1073110519840480

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

米尔恩,R。,Morley, K. I., Almarri, M. A., Anwer, S., Atutornu, J., Baranova, E. E., et al. (2021). Demonstrating trustworthiness when collecting and sharing genomic data: public views across 22 countries.基因组医学。13日,92年。doi: 10.1186 / s13073 - 021 - 00903 - 0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

国家科学学院工程和医学(NASEM)。(2018)。开放的科学设计:实现对21世纪的研究展望。华盛顿特区。:国家科学院出版社。

谷歌学术搜索

尼古拉斯,D。,Boukacem-Zeghmouri, C., Abrizah, A., Rodriquez-Bravo, B., Xu, J., Swigon, M., et al. (2019). Open science from the standpoint of the new wave of researchers: views from the scholarly frontline.正,服务。使用。39岁,369 - 374。doi: 10.3233 / isu - 190069

CrossRef全文|谷歌学术搜索

奥多尔蒂、k . C。伯吉斯,M . M。爱德华兹,K。,Gallagher, R. P., Hawkins, A. K., Kaye, J., et al. (2011). From consent to institutions: designing adaptive governance for genomic biobanks.Soc。科学。地中海。73年,367 - 374。doi: 10.1016 / j.socscimed.2011.05.046

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

萨顿,r (2004)。更多的麻烦比他们的价值。哈里。公共汽车。牧师。82年,19日至20日。doi: 10.1109 / EMR.2004.25045

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

萨顿,r (2007)。《拒绝溷蛋法则:建设一个文明的工作场所和幸存的一个不是。纽约:华纳商业书籍。

谷歌学术搜索

Tenopir C。,Allard, S., Douglass, K., Aydinoglu, A. U., Wu, L., Read, E., et al. (2011). Data sharing by scientists: practices and perceptions.《公共科学图书馆•综合》。6,e21101。doi: 10.1371 / journal.pone.0021101

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

临床癌症基因组的任务团队全球联盟的基因组学和健康。(2017)。分享临床和基因数据癌症元凶需要全球解决方案。心血管病。j .地中海。376年,2006 - 2009。doi: 10.1056 / NEJMp1612254

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

王,r . Y。,和Strong, D. M. (1996). Beyond accuracy: what data quality means to data consumers.j .等内容。正系统。。12,5-33。doi: 10.1080 / 07421222.1996.11518099

CrossRef全文|谷歌学术搜索

威彻尔,D。艾哈迈德,M。,Siddiqi, S., Adams, I., Zirkle, M., Grossmann, C., et al. (2021).健康数据共享支持更好的结果:建立利益相关者信任的基础。华盛顿特区。:国家医学研究院。

谷歌学术搜索

威尔金森,m D。Dumontier, M。,Aalbersberg, I. J. J., Appleton, G., Axton, M., Baak, A., et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship.科学。数据。3,160018。doi: 10.1038 / sdata.2016.18

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:数据共享、数据质量、伦理、数据保密、数据档案

引用:乔Guerrini CJ, Majumder马,罗宾逊,cook - deegan为首的R,空白M, Bollinger J, Geary J,古铁雷斯,Shrikant M和McGuire AL(2023)新鲜呈现五个健康数据共享域:质量、隐私、公平、激励,和可持续性。前面。大数据6:1095119。doi: 10.3389 / fdata.2023.1095119

收到:2022年11月10日;接受:2023年1月16日;
发表:2023年2月06。

编辑:

若昂瓦伦特Cordeiro葡萄牙,里斯本新大学的

审核:

Rob Hooft荷兰,荷兰Techcentre生命科学,
里卡多Cartes-Velasquez智利康塞普西翁大学医学院

版权©2023 Guerrini, Majumder,罗宾逊,cook - deegan为首的空白,Bollinger, Geary,古铁雷斯,Shrikant和McGuire。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:克里斯蒂j . Guerrini是的guerrini@bcm.edu

__这些作者分享第一作者

下载