跳转到主要内容

系统的综述

前面。数字。健康,2021年1月26日
秒。卫生信息学
卷2 - 2020 | https://doi.org/10.3389/fdgth.2020.592237

对一个道德框架的文本挖掘社交媒体卫生研究:系统回顾

伊丽莎白·福特 1 *,斯佳丽牧羊人1,Kerina琼斯 2Lamiece哈桑 3
  • 1初级保健和公共卫生部门,布莱顿和苏塞克斯医学院,英国布莱顿
  • 2人口数据科学、医学院、斯旺西大学,英国斯旺西
  • 3部门信息、成像及数据科学、曼彻斯特大学,曼彻斯特,英国

背景:文本挖掘技术是推进社会媒体文本的所有时间和巨大的语料库可以分析用户的意见和经验有关他们的健康。有了新见解的巨大希望药物副作用等健康问题和疾病传播,以及病人的卫生条件和卫生保健经验。然而,这个新兴领域缺乏道德共识和指导。我们旨在汇集全面的意见,意见和建议在这一领域,这样初涉该领域的学术研究人员能理解相关的伦理问题。

方法:在普洛斯彼罗注册协议后,三个平行系统进行了搜索,识别学术文章包括评论、意见和建议卫生研究社会媒体文本挖掘的道德实践和灰色文献指南和建议。这些都是结合社会媒体用户的定性研究的观点。论文和报告,满足入选标准分析了主题来确定关键的主题,并推导了一组整体的主题。

结果:共有47个综述报告和文章,和八个主题被确定。评论员认为,公开发布社交媒体数据可以使用未经许可和正式研究伦理批准,提供用户的匿名性是保证,尽管我们注意隐私设置是困难的用户在一些导航网站。甚至不需要正式的批准,我们注意到伦理问题:积极识别和减少可能的危害,为公共利益而不是私利进行研究,以确保透明度和质量的数据访问和分析方法,并遵守法律和社会媒体网站的条款和条件。

结论:虽然社交媒体文本挖掘通常可以合法和合理进行正式的伦理审批,我们建议增加透明度改善健康相关研究中的伦理标准的研究的目的,数据访问和分析方法;咨询与社交媒体用户和目标群体对可能产生的潜在危害识别和减轻;并确保社会媒体的匿名用户。

介绍

在过去的二十年里,社会媒体平台,社交网站和互联网论坛已经经历了一个指数增加用户,2019年有34.8亿活跃用户,比上年增长9% (1)。Facebook仍然是最高级别的社交媒体网站,每月有22.7亿活跃用户,而Twitter吸引了约3.26亿每月活跃用户(1)。其他网站比如Instagram(近10亿用户)和TikTok迅速获得用户,特别是年轻的人口。此外,许多论坛在互联网上提供的方式为用户讨论并分享他们的经验和咨询同行。

社会媒体平台是用来传播健康信息(2,3)和卫生保健专业人员使用的相互作用和建议用户(4,5)。此外,用户发布的信息对他们的健康行为,经验,和态度,常常在公开论坛上(4,6)。有57%的世界人口每年访问社交媒体(1),这为研究人员提供了新的机会收获卫生研究和分析数据,获得人们的健康信息,将以前无法实现(6)。这个新的健康数据的来源也可能让研究人员访问的观点和经验的人历来很难招募研究(7)。这些信息的可用性已经被利用卫生研究人员,研究药物不良影响药物警戒(8,9)、流感疫情监测(10)和心理健康监测(11)。

的大量数据可以从社交媒体和患者讨论论坛和识别的必要性相关文章大量无关紧要的意味着通常使用基于计算机的文本挖掘技术。自然语言处理(NLP)是计算机科学的一个分支,它使用一系列规则和/或机器学习算法来识别相关信息从自然语言写的。通常情况下,算法是能够识别命名实体精度高,也为否定评估上下文,主题,时间和对冲(12)。进一步的工作,比如寻找药物和副作用之间的联系,着重于提取实体之间的关系在同一个句子或文档(13)。通常,定量数据来源于这个信息提取,然后进行分析统计,允许同时多个职位或文档的分析。一些研究使用社交媒体数据定性和主题,其中包括更详细和深入的阅读和分析完整的文字内容(14)。

NLP使用可用的文本研究,发布在论坛和社交媒体;因为它通常不涉及任何交互或直接接触社交媒体用户,那么它将被认为是道德低风险。也被视为一个“可能发生失事”的方法对于学生的项目,因此,研究团体可能包括许多新的或缺乏经验的研究人员不精通伦理问题。医学研究人员通常训练在“人体”研究伦理,计算机科学研究者可能缺乏经验的主要伦理问题(15)。此外,之前的有争议的事件提出了重要的关于道德的问题,这种方法的可接受性。2008年,研究人员公布的数据,他们已经收集到整个大学生群体的Facebook账户超过4年。本研究随后受到严格审查时发现,“匿名”大学用于这项研究可以很容易地之后(16)。在第二个2016年有争议的情况下,丹麦研究人员公布的数据从70000年网站用户,信息包括用户名、年龄、性别、位置、和性取向被公开,没有试图匿名化数据(17)。

此类事件已导致担心个人隐私可能受到威胁,只有少量的努力从一个对手,如果收获的数据集是公开。先前的研究审查公众和患者的观点指出危害病人的恐惧当他们的敏感,个人健康数据用于研究的次要目的(18,19)。参与者担心如果他们之后从数据未经授权的披露或访问后,这可能导致身份盗窃,影响就业,养老金资格,保险费用的增加,社会不安,社区尴尬,不必要的侮辱判断在临床的设置,或经济利益的使用他们的数据(19)。虽然这些研究集中在临床和行政数据来源,可能是社交媒体的用户可能有类似的潜在后果的担心二次使用他们的网络文章。

然而,个人内容发布在社交媒体平台和网络论坛已经公开或多或少的内容创造者,因此大大不同于临床数据由医疗专业的过程中记录一份机密磋商。因此重要的是要有一个单独的框架指导最佳实践在研究中使用这种类型的健康数据。核心研究生物医学研究的伦理原则,如那些在贝尔蒙特提出报告(20.),波和切尔德里斯(21ICT研究),如在门罗提出报告(22)可能是相关的,他们给的总体原则相关的卫生研究的许多场景。波和切尔德里斯的四个主要原则已被证明支撑公共或思考道德问题在健康研究数据共享(19)。

以前,研究人员承认缺乏伦理指导社会媒体数据挖掘(6,23)和经常制度伦理审查委员会的报告感觉几乎无法跟上快速变化的技术用于研究(24,25)。我们因此旨在回顾文献最好的道德实践在这一领域汇集的建议文本挖掘/ NLP的研究人员正在使用社交媒体和患者讨论论坛健康研究的数据。我们投网宽在这项研究中,系统地搜索学术和灰色文献,和目标包括社交媒体用户的观点在我们的建议。

材料和方法

系统回顾协议注册与普洛斯彼罗数据库(CRD42018112923) (26)。三个系统的搜索是并行进行的,两个报告使用棱镜流程图(27),手稿报告坚持加强透明度报告定性研究的合成(ENTREQ)语句(28)。没有寻求伦理批准这项研究,因为它涉及分析先前发表的报告。

搜索策略

我们进行了三个系统的搜索,两个学术文献和灰色文献之一。

搜索1和2:学术文献(1:评论、社论、教程、和建议;2:定性研究报告社会媒体文本挖掘社交媒体用户的意见对健康研究)

三个数据库搜索:MEDLINE(奥维德),斯高帕斯,ASSIA(它)。中使用的术语搜索了表1。截断和布尔操作符允许全面而具体的搜索。搜索仅限于结果发表在英语,没有约束的国家出版。2006 - 2018年的日期限制,因为这是当Facebook扩大超出了教育机构和公开给任何人注册电子邮件地址,在线社交网络不断变化的景观。从每个搜索结果导入到单独的Zotero文件和副本被丢弃。参考进行筛选来确定进一步的论文。

表1
www.雷竞技rebatfrontiersin.org

表1。搜索,搜索字符串,和数据库三个搜索。

搜索3:灰色文献

是什么意思灰色文学是未定义的,但被公认是出版物和文件不是由商业组织或出版商,或不收集和保存在图书馆控股(29日)。我们寻找这些文件使用Google搜索引擎;搜索条件中给出表1。第一个60检查结果。

包含和排除标准

由于本研究的定性性质和现象的探索,而不是干预,蜘蛛工具(30.)是用于构造的纳入和排除标准的学术文章(表2)。每个搜索后,一位作者(SS)筛选每一组文章根据标题和摘要。其余的文章每个搜索然后使用全文筛选了两位作者(SS和EF),每篇文章的共识得到满足关于其资格。

表2
www.雷竞技rebatfrontiersin.org

表2。纳入和排除标准使用蜘蛛工具系统综述。

灰色文献搜索、文章被接受如果他们发表评论,社论,指南,指南,或道德健康或社会科学研究的建议,以被动方式使用社交媒体数据(例如,帖子的定性分析;文本挖掘),即。,not involving recruitment or interaction with social media users, or providing any interventions through social media. Screening was conducted by EF and reports were checked for eligibility by LH. Where this search brought up academic publications, these were examined according to search 2 criteria and, if eligible, were added to the pool of academic articles covering commentaries, editorials, tutorials, and recommendations.

质量评估

学术文章报告定性研究社交媒体用户的观点被作者SS质量评估使用混合方法评价工具(MMAT) (31日)。对一项研究被纳入最后的审查,它必须至少3分,2分来自最初的两个筛选的问题。所有符合条件的研究遇到了这一标准。

数据提取和合成

以下信息提取从定性研究(相关):日期、地点、出版类型、作者、数据,研究设计,数量的参与者,研究目的和结果。

专题分析,所有的物品、文件都导入到NVivo 12,和单独的专题分析进行了评论,社论,教程,和推荐和社交媒体用户研究中,托马斯和硬化的主题合成原则(32)。这些原则允许透明度和再现性的方法由于其详细的方法。分析涉及编码所有相关文本,逐行成节点(初始编码是由SS)。现有节点被用于随后的论文在适当的地方,并在必要时创建新节点。一次完整的编码和节点结构已经完成,节点检查和讨论SS和EF之间。节点被聚合成较大的描述性的主题和迭代细化和讨论后,这些被用来演绎生成最终的研究结果的分析主题。合成结果时,优先分配给数据导致的形成一套伦理准则。一旦这两种类型的学术文章每个单独分析,为每组检查生成的主题和匹配在一起。接下来,灰色文献结果检查以同样的方式,识别提取,与现有的主题从前面两个分析和编码提取相关的新的主题(编码是由EF和节点被LH)检查和讨论。一旦所有灰色文学文档编码,最后一组完整的主题是由所有作者同意的。 All articles and documents were then re-read to ensure all content relating to the final themes was extracted.

结果

搜索结果

1:搜索学术文章包括评论、社论、教程、和建议

从1690年文章通过引用返回的搜索和筛选,26日满足合格标准,包括在这项研究。进一步9的文章和书一章被确认为合格的灰色文献检索,总共36篇文章(图1)。这些观点、评论或建议完整的文章(N= 20)、文学/系统评价(N= 7)、案例研究(N= 5)意见(N= 1),会议论文集(N= 1),书一章(N= 1),和编辑(N= 1)的论文。所有论文都发表在2008年至2019年之间,与31日从2013年发表的文章。论文的作者是美国之间地理传播(N= 15)、英国(N= 13),德国(N= 2),瑞士(N= 2),加拿大(N= 1),法国(N= 1),澳大利亚(N= 1)和沙特阿拉伯(N= 1)。

图1
www.雷竞技rebatfrontiersin.org

图1。棱镜流程图包含的文章搜索1。

搜索2:定性研究社交媒体的用户的观点

总共有7402个同行评议文章通过系统搜索,确定与一个额外的4篇文章虽然参考检查。其中四篇论文符合入选标准,包括在评估(图2)。所有研究发表在2012年和美国之间地理传播(N= 2),英国(N= 1),澳大利亚(N= 1)。所有的研究都是定性和远程参与者的数量从26岁到132年,共有232名参与者在所有研究。所有的研究发表了一些人口统计信息,男性和女性的优秀代表。三个四个研究包括平均年龄或参与者的年龄范围,有两个研究重点青少年群体。研究关注于特定的两个条件,一个是糖尿病和其他精神健康。研究特征所示表3

图2
www.雷竞技rebatfrontiersin.org

图2。棱镜流程图包含的文章搜索1。

表3
www.雷竞技rebatfrontiersin.org

表3。研究为定性研究社交媒体的用户特征。

搜索3:灰色文献

单独的搜索字符串产生一系列不同的和重叠的结果,所以结果筛选的全部数量不是可用的。识别和检查12个详细报告后,7个被确认为合格。从灰色文献搜索,进一步九学术文章和一本书的一章,不是被搜索1,也发现是合格的,文章从搜索1添加到池。七个包括灰色报告的日期是在2012年和2016年之间;五是由研究人员在英国和国际作者两人。

主题

总共有47个文章因此包括专题分析,从三个来源:36评论,4定性研究,7灰色文献报告。在专题分析,定性研究的四个主题被确定用户视图:私人和公共数据;同意;匿名;和社会公益研究。六个主题分别确定的学术文章包括评论、社论、教程、和建议;这些都是私人和公共数据;同意;匿名;伦理批准重伤害与好处,必要性研究; and governance of data, annotations, algorithms, and linkage. Three of these themes overlapped, giving seven from academic literature. These themes were largely supported by the gray literature, and an eighth theme was identified from these reports: legal issues and terms and conditions of social media sites. The reports and articles contributing to each theme are shown in表4

表4
www.雷竞技rebatfrontiersin.org

表4。贡献每一篇文章或报告的8个主题。

私人和公共数据——数据属于谁?

出现的一个主要主题包括文章的论点在社交媒体文章是否应该考虑公共或私人数据。许多评论员认为,一旦数据已经公开发布在社交媒体,然后成为公共领域的一部分,随后放弃隐私的期望和暗示同意为任何目的使用数据(45,51,52,56,57,61年,69年)。

然而,那些发布信息这么做知道它是一个开放的公共论坛;因此,研究人员可能会得出这样的结论:同意暗示为任何目的使用的帖子。”(57)

然而,不同的社交媒体网站给不同程度的公共访问内容;例如,访问Facebook内容可以被限制在预定义的“朋友”,而公开的推特帖子对每个人都是可视的,甚至没有一个Twitter账号的人。这导致研究人员质疑他们应该如何发布的数据(61年)。

新媒体本身的性质模糊了公共和私人之间的边界。是什么贴应考虑相当于个人日记或报纸吗?在某些情况下,答案可能是显而易见的,但往往不会。”(61年)

ESOMAR指南建议:

研究者不应该复制或刮内容在私人领域,即使他们有权限的网站所有者。如果研究人员这样做,应该明确表示,所有用户,这是发生了什么事,他们应该为个人提供一个被排除在这些数据收集过程。”(38)

增加模糊边界的复杂性,公众舆论也应考虑。一些社会媒体用户相信信息张贴在互联网是在公共领域,从而消除需要同意,也可能会认为他们有被没收的隐私权(34)。

我不支付使用Twitter。我签署的预期,这是一个免费网站,你把事情公开,(所以)我真的不期望任何我后会保持私有的。”(男)对照组,29日(34)

对个人隐私的概念不同,通常由世代陷害,文化和社会规范(37,58)。此外,考虑公共和私人的是不断变化的,即使在个人观念(37,59)。提出的一个问题是,仅仅因为已发表的东西,它并不意味着用户将他们的内容用于任何其他目的的重用。

人们可能会在公共场所经营,但保持强烈的隐私观念或期望。或者,他们会承认他们的沟通的实质是公共的,但这似乎意味着限制的特定上下文信息是如何——或者应该是——由其他方使用”。(37)

数据可能是公开的(或半公开的)但是这并不简单地等同于完全被许可使用”。(49)

假设内容张贴在公共场合暗示同意重用也假定社会媒体用户有机构对他们的社交媒体账户的设置。然而,有强有力的证据表明,社交媒体的用户缺乏知识的隐私设置(46,58,60)。这是因为隐私设置很难导航和缺乏透明度(46,58)。有证据表明,社交媒体用户并不总是充分配备数字知识运作隐私设置和保护自己的数据。这表明,仅仅因为一个职位是公共的,研究者不能承担岗位的创造者故意使其公共(46)。

例如,Facebook的隐私设置是有问题的,因为他们是不透明的,依赖于用户的自我教育。”(46)

的感觉是,Facebook常常模糊了什么是公共和私人之间的界限,这缺乏区分不明确的Facebook用户,如“私人”的帖子可以被网络公开”。(41)

我们只能正确掌握如何最大化隐私通过了解精确的默认设置意味着什么,然而,用户已经注册了…这些隐私设置并不是特别用户友好。”(58)

一些与会者缺乏隐私设置的工作方式的理解和相信他们不应该被迫研究的(35,36)。莫雷诺et al。36),与会者混淆他们的Facebook是否设置私人或公共,小组讨论后,作出评论,如:

是的,这意味着我的Facebook现在是公开的吗?我不希望这样。”(Facebook用户)(36)

我想我很惊讶,因为我认为这是私人的。”(Facebook用户)(36)

有相当多的人晚加入Facebook的一代还是不知道如何使用它…他们不应该受到惩罚。”(焦点小组7)(35)

这种混乱可能尤其对Facebook的用户,用户可以控制在某种程度上,其他用户可以看到自己的帖子,和可能属于封闭的组织,有隐私的合理期望。对于其他类型的社交媒体公共账户的惯例,如推特,有可能更隐私的期望,尤其是在微博写的名人经常在主流媒体转载。然而,即使没有隐私的期望,误解也明显的用户对社交媒体是如何工作的关于永久职位,返回数据能达到多远,谁可以访问文章,如何分析数据(34)。

我一定会说。<笑着说>可能因为我年轻,所以我开始在社交媒体在我小的时候,很年轻。所以每隔一段时间,我将通过[删除]。”(女)对照组,21日(34)

大部分时间我想说我不怕。但我的意思是,Twitter不会让你回那么远,所以我不是超级担心。”(男性抑郁症组,20日)(34)

你天真地认为,公共微博将会被一百万人吗?我的意思是肯定的是,它公开。任何人都可以去找它,或者寻找它,等等。我的意思是,但它不像碧昂丝推特微博是一样的我。”(抑郁组,54岁男性)(34)

然而,定性研究的参与者表示,同意隐含和数据不应该被认为是私人如果海报未能保护数据隐私设置(34- - - - - -36)。

我不认为这是坏的,你去看人们的资料,“因为如果他们有开放的,这是他们的选择。”(Facebook用户)(36)

我认为这是自己的错的公众形象,因为它是。”(焦点小组8)(35)

这种说法变得尤其困难像Facebook和其他平台已经知道定期设计隐私设置。即使用户需要正式接受变化,可能影响他们现有的隐私设置,无法保证他们有理解,甚至阅读更新的条款和条件。因此,用户可能仍然没有意识到这种变化。这意味着研究人员应该考虑用户可能不是完全控制他们的隐私设置,设置,用户选择(或离开)可能不会反映实际感知隐私。

许可用户被要求?

后直接从讨论数据是否可以被视为公共或私人的问题是否应该要求社会媒体用户同意重用他们发布的内容为新卫生研究的目的。评论员分为赞成和反对收购同意从个人用户(46,71年,75年)。

许多研究人员认为同意成立后不需要收集信息已经在公共领域(45,56,72年)。这个位置之后的假设,数据挖掘是一种公开的材料的二次数据分析;因此,只要数据都是免费和登录细节不需要查看的数据,不需要同意(39)。还讨论了在社会媒体用户是否“参与者”或“公共文字内容的作者”(38,47)。也有实用性的考虑会议同意,它是不切实际的增益选择同意从大量的用户。

个人知情同意涉及大型数据集的研究是不切实际的。在这些情况下研究人员应该确保数据使用符合条款和条件,应注意保护用户的身份”。(39)

在定性研究社交媒体的用户的观点,有参与者觉得同意不是必需的。一些参与者承认,互联网是一个公共领域,因此发布数据是免费的,任何人看到和使用,包括研究人员(33- - - - - -36)。

这是一个很好的办法[研究]。因为如果人们公开展示他们的照片,那么,任何人看到。”(Facebook用户)(36)

作为信息发布在公共互联网,我不认为有必要对许可使用的帖子。”(10)参与者(33)

尽管这第二个报价表明一些用户觉得互联网是公共的,并不是每一个用户可能同意,尤其是考虑到上述困难的细微的隐私设置。相反的观点是,应该征求用户同意。一些参与者在定性研究认为同意应该要求(33- - - - - -35),合理化,因为数据可用于另一个目的用户最初(35)。

我认为他们应该先问,因为他们只有在一个公共网站喜欢你发布它让人们看到的不是为他们的信息。”(焦点小组5)(35)

社会媒体用户承认,同意公布数据的重用是经常需要接受社交媒体网站的条款和条件(34,35),这是常常被评论家的观点。然而,这些政策通常不是由用户阅读,特别是青少年(35)。此外,参与者认为政策条款和条件,作为全面语言使用往往是很难理解和缺乏透明度(34),和评论家同意签署知情同意条款和条件不构成理解传统研究方法(43)。

当同意寻求通过条款和条件文档在进入一个特定的社会媒体网站,年轻人可能不会读;“我不认为任何人读他们。”(焦点小组1)(35)

受访者不觉得简单的毯子语言的“条款和条件”构成了透明度。这样的语言是令人困惑和埋在一个参与者而言,“从来没有人阅读的文本。”(Twitter用户)(34)

同时有一个公平、合法的过程对定量分析社交媒体数据规模,这并不等同于用户同意被包括在一个研究项目”。(43)

数据不会免费登录(例如,封闭的Facebook群组),然后是协议,同意使用前应寻求他们的数据,在这些团体有一个隐私的期望。然而,获得同意的政策在这些情况下可能被认为不可行,考虑到后勤方面的困难遇到这么多潜在的参与者(66年,73年)。建议试图减轻个人同意的要求是“集团同意”可以被收购,有或没有一个退出的成员组(66年);然而,这也有批评者:

即使对一个大型社区开展研究具有独特的身份,比如黑人社区或癌症幸存者社区,获得集团作为一个整体的同意是徒劳的。谁能真正代表集团的癌症幸存者?这是一个无法回答的问题。”(62年)

有一些共识,同意应获得使用弱势群体发布的数据,其中包括儿童。孩子们一组通常需要特殊的保护形式。这通常是寻求获得父母或监护人的同意,当孩子并不总是有足够的决策能力。这构成了更大程度的困难在在线领域研究中,青少年可以感到侮辱的概念必须问父母许可(69年)。孩子也可能是不太可能理解公开发布内容的全部影响及其可能的实现(62年)。同时,这并不总是可能识别,用户可能是未成年或脆弱,所以,不可能有一个毯子的政策。相反,什么是最好的形式的同意将个人研究的最佳决定。

另外一个问题是,删除帖子。用户可以随后删除帖子的社交媒体平台,这可能发生在这个职位已经捕获的研究。这可能意味着同意使用的帖子已经撤回。研究人员应该提前计划如何管理这个问题。一个计划可能会检查所有引用个人帖子公布结果之前仍然存在。如果引用的帖子已被删除,应该从报告中删除39)。

Anonymity-Users不应该被识别

有一个共识在报告和文章,研究人员一个重要责任保持匿名的身份和保护社会媒体的海报内容(65年),在整个分析和特别是在任何发表的结果。参与者在定性研究中还强调了重要性的确保社会媒体用户的匿名文章研究目的重用(时33- - - - - -36)。一些参与者觉得只要保证匿名的海报,同意使用数据不需要(33)。

如果你使用某种形式的统计分析中的数据——而不是直接引用这个帖子我说不许可可能是必要的。”(10)参与者(33)

只要消除识别信息,我真正关心的。”(焦点小组1)(35)

在整个文学评论家提出各种方法来实现匿名。例如,数据应该在本地加密(58),身份信息应该被移除之前出版(61年),用户的身份应该通过伪装来隐藏的(例如,使用假名或合成引号)(59)和数据聚合方法应该被应用(53)。参与者在定性研究中提出的建议可接受的方法来确保他们保持匿名。其中包括聚合的数据(34),使推广,和删除可识别信息(33)。

我很好只要我们可以,你知道,找出方法来保持数据匿名和完全,高度聚合。”(抑郁组,47岁男性)(34)

很少有人会与普遍和匿名引用有问题。”(17)参与者(33)

(不需要许可),只要你不确定海报超过性别、年龄和类型的糖尿病。”(20)参与者(33)

在社会媒体背景下,可能会有更大的风险相比,个人的保密和匿名的传统研究,因为搜索引擎可以检测用户的原始文章当一个关键阶段或引用发表的研究文章(37,41,74年)。这可能允许识别用户的个人资料,将他们联系的可能性通过个人信息的网站(51,56,61年,63年,68年,69年)。

为了避免这种风险,评论家建议避免使用直接引用一个用户的文章(38,51,63年)或套用报价如果觉得有必要包括那样的这种类型的数据(42,56,59,61年)。第三种可能性是合成引用来说明一个发现,基于原则内的数据。

更好地保持尊重人的原则而提出可以证实的数据,我们建议研究人员解释用户的评论”。(56)。

参与者在定性研究中还发现了威胁使用直接引用参与者的文章(33)。

如果您想要使用实际引用的人这是一个不同的问题,即使你在研究使引用匿名将很容易找到作者只需输入关键词在谷歌将给链接回(论坛)。”(29)参与者(33)

ESOMAR指南建议如何处理这个问题:

如果研究人员希望引用公开发表评论,他们必须首先检查用户的身份可以很容易地发现使用在线搜索服务。如果可以,他们必须作出合理的努力寻求用户引用它们的许可或面具评论到了这样一种程度,无法获得用户的身份。”(38)

也有一些担忧,即使数据聚合不可靠的伪装身份。例如,在一个案例研究中,敌人发现的身份匿名的一所大学,只有聚合数据。这是由于信息的独特性给参与者参加的大学。如果课程和一群学生也确认,这将是一个短的一步敌人内部知识之后个人[(63年),引用(16)]。

匿名保护的重要性更大关注的特定人群,尤其是那些生活在一种诊断或谁是弱势群体的一部分(如青少年)(34,35)。歧视和欺凌是两个关键问题:

一旦你有抑郁症的污点——精神疾病在我们的社会中,这是一场艰苦的战斗。即使是现在,人们在我家就像,‘哦,你古怪的声音。你吃过你的药物吗?”(抑郁组,33岁的男性)(34)

De-identification社交媒体的文章是至关重要的负面影响降至最低;“如果你写点东西,回到也许你认识的人,你会被欺负。””(焦点小组3)(35)

ESOMAR报告还表示社交媒体内容的特性列表,它可能是特别重要的保护用户身份:如果正在讨论的话题很敏感或个人;如果使用侮辱性语言;如果它包含任何违法的;如果它包含任何尴尬或可能影响职业机会;如果它包括任何可识别个人的信息或数据对别人这不是已经公开(38)。

重危害与好处

研究人员有义务避免造成身体、情感或心理伤害的参与者。”(40)

根据波和切尔德里斯的研究伦理的原则,研究人员有义务确保无害参与者,和研究目标群体的潜在收益(21)。时是最伤害的风险”社交媒体用户的隐私,保证不透漏学生的姓名已经违反了”(42)。在考虑和违反保密的风险最小化,研究人员还必须确定任何进一步的伤害来源,他们的研究可以沉淀(37,38,41,42,46)。这通常是困难的人员挖掘社交媒体数据,因为他们需要提前预测的伤害来源出版物,通常不明显(74年)。

是项目的一个潜在来源伤害?…它可能很难识别”伤害。“研究人员必须思考任何潜在的伤害,他们的研究可能会招致被敏感的内容从社交媒体网站,和上下文的内容曝光程度,和材料的真实性。”(46)

做一个在线数据之间的联系和他或她的身体使人心理、经济、或物理伤害?”(37)

在整个文学评论家发现几个伤害来源,应考虑通过在线人员。可能的危害包括以下:个人和职业界限模糊;创建一个文化研究者和用户之间的不信任(表单时数据没有同意)(54);让用户的风险“滥用”(40);尴尬,声誉损失,或起诉(42)和滥用的权利不平衡之间存在研究员和用户(56)。

权力,尤其是权力差距研究员和研究,必须考虑。如果滥用权力失衡,严重威胁正义和潜在的危害。”(56)

参与者认为是可识别的研究可能导致网络和主动关注,更为严重的是,“虐待”。这可能是他们认识的人,或从组织可以利用他们。”(40)

评估风险和收益必须特别注意在某些情况下,包括弱势群体,如儿童、敏感问题,可能导致歧视(52,60,74年)。危害可能导致从用户的研究中却不置一词,或出版的敏感的发现,可能会损害整个集团(58)。这个地方责任人员考虑方法,确保个人的匿名是维护(60),连同被同情他们的发现的普遍性(52)。

警惕时需要进行社交媒体对敏感话题的研究,可能会允许参与者的身份,导致歧视;发现的传播可能会损害个人或社会团体;挑战一个人的价值观或信念;和实例的欺凌和虐待。这类研究风险诱发或加剧情绪困扰。”(58)

当重用潜在的个人身份数据时,必须合理的好处的研究(46,51),特别是考虑到一般的引入数据保护监管(GDPR),作为欧洲研究人员的这项立法提供了法律责任,以确保他们提供理由的好处他们的研究将提供(58)。研究人员应该考虑在每个风险-效益关系研究中,这信息发现可以导致病人护理和幸福可以继续,而造成最小伤害用户(56)。一种确保全面考虑风险和危害,研究人员可能不明显,没有生活经验的条件下,从目标人群包括社会媒体用户研究团队或咨询与他们之前的研究。

社会公益研究

一个包罗万象的主题,从定性研究的参与者是一个无私的视图,如果这项研究是为了更大的利益,而不是为了商业利益,然后许多人支持(33- - - - - -36)。一些参与者甚至愿意把隐私的担忧放在一边更好的研究(34)。

嗯,我的意思是Facebook向任何人开放,只要它不是坏的意图我认为这很好。”(Facebook用户)(36)

当人们发布在互联网上,这是有目共睹的。他们不应该抱怨如果可以收集并用于一般的好。”(12)参与者(33)

我不能够知道所有可能的事情,有人会提出,所有的有益的东西,有害的东西。我认为它代表了百分之一的问题,整个阵列的东西可能不应该停止,因为我们过于担心(隐私)。”(抑郁组,54岁男性)(34)

这可能的好处,你知道,处理这些事情的人,好的家庭暴力信息。如果没有风险的个体(正在使用的信息)然后它可能是一件好事(男,61岁+高用户)(40)。

这是由一些青少年参与者强烈地感到,他也觉得所做的研究必须可靠的组织,所以他们的话不是断章取义(35)。

喜欢拥有一个值得信赖的组织,我们知道你不会喜欢旋转的话,让我们看起来像讨厌的青少年只是因为我们可以。就像试着理解它从我们的观点来看,我猜。”(焦点小组1)(35)

这与研究做“利润”由私人公司或开一个议程。

研究由一个非盈利组织,而不是“商业”的原因,是首选的原因有两个。参与者首选非营利研究商业组织这样做是因为前者感觉更“富有成效”,更多的“伦理”和“不剥削”。非营利研究人员首选的第二个原因是参与者不喜欢把他们的社会媒体的帖子被用来生成一个利润。”(40)

伦理批准研究需要吗?

整个论文,混合意见,研究伦理委员会批准(REC)是否需要研究开采从社交媒体网站公开的数据。精神卫生系统回顾社会化媒体研究报告发现,只有9的48篇论文获得矩形批准,和进一步2使用一个数据集伦理审批(78年);这些研究之间没有明显的方法论的差异报告,那些没有寻求伦理审批。

一个重要的考虑因素在确定如果社交媒体挖掘需要REC批准专注于社交媒体的用户发布的内容是否被认为是人类研究对象,因此参与者的研究;或者如果他们发布的内容可以被视为独立的公共数据的作者,因此研究可以被认为是一个辅助数据分析(37,47)。

在网络的研究中,“人类主题”从来都不是一个适合描述许多基于互联网的研究环境。(37)

一些研究者认为挖掘社交媒体数据的过程是同义的观察人们在公共场所,如公园,但他们也发现这个角度看可能不共享的每一个人。

研究者认为…个人意识到他们是在公共领域和可能被观察到。她寻求研究伦理咨询,因为她认识到其他人可能觉得观看公开的Facebook页面从本质上不同于观察未知的人在公园里,例如。”(73年)

另一方面,一些研究人员试图更清楚地定义人类学科研究的意义通过应用一个法律定义术语“人类的话题。”这个定义不包括社会媒体内容的作者,然后建议使用这种形式的被动数据免于矩形审批过程,特别是如果研究者不与用户交互或发布的信息(55,59,63年,76年)。

如果满足下列条件:访问(社交网站)是公开的;信息是可识别的,而不是私人;和信息收集不需要与人的互动在网上发布;然后大概项目并不构成人体研究。”(63年)

因为大多数社交媒体项目依靠公开的数据,而不包括干预或与人口的交互,他们可能有资格获得IRB内部审查委员会免除状态”(47)

那里的研究人员寻求伦理委员会批准,他们不应该假定,这即是他们考虑的伦理问题在项目本身(如用户匿名性和风险/收益比率):

许多伦理的董事会不了解矿业和大数据匿名化的过程,更不用说会导致数据的错误成为个人身份。问责制需要严谨的思考大数据的影响,而不是假设伦理委员会一定会确保人们的工作保护”。(49)

法律问题和条款和条件的网站

更少的文章提到这个主题,发现最常见的文章和报告中发现通过灰色文献检索。自动化技术工具”可以收集、清洗、储存和分析大量的数据以很高的速度”(39),研究人员并不总是允许以这种方式获取数据通过社交媒体网站的规则(50)。研究人员应该清楚在社交媒体网站的条款和条件的约束,应该确保他们操作在法律允许的范围之内。

重要的是研究人员花时间阅读用户协议为社交媒体平台管理实践所允许的,提供指导意见发布帖子。”(44)

一些指导方针建议研究人员遵守网站的规定,他们挖掘的数据(37,40,42,72年),和法律(38),找出用户同意在数据捕获(41)。例如,如果在Facebook上进行研究,明确国家在条款和条件,研究人员都应该通知并获得同意的人从他们收集数据(58,63年)。

现在Facebook的声明的权利和责任,当收集用户的个人数据,必须获得同意,弄清楚是谁收集的信息,并宣布将如何使用数据”。(58)

同意Twitter的条款和服务协议,用户同意他们的信息收集和使用的第三方(44)。研究人员使用Twitter数据通常证明他们的收集和分析,因为用户的推文已签署本协议。然而,Twitter的条款和条件不允许刮或下载的tweet(相反,研究人员应该使用一个通过Twitter API),因此,研究人员获取数据可能违反Twitter的条款和条件(44)。另一个考虑是Twitter用户保留“被遗忘”(77年),这对复杂的直接引用,尤其是没有同意,因为这些不容易从同行评议的出版物。Reddit等其他网站也有官方的api访问的文章和相关元数据用于研究。

数据治理,注释,算法,和连接

一个新兴主题,只有最近的文章和填充这些NLP的关注,建议研究人员关注透明度的方法,和良好的治理实践关于数据集,注释和链接。

有一个紧张局势后创建的数据集社交媒体数据的收集。两个参数,支持共享公开数据集和注释,并主张数据集应该受到保护,以防它们包含潜在的敏感数据。数据集有用户身份信息披露的风险可能是放置在一个受保护的服务器为例(47)。

我们强烈鼓励研究人员分享数据和注释他们已经创建了,这样其他人可以复制现有的研究成果和开发新的用途数据集…然而,用户可能会有风险,数据不应盲目地共享没有关心将如何使用它。”(47)

而共享注释数据大幅减少了负担其他研究人员创建和注释新的集,注释的数据也应该被视为潜在的敏感:

领域专家可以手动标签用户对不同的医疗条件基于他们的公开声明。这些注释,手动或自动提取的,甚至可能被视为敏感的用户信息当来自公共数据。”(47)

建议注释分开存储的原始数据。

减少或伤害用户的再次鉴定的可能性,建议删除作者的名字和@tag数据集,剔除其它人或地名命名,删除元数据,如地理位置,归纳数据,如位置大群类别(例如,城市而不是街道名称),并确定“需要创建派生特征是至关重要的一个项目,而不是运行这些算法为标准”。(43)

需要进一步的透明度在数据处理和信息提取方法的研究。虽然数据科学方法可以表达的客观性,研究人员应该知道偏见可能是由他们的算法引入或识别,实体识别、或关系提取方法。同样重要的是,这些方法都是向公众开放的文化和社交媒体用户透明度:

机器学习算法不学习完美的预测模型。将错误和错误分类,这应由研究者占。”(47)

如果使用软件,增强了Twitter数据,确保算法,推导出特征和分类用户研究者和研究对象是开放的。准确性、配置和阈值设置的算法应该公开,以确保可再生的研究。”(77年)

许多人没有意识到代理的多样性和算法目前收集和存储他们的数据,以供将来使用。研究人员在用户想象的观众很少。”(49)

特别谨慎使用“现成的”时应该使用算法,不易于理解的研究:

数据抓取没有上下文可能会导致不准确的算法可能会报道和在应用程序中重用,导致潜在的有害后果。”(50)

研究者应该非常谨慎当链接在网站或其他数据源的数据。虽然用户可以共享数据在多个平台上公开,他们可能不打算让组合跨平台的数据是公开的(61年)。尤其应使用谨慎如果试图确定相同的用户发布在单独的网站或平台上,他们可能不希望被人识别在所有平台上(例如,在Twitter上与一个匿名病人论坛)。高的可能性使个人更可通过连接不同数据源的数据,REC批准应该寻求这个活动。

讨论

我们回顾了主要伦理问题接近文本挖掘社交媒体数据的卫生研究和相关所有NLP和文本挖掘研究人员从事这项努力。像以前的评论和指导方针,我们展示了存在的一个复杂的交织在一起的矩阵的伦理性考量使用社会媒体数据为研究目的。我们有扩展以前的工作通过展示一些主题特定于分析师和计算机科学家们采用自动算法和其他方法来处理多个文档。

学术研究者的关键问题,确定是否同意或伦理审查需要达成共识社会媒体用户是否被认为是人类受试者在研究,还是他们的数据被认为是公共数据的研究人员正在进行二次分析。许多评论员认为,社交媒体在公共领域,公共或私人性质的控制由用户通过他们的隐私设置。因此,如果他们是自由展示的数据在一个可观测的公共领域,他们放弃了隐私权的数据,并且数据可以被认为是公众。然而,这应由研究者考虑平衡是多么容易让用户控制他们的隐私设置平台的数据被收集。

知情同意是由参与者自愿协议和心智能力理解参与研究的全部后果。它是研究伦理的最重要方面之一(79年),这可能占强主题讨论问题在这个审查同意。知情同意的原则是嵌入在最有影响力的研究伦理报告,如纽伦堡代码,赫尔辛基宣言,贝尔蒙特报告(20.)。在社交媒体数据的情况下被认为是公共的,专家普遍认为,同意是不必要的,除了特殊情况涉及弱势群体和敏感问题。

然而,社交媒体用户更分裂的要求同意,他们承认,隐私设置是具有挑战性的导航。通常社会媒体平台更新他们的使用条款和隐私控制,这意味着用户必须回去和导航一个新系统,以确保他们的隐私选择仍然正确设置。这些流沙可以视为在吉布森的相应理论(80年),这是用于科学技术研究和其他相关字段(81年,82年)——机构在社交媒体平台的一部分。在这个例子中,平台的技术属性可能变化函数约束机构用户,确保更多的公共内容仍可用在默认情况下,可以最大化和用户之间的连接(83年)。

提出反对获得同意的另一个问题是,这样做通常是不切实际的,当使用这样的大型数据集。以前一些评论家讨论是否不切实际在获得同意可以被视为一个不这样做的理由。这是讨论有关临床试验的紧急治疗,例如,而且在需要的情况下同意将减少夹杂物的研究社会的大多数从事或授权部门,比如可能与大数据集健康(84年)。这影响数据质量和结果在参与者的偏向选择和可能是最被剥夺权利的社会仍有待研究。此外,它已被指出,用户与健康状况积极管理他们的身份是如何呈现在网上,考虑到隐私(85年)。例如,那些怀疑他们的数据可以用来推断出他们的健康状况,例如,为定向广告,可能故意部署策略来掩盖他们的基本条件(例如,通过过滤或改变文章的内容或频率)(86年)。这又会影响数据质量和可靠性。

尽管数据经常被认为是公众、专家和用户表达的重要性,确保社会媒体的匿名用户在项目出版物,并承认这很难实现是否打印完整的直接引用。因此,研究人员应采取适当的措施来确保匿名性等采用方法消除身份信息,伪装身份,聚合数据,进行归纳,并创建合成报价。匿名化的数据也会导致不需要同意的观点:在2001年的《赫尔辛基宣言》,它的国家”人体医学研究之对象识别人类研究材料或可识别的数据”(87年),从而删除或不收集,用户的标识符对社交媒体的决心矿业研究人体研究的不符合标准。

即使在某些情况下,社交媒体挖掘并不符合人体研究的模具,这并不意味着它是免费的伦理问题。所涉及的问题可能不是通过传统伦理框架(88年)和新的、创造性的思维方式可能需要研究伦理。一个潜在的方法是护理的伦理理论(89年)。这个理论已由女权主义思想的道德照顾别人。与更传统的伦理基础,它侧重于研究的关系,承认权力的差异以及存在的脆弱性。它还强调了道德决策,需要在项目设计(90年)。

符合这一理论,我们的研究表明,研究人员应该考虑和识别潜在危害可能来自社交媒体数据的使用,这与个人的数据是否使用,或对病人组作为一个整体(比如发帖指责问题),或社会媒体用户之间的关系和信任和研究社区。在我们的研究,参考特殊考虑,应该颁发给弱势群体和被污名化的问题,但很难定义这些术语包含什么。定义这些团体应当给予更多考虑,但很可能人员需要反思并确定这个项目的基础上。包括社会媒体用户与生活经验的条件下研究在研究团队将帮助研究人员更多关于潜在的偏见或伤害的反光,这可能导致他们的工作。损害了理想情况下应该探索研究开始之前,与所有利益相关方的咨询。确保广泛认可的研究中,研究人员时应明确的主要目标是公共利益,而非私人利润或进一步的议程,和路线的好处应该是透明的传播研究。

研究质量和透明度是另外的问题,导致整个科学研究的道德本质。尤其重要,文本挖掘研究人员确保他们工作的质量通过开发或使用高质量的技术和仔细检查任何限制或偏见的理解数据和生产的环境中,或者在他们的透明度和质量数据抓取和分析方法。这些元素缺乏关心和严格科学的研究将使他们的工作有关,即使没有其他伦理问题(50)。

优势和局限性

我们确定了一个广泛的同行评议的文章,评论,评论,和灰色文献报道,但可能没有捕捉到每一个在这个问题上的作品。三个搜索的搜索规范的挑战,由于本文的跨学科性质(计算机科学、医学研究和伦理),这意味着网格条件不能被使用。因此,它是可能的,一些条款可能被忽略了,例如,当我们使用术语“论坛”在网络论坛,我们没有指定Reddit等网站,链接,Instagram,微信,或YouTube上;因此,它是可能的,我们错过了论文聚焦于特定的网站。这可能主题的范围有限,如法律、条款和条件的主题,来识别相关问题每个站点。此外,由于用户人口统计不同网站,这个选择可能影响参与者的范围(和视图)包括在审查中。

此外,这项研究很可能错过了一些观点排除论文不关注健康研究和学术研究,也就是说,这里形成的指导方针可能缺少考虑特定于其他科学社会和市场研究等领域。作为我们的搜索限制在医学、社会科学、和生活science-focused数据库,我们可能错过了一些计算机科学文献,如论文的会议记录。其中一些被拿起灰色文献检索,但仍有可能,有些可能已经错过了。

一旦最后的文章被选中,它是不可能评估专家的评论文章和灰色文献的质量方针,报告和公共意见是来自小池的四篇论文,由于缺少同行评议的研究在这个领域。这可能导致选择性偏差的结果,作为文章集中于特定的人群(青少年,心理健康,和糖尿病),所以这里演示的观点可能并不适用于所有其他社交媒体用户或条件,可以研究。

虽然是尽一切努力保持中立和数据使主题分析,由于本研究的定性性质,重要的是要认识到无意识的偏见或主观性的可能性的结果,因为研究者的学术兴趣和知识。然而,我们的研究结果与其他评论在这个领域具有可比性,如高德et al。(23)。

建议,未来的工作和结论

社交媒体研究使用文本分析和NLP正在迅速发展在很大程度上不受监管的景观(24),许多研究人员承认没有和后续需要指导(23,51,66年,68年,69年,72年,75年)。,在各种情况下,社交媒体文本挖掘可以合法和合理进行没有特定的伦理委员会批准,在某些情况下,从伦理审查委员会应该寻求。

伦理批准被认为是必要的研究使用数据从封闭的团体,从事直接接触用户,当通过社交媒体进行任何形式的干预,如果研究是关于用户18岁以下或缺乏能力,如果用户可以识别的研究出版物或数据集,如果多个来源的数据联系,或者,如果协商后,评估,有合理的潜在危害或歧视发生的风险。同样,研究人员应该从社会媒体用户获得同意上面的情况。

无论正式批准,我们做一些额外的建议来提高道德标准在所有文本挖掘研究使用社交媒体数据用于卫生研究目的,包括增加公众对研究使用社会媒体数据;目标数据访问和分析方法的透明度;路线的透明度的好处为用户研究;咨询与社交媒体用户和目标群体识别和减轻可能产生的潜在危害的研究;并确保社会媒体用户的匿名掩蔽或合成直接引用和聚合定量数据。研究人员应该总是在法律和遵守社会媒体网站的条款和条件,例如,使用批准的api来访问数据,例如Twitter和Reddit,存在其他网站。研究团体作为一个整体应该促进文化的持续改进技术和透明度的方法处理卫生研究社交媒体数据(91年)。

未来的工作在这个领域将致力于提炼出一个列表的建议或指导文本挖掘研究人员可以广泛传播,和国家监管机构和顾问一起工作。此外,我们建议咨询与社交媒体供应商与他们合作来提高透明度的条款和条件,和可访问性的指导,来访问和使用卫生研究他们的用户的数据。这将有助于确保透明和道德实践成为嵌入在文本挖掘社交媒体数据的文化和道德指导。我们还注意到一些研究社会媒体用户要求他们对于他们的数据被用于卫生研究的观点非常有限,我们建议在这一领域进行更多的研究。

数据可用性声明

最初的贡献提出了研究中都包含在这篇文章/补充材料,进一步调查可以直接到通讯作者/ s。

作者的贡献

EF构思研究并进行一些搜索,筛选和分析和起草。学生进行搜索、筛选和分析和写论文的初稿。韩进行一些检查和评论论文草稿。KJ评论论文草稿。所有作者同意负责的工作内容。

资金

这项研究是由英国医学研究理事会(授予LH) (Ref:先生/ S004025/1)。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

引用

1。坎普。数字2019:全球互联网使用加速。(2019)。网上:https://wearesocial.com/雷竞技公司blog/2019/01/digital - 2019 -全球互联网使用加速(2019年1月30日访问)。

2。Denecke K, Nejdl w .医疗社交媒体数据有多大价值?内容分析的医疗网络。通知科学。(2009)179:1870 - 80。doi: 10.1016 / j.ins.2009.01.025

CrossRef全文|谷歌学术搜索

3所示。VanDam C, Kanthawala年代,普拉特W,柴J,嗯J .检测在线病人临床相关内容的帖子。J生物医学通知。(2017)75:96 - 106。doi: 10.1016 / j.jbi.2017.09.015

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

4所示。学习SA Hazlett DE,哈里森L,卡罗尔JK,欧文,和霍文c。医疗保健的新维度:系统回顾的用途,福利,和社交媒体健康传播的局限性。J地中海互联网Res。(2013)15:e85燃料。doi: 10.2196 / jmir.1933

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

5。Antheunis ML,塔兹·K, Nieboer TE。患者和健康专业人士使用社会化媒体在医疗保健:动机,障碍和期望。病人建造清纯甜美。(2013)92:426-31。doi: 10.1016 / j.pec.2013.06.020

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

6。Sinnenberg L, Buttenheim, Padrez K, Mancheno C,安格L,商人RM。Twitter作为卫生研究工具:系统回顾。公共卫生是J。(2017)107:e1-8。doi: 10.2105 / AJPH.2016.303512

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

7所示。理发师TX,银色的乔丹。事实,虚构与实验者偏差效应。Psychol公牛。(1968)70:1。doi: 10.1037 / h0026724

CrossRef全文|谷歌学术搜索

8。Nikfarjam,衬衣,奥康纳K, Ginn R,从社交媒体和冈萨雷斯g .药物警戒:矿业药物不良反应提到使用词的序列标签嵌入集群功能。J是通知协会。(2015)22:671 - 81。doi: 10.1093 /地点/ ocu041

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

9。刘,刘J,陈h .识别药物不良事件从健康社交媒体:一个案例研究在心脏病论坛。:国际会议上聪明健康。可汗:施普林格(2014)。

《公共医学图书馆摘要》|谷歌学术搜索

10。科里CD,库克DJ, Mikler AR,辛格KP。文本数据挖掘和结构性的流感在网络和社会化媒体提及。Int J围住Res公共卫生。(2010)7:596 - 615。doi: 10.3390 / ijerph7020596

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

11。Jashinsky J,伯顿SH、汉森CL、西J, Giraud-Carrier C, Barnes博士等。跟踪自杀危险因素通过Twitter在美国。危机。(2014)35:51-9。0227 - 5910 . doi: 10.1027 / / a000234

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

12。康威M,胡M,查普曼WW。最近的进步使用自然语言处理解决公共卫生研究使用社会媒体和consumergenerated数据的问题。地中海年鉴通知。(2019)28:208-17。doi: 10.1055 / s - 0039 - 1677918

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

13。Cepoiu M, McCusker J科尔毫克,Sewitch M, Belzile E, a .抑郁症的识别和奥·钱皮综合医院内科医生系统文献回顾和荟萃分析。J创实习生地中海。(2008)23:25-36。doi: 10.1007 / s11606 - 007 - 0428 - 5

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

14。透露,库尔森NS。专题分析帕金森病病人沟通的在线支持小组讨论论坛。第一版哼Behav。(2012)28:500-6。doi: 10.1016 / j.chb.2011.10.022

CrossRef全文|谷歌学术搜索

15。Eysenbach G,直到我。伦理问题的定性研究互联网社区。BMJ。(2001)323:1103-5。doi: 10.1136 / bmj.323.7321.1103

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

16。齐默m .“但是数据已经公开”:在Facebook的伦理研究。道德Inf抛光工艺。(2010)12:313-25。doi: 10.1007 / s10676 - 010 - 9227 - 5

CrossRef全文|谷歌学术搜索

17所示。齐默M。OkCupid和大数据研究的伦理。(2016)。网上:https://雷竞技公司blog.primr.org/okcupid-ethics-big-data-research/(2019年3月6日通过)。

18岁。艾特肯M,德圣Jorre J, Pagliari C,杰普森R, Cunningham-Burley美国公众对健康数据的共享和联动研究目的:系统回顾和主题定性的综合研究。BMC医学道德。(2016)17:73。doi: 10.1186 / s12910 - 016 - 0153 - x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

19所示。斯托克代尔J,卡塞尔J,福特大肠“回馈”:系统回顾和道德调查公众意见研究病人数据的使用在英国和爱尔兰共和国。威康Res开放。(2019)三6。doi: 10.12688 / wellcomeopenres.13531.2

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

20.健康教育和福利。贝尔蒙特的报告。伦理原则和指导方针保护人类受试者的研究1079。网上:https://www.hhs.gov/ohrp/sites/default/files/the -贝尔蒙特- 508 c_final.pdf报告(2020年8月5日访问)。

谷歌学术搜索

21。波TL和切尔德里斯摩根富林明。生物医学伦理原则。6日。纽约,纽约:牛津大学出版社(2009)。

谷歌学术搜索

22。> D, Kenneally E。门罗报告:道德原则指导信息和通信技术的研究。美国国土安全部(2012)。doi: 10.2139 / ssrn.2445102

CrossRef全文|谷歌学术搜索

23。高德年代,艾哈迈德年代,诺曼·G和布斯a态度使用社交媒体的伦理研究:系统回顾。J地中海互联网Res。(2017)19:e195。doi: 10.2196 / jmir.7082

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

24。Pagoto年代,Nebeker c .科学家如何率先建立社会媒体伦理实践的研究。J是通知协会。(2019)26:311-3。doi: 10.1093 /地点/ ocy174

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

25。Nebeker C,哈洛J,埃斯皮诺萨Giacinto R, Orozco-Linares R,布劳斯CS,和韦贝尔n .道德和监管挑战使用普遍的传感和其他新兴技术的研究:IRB的观点。AJOB Empir Bioeth。(2017)8:266 - 76。doi: 10.1080 / 23294515.2017.1403980

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

26岁。福特E,牧羊人美国对一个道德框架的文本挖掘社交媒体卫生研究:系统回顾。普洛斯彼罗Int前景登记系统转速。(2018)CRD42018112923。网上:https://www.crd.york.ac.uk/prospero/display_record.php?RecordID=112923(08年1月访问,2021)。

27。莫赫D, Liberati泰兹拉夫,J,奥特曼DG。首选项报告系统评价和荟萃分析:棱镜声明。安实习生地中海。(2009)151:264-9。doi: 10.7326 / 0003-4819-151-4-200908180-00135

CrossRef全文|谷歌学术搜索

28。通,弗莱明•K麦克因尼斯E,奥利弗年代,和克雷格•j .增强透明度报告定性研究的合成:ENTREQ。BMC医学Res Methodol。(2012)12:181。doi: 10.1186 / 1471-2288-12-181

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

29。亚当斯J, Hillier-Brown FC,摩尔黄建忠、湖泊AA, Araujo-Soares V,白色的米,等。搜索和合成“灰色文献”和“灰色信息”在公共卫生:批判性反思三个案例研究。系统转速。(2016)5:164。doi: 10.1186 / s13643 - 016 - 0337 - y

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

30.库克,史密斯D,布斯超出PICO:蜘蛛定性证据合成的工具。质量卫生Res。(2012)22:1435-43。doi: 10.1177 / 1049732312452938

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

31日。步伐R, Pluye P,巴特利特G,麦考利AC,主管J, Jagosh J,等。测试的可靠性和效率试验混合系统的混合研究方法评估工具(MMAT)审查。Int J孕育钉。(2012)49:47-53。doi: 10.1016 / j.ijnurstu.2011.07.002

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

32。托马斯J,硬a方法专题合成系统评价的定性研究。BMC医学Res Methodol。(2008)8点45分。doi: 10.1186 / 1471-2288-8-45

CrossRef全文|谷歌学术搜索

33。债券CS,艾哈迈德哦,后米,托马斯B, Hewitt-Taylor j .使用健康的概念和更实用的伦理困境讨论板的帖子作为研究数据。J地中海互联网Res。(2013)15:e112。doi: 10.2196 / jmir.2435

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

34。米J,赫斯特,在使用Twitter和康威m .伦理问题群体抑郁监控:定性研究。BMC医学道德。(2016)17:22。doi: 10.1186 / s12910 - 016 - 0105 - 5

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

35。僧侣H,卡多佐P, Papageorgiou,卡罗兰C,科斯特洛L,托马斯·L .年轻人的观点关于参与心理健康和福祉研究通过社交媒体。Int J条件建造。(2015)7:4-19。

谷歌学术搜索

36。莫雷诺,格兰特,Kacvinsky L,莫雷诺P,弗莱明m .年长的青少年的观点关于facebook参与研究。J Adolesc健康。(2012)51:439-44。doi: 10.1016 / j.jadohealth.2012.02.001

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

37岁。马卡姆,和布坎南E。道德决策和网络研究:2.0版。建议从AoIR伦理工作委员会(2012)。网上:http://aoir.org/reports/ethics2.pdf

谷歌学术搜索

38。ESOMAR。在社交媒体研究Esomar指南。阿姆斯特丹:ESOMAR (2011)。网上:https://www.esomar.org/uploads/public/knowledge-and-standards/codes-and-guidelines/ESOMAR-Guideline-on-Social-Media-Research.pdf

40。贝宁K,炒股,家用亚麻平布N,勒普H, Nass L,西尔维斯特H。研究使用社交媒体;用户的意见。(2014)。网上:http://www.natcen.ac.uk/media/282288/p0639 -研究-使用社会媒体报道——最终——190214. - pdf(2020年8月5日访问)。

《公共医学图书馆摘要》|谷歌学术搜索

41岁。安文L,肯尼。研究伦理研讨会的报告在2016年7月14日星期四举行。互联网和社交媒体的伦理研究。(2016)。网上:https://www.sheffield.ac.uk/polopoly_fs/1.644904 ! /文件/ Report_Ethics_of_Social_Media_Research_Jul16.pdf(2020年8月5日访问)。

42。汤森L, C和华莱士。社交媒体研究:一个道德指南。(2016)。网上:https://www.gla.ac.uk/media/Media_487729_smxx.pdf(2020年8月5日访问)。

谷歌学术搜索

43。埃文斯H,吉妮年代,巴特利特J。SocialEthics:在社交媒体中嵌入伦理研究指南。(2015)。网上:https://www.ipsos.com/sites/default/files/migrations/en-uk/files/Assets/Docs/Publications/im-demos-social-ethics-in-social-media-research-summary.pdf(2020年8月5日访问)。

44岁。艾哈迈德·W浴PA, Demartini g .使用Twitter作为数据来源:概述的伦理、法律和方法论的挑战。在线伦理Res。(2017)2:4。doi: 10.1108 / s2398 - 601820180000002004

CrossRef全文|谷歌学术搜索

45岁。阿扎姆r .访问社交媒体信息对药物警戒:道德的影响是什么?其他药物Saf副词。(2018)9:385-7。doi: 10.1177 / 2042098618778191

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

46岁。火矮人SA。社会媒体渠道健康care研究和伦理问题。JAMA J道德。(2017)19:1061-9。doi: 10.1001 / journalofethics.2017.19.11.peer1 - 1711

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

47岁。本顿,铜匠G, Dredze m .伦理社会媒体健康研究研究协议。:诉讼的第一ACL车间在自然语言处理的伦理。瓦伦西亚(2017)。

谷歌学术搜索

48。Bica M,安德森j .你推特!“(重新)出版的伦理公共数据制作的故事。:人机交互研究中的伦理遇到研讨会/ ACM Conf人为因素在计算加利福尼亚州圣何塞,(2016)。

49。博伊德D,克劳福德k .大数据的关键问题:挑衅文化,技术,和学术现象。通知Commun Soc。(2012)15:662 - 79。doi: 10.1080 / 1369118 x.2012.678878

CrossRef全文|谷歌学术搜索

50。Chiauzzi E,威克斯p .数字侵权:道德和违反使用条款的研究人员访问数据从病人一个在线社区。J地中海互联网Res。(2019)21:e11985。doi: 10.2196/11985

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

51。康威m .伦理问题在使用twitter公共卫生监测和研究:da分类研究文献的伦理概念。J地中海互联网Res。(2014)16:e290。doi: 10.2196 / jmir.3617

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

52岁。康威M,奥康纳d .社交媒体,大数据,和心理健康:目前的进步和道德的影响。当今Psychol(2016)9:77 - 82。doi: 10.1016 / j.copsyc.2016.01.004

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

53岁。Denecke k .使用医学伦理方面的社会化媒体在医疗应用程序。学生健康抛光工艺通知。(2014)198:55 - 62。doi: 10.3233 / 978-1-61499-397-1-55

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

54。Farnan JM。连通性和同意:发帖参与意味着什么?生物伦理学。(2014)14:62-3。doi: 10.1080 / 15265161.2014.947823

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

55。固特异。社交媒体,应用和可穿戴技术:在道德困境和程序。战Res运动Exerc健康。(2017)9:285 - 302。doi: 10.1080 / 2159676 x.2017.1303790

CrossRef全文|谷歌学术搜索

56。Gustafson DL, Woodworth CF。方法论和伦理问题的研究使用社交媒体:人类乳头瘤病毒疫苗研究的元方法。BMC医学Res Methodol。(2014)14:127。doi: 10.1186 / 1471-2288-14-127

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

57。锤乔丹。伦理性考量当使用社交媒体进行研究。肿瘤防治杂志历史论坛。(2017)44:410-2。onf.410 doi: 10.1188/17. - 412

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

58岁。猎人射频,高夫A、O 'Kane N部G,菲茨帕特里克,沃克T, et al。公共卫生伦理问题在社会化媒体研究。公共卫生是J。(2018)108:343-8。doi: 10.2105 / AJPH.2017.304249

CrossRef全文|谷歌学术搜索

59。拉弗蒂NT, Manca a于社交媒体的观点和研究:一种合成审查。Int牧师精神病学。(2015)27:85 - 96。doi: 10.3109 / 09540261.2015.1009419

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

60。李j .健康社交网站的隐私政策。J是通知协会。(2013)20:704-7。doi: 10.1136 / amiajnl - 2012 - 001500

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

61年。麦基r .伦理问题在使用社交媒体对健康和卫生保健的研究。卫生政策。(2013)110:298 - 301。doi: 10.1016 / j.healthpol.2013.02.006

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

62年。莫雷诺,富士达数控,克里斯塔基斯哒。研究伦理在mySpace的时代。儿科。(2008)121:157 - 61。doi: 10.1542 / peds.2007 - 3015

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

63年。莫雷诺,Goniu N,莫雷诺PS, Diekema d .道德社会化媒体研究:常见问题和实际问题。Cyberpsychol Behav Soc Netw。(2013)16:708-13。doi: 10.1089 / cyber.2012.0334

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

64年。Norva C,亨德森上下文同意:卫生研究社交媒体的道德矿业。arXiv预印本。(2017)arXiv: 170107765。

谷歌学术搜索

65年。Ravoire S朗M佩兰的参与者接受XRTN。在线社区的优缺点研究病人的健康产品。Therapie。(2017)72:135-43。doi: 10.1016 / j.therap.2016.11.058

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

66年。Schneble有限公司Elger BS,肖d—剑桥事件和internet-mediated研究。EMBO代表。(2018)19:e46579。doi: 10.15252 / embr.201846579

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

67年。琼斯夏基S, R,史密森J, Hewis E,埃曼T,福特T, et al。互联网研究涉及弱势群体的道德实践:教训自残论坛的一项研究(SharpTalk)。J医学道德。(2011)37:752-8。doi: 10.1136 / medethics - 2011 - 100080

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

68年。史密斯J,密林LJ。社交媒体:相关性进行研究。Evid孕育。(2016)19:99 - 100。doi: 10.1136 / eb - 2016 - 102475

CrossRef全文|谷歌学术搜索

69年。斯普里格m .同意在网络空间:基于互联网的研究涉及的年轻人。莫纳什大学生物伦理学牧师。(2009)28:25-39。doi: 10.1007 / BF03351319

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

70年。Sugiura L,怀尔斯R,教皇c .伦理挑战在线研究:公共/私有观念。Res道德。(2017)13:184 - 99。doi: 10.1177 / 1747016116650720

CrossRef全文|谷歌学术搜索

71年。Swirsky ES、箍詹和Labott美国使用社交媒体研究:新模因的新道德吗?生物伦理学。(2014)14:60-1。doi: 10.1080 / 15265161.2014.948302

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

72年。泰勒J, Pagliari c .挖掘社交媒体数据:研究赞助商和研究如何解决伦理挑战?Res道德。(2018)14:1-39。doi: 10.1177 / 1747016117738559

CrossRef全文|谷歌学术搜索

73年。泰勒哈,Kuwana E, Wilfond BS。社交媒体在卫生保健研究的伦理问题。Ame J生物伦理学。(2014)14:58-9。doi: 10.1080 / 15265161.2014.947820

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

74年。瓦伦特TW,皮特老社会网络理论的评价和分析应用于公共卫生:挑战和机遇。为公共卫生。(2017)38:103-18。doi: 10.1146 / annurev - publhealth - 031816 - 044528

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

75年。Vayena E, Mastroianni,卡恩j .抓住了在web:对在线健康研究的知情同意。Sci Transl地中海。(2013)5:173fs6。doi: 10.2139 / ssrn.2272177

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

76年。Weigmann k .卫生研究2.0:用在研究社交网络的个人健康或健康数据共享提出了科学和伦理问题。EMBO代表。(2014)15:223-6。doi: 10.1002 / embr.201438510

CrossRef全文|谷歌学术搜索

77年。威廉姆斯ML, Burnap P,和斯隆l .对一个道德框架发布Twitter数据的社会研究:考虑用户的观点,网络环境和算法的估计。社会学。(2017)51:1149 - 68。doi: 10.1177 / 0038038517708140

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

78年。Wongkoblap, Vadillo马,Curcin诉研究在社会媒体的时代精神卫生疾病:系统性回顾。J地中海互联网Res。(2017)19:1。doi: 10.2196 / jmir.7215

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

79年。Gupta加州大学。知情同意在临床研究:回顾一些概念和领域。教谕Res。(2013)4:26-32。doi: 10.4103 / 2229 - 3485.106373

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

80年。吉布森JJ。确定相应的理论。肖:RJB,编辑器。感知,和了解。山谷,台北:劳伦斯Erlbaum (1977)。

《公共医学图书馆摘要》|谷歌学术搜索

81年。Vos JFJ Boonstra AA-O, Kooistra Seelen M, van Offenbeek M .使用电子健康记录的影响在医学专业之间的合作。Res BMC的健康服务。20:676。doi: 10.1186 / s12913 - 020 - 05542 - 6

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

82年。Bardram我,胡本s .协作确定相应的医疗记录。第一版的合作支持。(2018)27:1-36。doi: 10.1007 / s10606 - 017 - 9298 - 5

CrossRef全文|谷歌学术搜索

83年。范Dijck j . Facebook和连通性的工程:一个多层次的社交媒体平台的方法。收敛性。(2013)19:141-55。doi: 10.1177 / 1354856512457548

CrossRef全文|谷歌学术搜索

84年。Rebers年代,Aaronson NK, van Leeuwen FE,施密特可例外与干预研究的知情同意。BMC医学道德。(2016)透。doi: 10.1186 / s12910 - 016 - 0092 - 6

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

85年。布雷迪E, Segar J,桑德斯c .“我总是兽医”:在隐私和自我表现的对健康个体之间的讨论版与长期的条件。J地中海互联网Res。(2016)18:e274。doi: 10.2196 / jmir.6019

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

86年。福特E, Curlewis K, Wongkoblap, Curcin诉公共意见来识别用户使用社交媒体内容与抑郁和精神卫生保健目标广告:混合方法调查。JMIR心理健康。(2019)6:e12942。doi: 10.2196/12942

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

87年。世界医学协会赫尔辛基宣言。涉及人类受试者的医学研究的伦理原则。牛世界卫生机关。(2001)79:373-4。doi: 10.1097 / 00063110-200109000-00010

CrossRef全文|谷歌学术搜索

88年。赫伦M,辛克莱M、Kernohan G和斯托克代尔j .伦理问题在进行互联网用户生成内容的研究:一个文献之回顾。科学证据。(2011)9:9-15。

谷歌学术搜索

89年。V举行。医疗伦理:个人、政治和全球。牛津大学出版社(2006)的需求。

谷歌学术搜索

90年。Suomela T, Chee F, Berendt B,罗克韦尔g应用互联网研究道德的护理:gamergate和数字人文。数字螺栓。(2019)9:4。doi: 10.16995 / dscn.302

CrossRef全文|谷歌学术搜索

91年。福特E,奥斯瓦尔德,哈桑L, Bozentko K, Nenadic G和卡塞尔j .自由文本数据在电子病历应共享的研究?公民陪审团在英国学习。J医学道德。(2020)46:367 - 77。doi: 10.1136 / medethics - 2019 - 105472

CrossRef全文|谷歌学术搜索

关键词:社交媒体、文本挖掘、医疗研究、自然语言处理、道德

引用:福特E,牧羊人,琼斯哈桑K和L(2021)对一个道德框架的文本挖掘社交媒体卫生研究:系统回顾。前面。数字。健康2:592237。doi: 10.3389 / fdgth.2020.592237

收到:2020年8月06;接受:2020年12月18日;
发表:2021年1月26日。

编辑:

帕特里克鲁赫瑞士,日内瓦学校工商管理

审核:

安妮·t·陈美国华盛顿大学
Karmen威廉斯纽约城市大学的(城市大学),美国

版权©2021年福特、牧羊人、琼斯和哈桑。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:伊丽莎白·福特,e.m.ford@bsms.ac.uk

下载