普林斯顿案例研究:COVID-19新闻报道的趋势
在一项新的案例研究中,普林斯顿大学研究员加文·库克解释了他如何使用TDM Studio来分析与COVID-19相关的70万篇报纸文章数据集,以及他如何获得对最感兴趣领域的见解。
在一项新的案例研究中,普林斯顿大学研究员加文·库克解释了他如何使用TDM Studio来分析与COVID-19相关的700,000篇报纸文章的数据集,以及他如何获得对最感兴趣领域的洞察
COVID-19已迅速成为一个十年决定性的问题,通过文本和数据挖掘 (TDM) 分析 ProQuest 的报纸内容有助于揭示世界对此的反应。
普林斯顿大学研究员加文·库克(Gavin Cook)在一项新的案例研究 《COVID-19新闻报道的趋势:使用文本和数据挖掘的主题模型简介》中解释了他如何处理这个项目。
库克说:"媒体如何报道COVID-19是一个经验问题——一个我们可以更准确地了解自然语言处理统计技术。"人类分析的细节不可能与机器一起复制,但我们可以通过机器的广度来补充人的深度。TDM 使我们能够同时处理数千个文档。
Cook 使用 ProQuest 的新文本和数据挖掘解决方案 TDM Studio 来分析 ProQuest 数据集,该数据集包含近 100 万条与冠状病毒相关的新闻文章。正如他所指出的,没有技术的帮助,这是人类无法做的事情。
利用分析结果,Cook 创建了一系列"字云",这些"字云"提供了我们在 COVID-19 新闻报道中看到的趋势的视觉上强大的见解。
TDM Studio 通过显著减少前端数据收集和格式化所需的时间和精力,为像库克这样的研究人员提供在创纪录的时间访问当前新闻和学术内容的机会。 这使得研究人员能够快速揭示数据集内部和数据集之间的关系、模式和连接,这些数据集来自各种来源,包括当前和历史 ProQuest 内容。