使用文本和数据挖掘获得 COVID-19 的见解
乔治华盛顿大学的谢周丹进行的研究表明,文本和数据挖掘如何快速分析大量的新闻文章,以揭示关键和及时的趋势。
政府机构已针对COVID-19大流行采取了各种管制行动。人们对这些监管反应怎么说?哪些问题引发了最多的讨论?最重要的是,最迫切需要处理哪些法规?
为了回答这些问题,乔治华盛顿大学研究员谢周丹与ProQuest合作,在一个特殊的文本和数据挖掘(TDM)项目。使用 TDM Studio,ProQuest 的新文本和数据挖掘解决方案,她分析了一组与 COVID-19 和法规相关的美国近期新闻文章。她的目标:看看什么主题被写得最频繁。
从最初的想法到最终输出,TDM Studio 通过显著减少前端数据收集和格式化所需的时间和精力,为谢等研究人员提供在创纪录的时间访问当前新闻和学术内容的机会。 这使得研究人员能够快速揭示数据集内部和数据集之间的关系、模式和连接,这些数据集来自各种来源,包括当前和历史 ProQuest 内容。
谢分析利用专为COVID-19研究专门策划的100多万篇文章的数据集,确定了2020年1月至4月文章中的16个主题——从"隔离和重新开放"到"油价"。这些专题表明,随着时间的推移,流行程度和趋势不同,反映了媒体对COVID-19监管政策反应的关注程度的变化。
没有人可以手动阅读一百万篇文章,因此像 TDM Studio 这样的工具对于分析这一数据量至关重要。该项目帮助谢了解与COVID-19相关的新闻中讨论的监管问题的主要模式和趋势。
"借助TDM Studio提供的丰富资源,"谢说,"可以应用进一步的文本挖掘和分析,以回答监管研究中更具体问题,从而产生可能为政策制定者提供信息并帮助经济从大流行中复苏的见解。
来自 ProQuest 的消息
ProQuest 正在与世界各地的合作伙伴合作,帮助客户弥合不断变化的研究、教学和学习环境造成的差距。您可以通过访问一个网站来了解www.proquest.com。让我们知道我们如何通过联系您的帐户团队或访问您的客户或访问https://support.proquest.com。