02 七月 2019 博客

这个行业有多复杂

鲍勃 · 纳尔迪尼采访伊塔卡的凯瑟琳 · 丹尼尔的亮点。

鲍勃 ·纳尔迪尼采访伊塔卡的凯瑟琳·丹尼尔的亮点

图书馆采购 模式是一份有关美国学术图书馆图书采购趋势的报告,由伊萨卡·塞 R. ProQuest 的鲍勃·纳尔迪尼最近与报告主要作者凯瑟琳·丹尼尔交谈。采访发表在6月刊的《 反对粮食》上。 我们在下面分享了一些亮点。

数书过去很容易,长期以来是北美学术图书馆保持分数的主要方式。 他们怎么样了? 特别是研究图书馆,通过求助于年度"ARL排名"来回答这个问题。 图书馆计算他们增加了多少本书,以及删除了多少本。 发送给研究图书馆协会的结果在年度会员排名中公布。 如果图书馆增加了足够的书, 以向上移动一个档次, 这是庆祝的理由。 如果下来,总有明年。

今天,这听起来很过时。 但是,在一个印刷书象征着学术图书馆使命的时代,你还想如何对研究图书馆进行排名呢? 参考问题? 门数? 书最重要。 数他们并不难。

今天的 ARL 排名不再关注图书计数。 在为什么这是个好主意的原因中, 数书不再容易了。 这是凯瑟琳·丹尼尔(KatherineDan daniel)的一个教训,他是《图书馆获取模式》的主要作者,这是一份由著名研究机构伊萨卡·塞 R于1月份发表的报告。Ithaka 的目标是"通过从图书馆样本的内部系统中提取的数据来研究美国学术图书馆图书采购的趋势"。 这实际上需要数书和书籍订单。 对于印刷书籍来说,这很容易——多亏了伊萨卡,我们现在知道亚马逊在学术图书馆印刷图书市场的份额可能约为11%。

另一方面,对于电子书,"它...在整个项目中,我都发现印刷和电子资源在获取方式上非常不同,"凯瑟琳告诉鲍勃。 "用印刷品,"她说,"你要么把它放在架子上,要么没有。但与电子,它更有可能,你可以得到它在一个捆绑,你可以有一个有限的时间量,多人可以访问相同的项目在同一时间...需要更丰富的数据来捕捉打印和电子资源之间的这些差异,尤其是在两者获取模型继续快速发展时。

Ithaka的研究是凯瑟琳开始进入图书业务,有趣的是,听到一个新人对复杂,我们这些沉浸在其中的人非常了解。 

鲍勃·纳尔迪尼:...在[图书馆获取模式]项目中,您学到了什么?

凯瑟琳·丹尼尔:这个行业是多么复杂;出版商、供应商和图书馆是如何如此相互关联的,但在我看来,它们同时与每个团队做出最佳业务决策的能力有关。在整个项目中,我也发现印刷和电子资源在获取方式上非常不同。打印时,要么放在架子上,要么没有。但是,使用电子设备,您更有可能在捆绑包中获取它,您可以有有限的时间,多人可以同时访问同一项目。与如今的一切一样,需要更丰富的数据来捕捉打印和电子资源之间的这些差异,尤其是在两者获取模型继续快速发展时。

BN:我们当然同意,在复杂性上。 ProQuest 在电子书市场的地位,事实上,由于你提到的事情类型,我们觉得代表性不足。 报告本身强调数据收集是一项重大挑战。 你能告诉我们其中一些挑战吗?

KD:数据清理比数据收集更是一个挑战,尽管就你的观点来说,一些数据对于我们无法收集的分析来说是有价值的。我认为,任何处理数据的人都预计,数据不会完美无缺,因此,这是一个让你动手的问题,解开所有问题,并做大量的研究,以做出一个行政决定,如何清理的东西,这本身可能是令人生畏的。

其中一个重大挑战是数据集中存在的错误分类程度,这使得分析比将所有书籍项目拉入子集并分析该子集要简单得多。相反,我们必须首先研究哪些项目最有可能是书籍,因此我们引入了定价参数,试图隔离专著,并基于这些发现制作数据集。另一个挑战的例子是,出版商和供应商名称的列出完全特殊,在前者的情况下,需要相当多的工程和手动工作来标准化数据集,而在后者的情况下,找到供应商名称的每一个可能的变体是耗时的,但不是特别困难。还有一些意想不到的挑战,比如发现书包被开具发票作为一个收购记录,而不是列出每个有其记录的书。

BN:如果您要组织一份后续报告,你会尝试回答什么问题?

KD: 我想看看数据中分类为书籍的项目,这些项目高于我们的定价参数。这些物品占了图书馆图书支出的很大一部分,我们收到的一些反馈表明,这些更昂贵的项目实际上是书籍,而不是错误分类的项目,其成本是图书自身发展,特别是数字图书及其访问方式的不断发展的商业模式的结果。因此,这些项目可以指出未来趋势,而不是报告评估的过去趋势。理想情况下,后续工作也能够引入这些图书包进行分析,以检查它们的市场份额,如果它们能弥补我们看到的任何印刷书籍的下滑,但是现在没有简单的方法来识别这些书包。

arrow_upward