文件首先从如何定义AI和AI将如何影响图书馆入手,阐述了近年来,尤其是2023年以ChatGPT为代表的生成式AI引发巨大关注以来,图书馆界对AI将如何改变图书馆工作,以及图书馆应如何主动适应AI所带来的变化的各方面看法。
文件提出,AI在图书馆领域最强大的应用是 “描述性AI”,即通过计算机视觉或声音转文本等技术,使馆藏的各种资料成为机读数据,并提供大规模描述,用于信息检索。文件又指出,相比起将AI应用于图书馆工作本身,人工智能素养培训可能是更亟待引起重视的事项。
文件认为AI可能会对图书馆工作产生“广泛而深刻”的影响。小组于2023年7月在英国所作的一项调查的结果显示,在当时,有关AI的各种实践已经在该国的多所图书馆内得到不同程度的开展,其进度从规划中,到试点,乃至已成熟运作,参差不一。其中包括以下这些方面:
•专用的聊天机器人
•支持文本、数据挖掘
•系统综述(systematic reviews)的自动化
•馆藏资源的知识发现
•支持机构内的数据科学社群
•提升用户的AI和数据素养
•图书馆用户行为预测
文件又通过SWOT分析法评估了图书馆在AI方面的总体战略地位。摘要如下:
优势(Strengths)
•对用户需求的了解;
•数据是AI的关键;
•专业知识共享;
•职业道德与专业技能;
•与机构内不同部门合作及促成合作的成功案例;
•图书馆的开放和跨学科特性;
•图书馆行业女性较多,这能为相对缺乏多样性的AI 行业带来改变。
劣势(Weaknesses)
•图书馆技术开发能力有限;
•购买商业化AI类产品的成本;
•缺乏现成的适用于图书馆环境的产品;
•数据质量问题、数据缺乏、数据有使用限制、数据包含偏见、数据无包容性;
•在AI驱动的合作中与合作方产生理解上的差异;
•行业内对AI的不确定、焦虑和信心缺乏的情绪;
•图书馆的"专业招牌"似乎与AI无关;
•AI可能会跟保密、隐私、平等等方面的职业价值观相左;
机会(Opportunities)
•通过内容描述、摘要、翻译及转录改善知识和馆藏的可访问性;
•利用AI完成日常任务;
•通过生成式AI改进知识创新;
•人们对信息可靠性的需求;
•合作、协作;
•基于更充足信息的决策;
•让工作具备更高价值;
•让供应商提供更好的产品;
威胁(Threats)
•围绕人工智能的情绪、炒作和错误信息;
•AI领域的变化速度,且这是由外部因素推动的;
•偏见、隐私、保密等伦理问题;
•获取信息的新方法将改变人们对搜索等方面的预期。
文件建议各图书馆可根据本馆实际情况进行类似的SWOT评估。
文件最后指出,鉴于AI影响的广泛性,图书馆采取的应对战略可以是多样化的,但以下三个战略在目前的形势下应该是最具重要性的:
战略一:利用图书馆的AI能力,构建负责任的、可解释的描述性AI应用
如果图书馆拥有大量内容独特的馆藏,且需要改进描述以便于检索,那么就可以利用描述性AI来创建相比起大厂商业化产品更具社会和学术责任感且可解释的AI范例。文件认为,在此过程中应遵循一定的“善治原则”(principles of good governance),例如:
•使服务对于目标用户可用、可及、可解释
•对整个项目充分记录,确保其可解释
•尽可能公开地共享代码、训练数据、工具包等
•从可持续发展的角度评估项目
文件也指出,要实现上述目标仍面临着许多挑战,例如:
•如何确定各种馆藏被应用于AI的优先顺序?
•如何判断价格能负担得起的现成工具是否适用于馆藏中的历史数据?
•如何解决一些概念上的挑战?如应如何给图像文件分类?
•如何将概念验证项目转化为可持续的服务?
战略二:利用图书馆员的数据能力增强组织(机构)的AI能力
并非所有图书馆都有需要用到AI的馆藏,但图书馆员与数据相关的专长对于AI在机构当中的应用而言,具有很高的价值,因为现在的AI是由数据驱动的。这种专长可为图书馆所在的更广大组织里的数据科学家提供支持。这方面可以实现的场景包括:
•在复杂的数据环境中寻找数据源
•宣传数据共享、开放和互操作性的价值
•描述数据使用标准及其价值
•存储、保存(或销毁)数据
上述所有实践都与信息管理的专业知识相契合,但必须将这些知识转化到数据领域的环境中。
战略三:推动AI素养提升,增强组织机构及社会AI能力
最符合目前条件下图书馆实践及馆员身份的战略是,在促进提高人工智能素养方面发挥带头作用,对于高校、学校及公共图书馆而言尤其如此。
图书馆已然开发了不少信息素养课程,而AI素养的许多方面可被纳入其中——馆员们已经具备教学所需的知识和技能。
AI素养可包括以下能力:识别AI于何时被使用;理解狭义AI和通用AI(广义AI)之间的区别;了解AI擅长解决何种问题;了解机器学习模型是如何训练的。同时还会包括对偏见、隐私、可解释性和社会影响等道德问题的认识。
由于AI是以数据为基础,所以数据素养被认为是AI素养的一个组成部分。作为一个已经发展起来的概念,算法素养(algorithmic literacy)目前更多被用来描述关于算法如何影响诸如搜索和推荐这样的服务,但其更正式的定义是:“意识到算法被用于在线应用、平台和服务中,了解算法的工作原理,能够批判性地评估算法决策,以及拥有应对甚至影响算法操作的技能。”可以说,把算法素养这个概念延伸到搜索这一情境之外,这将与AI素养有一定关联。
地址:广东省深圳市福田区福中一路2001号 邮政编码:518036 咨询电话:(0755) 82841200 邮箱: