Quantcast
Viewing all 122 articles
Browse latest View live

艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”

来自ProQuest的消息:艾利贝斯将实施“BIBFRAME路线图”,让使用其产品的机构能够逐步实施BIBFRAME,尽量减轻对现有工作流程的干扰。“使用BIBFRAME,未来的图书馆将能与更广泛的信息世界无缝连接,并向其用户提供书目信息和图书馆馆藏的强化视图”。

“BIBFRAME路线图”包括如下3个特色【逐渐推进】:
– MARC-to-BIBFRAME transformation MARC到BIBFRAME转换
– The publication of sets in BIBFRAME format 以BIBFRAME格式发布(原生数据)集
– Support for BIBFRAME URIs 支持BIBFRAME URI

第一步是Alma的MARC到BIBFRAME转换,将与哈佛图书馆合作实施。哈佛图书馆学术资源副馆长Elizabeth Kirk解释:“哈佛图书馆期待实施BIBFRAME,作为我们通过创新、应用、保存与传播知识以推进学术与教学的愿景的一部分。我们热心于持续探索连接图书馆用户与其所需知识的途径。”艾利贝斯首席技术官Shlomo Sanders说,“BIBFRAME转换将增加图书馆的灵活性和连接性,并且保持图书馆记录的通用性与相关性。”

报道中还介绍,艾利贝斯在BIBFRAME路线图上的工作,很大程度上归功于积极的艾利贝斯社区:ELUNA/IGeLU关联开放数据特殊兴趣工作组,为艾利贝斯产品中的关联数据奠定了基础;艾利贝斯于2016年实施基于RDF的关联数据支持,也得到“关联数据协作项目”参与机构的反馈。

via ProQuest News. Ex Libris Increases Library Connectivity with Implementation of BIBFRAME Roadmap (08 May 2017)


BIBFRAME在欧洲启动?2017欧洲BIBFRAME研讨会

由北欧书目和基础设施主题网络小组 (NNG)发起,得到德国国家图书馆支持,“2017欧洲BIBFRAME研讨会”将于2017.9.26-27在法兰克福的德国国家图书馆举行。NNG由北欧各国的国家图书馆组成。

会议说明:
“近年在图书馆有若干关联开放数据项目。图书馆界需要一个国际标准,基于现代技术交换书目元数据。按美国国会图书馆的意图,BIBFRAME正是将取代MARC的。如果使用UNIMARC和本国MARC格式的图书馆选择BIBFRAME,BIBFRAME具有比MARC21更全球化的潜力。”
“准备在欧洲使用BIBFRAME很重要。一些国家已经领先,其他国家更多地在等待。无论什么情况:我们需要让BIBFRAME更具可见性,开始让BIBFRAME更国际化的过程。 ”

本次会议不是普及BIBFRAME的教育活动,其定位是:
– 就实施BIBFRAME,欧洲图书馆界的代表之间的对话
– 欧洲图书馆之间共享知识与经验
– 美国国会图书馆与欧洲图书馆界代表间的对话

已确定的参会者包括:
– 美国国会图书馆(LC)网络开发与MARC标准办公室主任Sally McCallum,2个报告:其一,聚焦BIBFRAME(编目格式、存储格式和/或通信格式;与RDA共存);其二,BIBFRAME的当前发展、未来步骤及计划时间表
– 斯坦福大学Philip E. Schreur,介绍LD4L Labs/LD4P项目

本次会议规模40人,邀请致力于BIBFRAME的其他欧洲国家申请参会。会议还将讨论是否需要参照EURIG(欧洲RDA兴趣小组)或LIBER的MARC调和工作组等,在欧洲建立与BIBFRAME有关的某种正式/非正式组织。

via BIBFRAME@LISTSERV.LOC.GOV: 2017 European BIBFRAME Workshop (17 May 2017) / Leif Andresen

匈牙利国家博物馆图书馆目录以BIBFRAME发布

匈牙利国家博物馆发布开放关联数据,包括馆藏和中央图书馆书目数据2个数据集。
data-hnm-hu – Hungarian National Museum Datasets
上述网页仅对图书馆书目数据作了详细说明,包含图书馆整个目录,以BIBFRAME格式发布,提供对外部资源的链接,包括BNF(法国国家图书馆)、ISNI(国际标准名称标识符)、LC名称规范档、VIAF(虚拟国际规范档)和维基数据。【没有找到例子】

据称本次发布的目的是让匈牙利图书馆员更熟悉BIBFRAME,因此在BIBFRAME和MARC之间提供交叉链接。
从样例数据看:
某实例的BIBFRAME URI(/id):http://data.hnm.hu/id/colls/lib/bib/Instance/MNMKVT19563
在网址自动跳转为/doc:http://data.hnm.hu/doc/colls/lib/bib/Instance/MNMKVT19563【似乎未包含完整内容】
以上网址加后缀 .opac 则链接到OPAC页面
OPAC页面有永久链接:http://link.hnm.hu/lib/bib/MNMKVT19563
点击永久链接边上bf:图标直接链接到HTML格式的BIBFRAME实例(Instance)
永久链接加 .rdf 等后缀则为相应的关联数据格式,包括 .rdf, .rdf-ttl, .rdf-nt, .rdf-json, .rdf-jsonld, .rdf-rdf(rdf/xml)。
OPAC页也支持 link rel 发现服务,以便网络爬虫及其他程序自动找到不同格式的RDF描述。

OPAC页面下部有3个开放数据标注:
Open Content(任何人、任何目的,均可免费使用、修改和分享)
– 5 * Open Data(达到关联开放数据5星标准:OL, RE, OF, URI, LD)
CC0(1.0版,公有领域,不受版权保护)

从实体类型(Entity Type)看,同时用到bf和bf2,比如目前实例和作品的数量:
http://id.loc.gov/ontologies/bibframe/Instance 65648【实例 bf2】
http://id.loc.gov/ontologies/bibframe/Work 59501【作品 bf2,做了FRBR化】
http://bibframe.org/vocab/Instance 57414【实例 bf,比 bf2 数量少】
http://bibframe.org/vocab/Work 51711【作品 bf,比 bf2 数量少 】

据称共 6.7 万MARC记录(比上述实例数字多),生成2百多万三元组(2 269 696)。平均每条记录近34个三元组,应该不算多,只是在以上样例页面,一条记录只有十多个三元组,看内容应该未全部展示。

本项目是真正的国际合作:数据转换与链接由意大利软件开发公司 @Cult 实施OPAC页面修改由匈牙利厂商 Qulto 完成;利用ALIADA部分功能做URI name convention,ALIADA由一位西班牙女士安装。

via BIBFRAME Listserv: BIBFRAME at the Library of the Hungarian National Museum / Horváth Ádám (18 May 2017)

BIBFRAME 2.0说明文件更新

2017年3月,BIBFRAME 2.0说明文件更新:
BIBFRAME 2.0 Examples and Notes – updated
与2016年4月发布时相比,文件有增减:
增加:BIBFRAME 2.0新内容,URI和标签,附注
减少:管理元数据Administrative metadata,类别Categories,单件Items
相同内容对象的文件,2016年时有详尽的修改说明,此次有可能就只是简单的用法说明。

新增内容:
What’s New in BIBFRAME 2.0:列出BIBFRAME 2.0相对于1.0的最重要变化(附后)。
变化多附说明文件(或者2016年时有)。有些以前自己没有明确感知,如BIBFRAME本体由RDFS变为OWL,再如为匹配编目标准(当指RDA)增加若干属性和类。

URIs and Labels :表达资源特性的3种方法【在“RDF约定”中有简单说明】
1、只提供URI:使用 bf:属性
2、同时提供URI和标签
3、只提供标签:使用 bf:类,取值 rdfs:label

Notes:表达资源附注的4种方法
使用属性 bf:notes,期望值为附注类、取值 rdfs:label
1、一般附注:使用附注类 bf:Notes
2、专门附注:使用外部附注类
3、特定附注类型:在1基础上增加 附注类型属性 bf:noteType
4、由上下文推断出附注类型:嵌入相应类的说明中,省略附注类说明

——— BIBFRAME 2.0新内容(略译) ———
所列为BIBFRAME 1.0到2.0的最重要变化清单,并非详尽无遗:
取消规范类。个人、组织、地点(有名称的事物)表达为真实世界对象(RWO)而非由名称标识。
取消注释类。1.0中是注释的事物,如目次,现在是属性
引入单件类。在1.0中表达为注释。【2016.4有说明文件】
引入事件类。见“事件模型”。
题名重新建模。见“题名注释”。最值得注意的是“作品题名”和“实例题名”类移除(合并为“题名”)。
标识符重新建模。见“标识符注释”。最值得注意的是标识符类型由类而非属性区分(1.0有许多标识符属性,只有一个标识符类;2.0有单一标识符属性,许多标识符类)。
附注重新建模。见“附注”。
职能重新建模。见“表达职能”。引入“贡献”类配对施事者(agent)与职能。
本体。BIBFRAME 2.0正式表达为OWL而非RDFS本体。现在许多属性定义为对象属性。若干属性现在定义有逆向属性。【详见“RDF约定”】
– 增加若干属性和类,支持与编目标准的更好匹配。

BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)

时隔三月,再去看 BIBFRAME 2.0实施注册(2017-4-26),新增了4项,按先后顺序,分别是:
BIBFRAME 2.0 Implementation Register
(4)2017-5-9 更新:Colorado College – Colorado Alliance of Research Libraries BIBCAT Pilot
美国的科罗拉多学院也是BF1.0实施注册者,2014-2-7有应用TIGER Web Catalog & Flask-BIBFRAME Extension
此次是科罗拉多研究图书馆联盟与厂商KnowledgeLinks.io合作的BIBCAT试验项目,从目录中随机抽取16万条MARC记录,是BIBFRAME与Schema.org的结合体,具体没看明白。源代码:https://github.com/KnowledgeLinks/alliance-bibcat
项目网址:bibcat.org,2017夏发布2.0版(目前显示升级中)。

(5)2017-6-7更新:Ex Libris, Alma
参见:艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”(2017-5-12)

(6)2017-7-10入档:Library of the Hungarian National Museum
参见:匈牙利国家博物馆图书馆目录以BIBFRAME发布(2017-5-21)

(7)2017-7-20入档:@CULT – SHARE Catalogue in Linked Data
意大利 @CULT公司开发的7所大学的目录门户 SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录 ,采用BIBFRAME词表的关联数据发布。不过预设的BIBFRAME导出/显示尚未提供(详见下)。
@CULT是位于罗马的系统厂商,近年也致力于语义网/关联数据应用。上述匈牙利国家博物馆图书馆目录项目中,@CULT承担数据转换与链接。

——— SHARE目录 ———
未来图书馆目录界面会是如何?SHARE有点与众不同,在界面上体现BIBFRAME的三层实体:
1、个人/作品
提供从作者(包括人名、团体、会议)或作品题名查找资源,有输入逐步提示功能。首页有SHARE目录简介,最下面的User Guide详解各种用法。
亮点在其结果显示页,也最能体现关联数据的作用。

– 查作者,进入作者页,显示作者个人信息,以及其作品。(如:Hamilton, Richard
中间是作者(可能有头像),下面连接其作品。
左侧上部是各种规范数据的链接:ISNI 国际标准名称标识符、Wikidata、美国国会图书馆、法国国家图书馆、VIAF 虚拟国际规范档。可链接到相应来源。
左侧下部是维基百科词条。
右侧是个人名称的不同形式(应该是通过左侧的规范数据对不同形式的名称做了合并处理,但并未强制做形式的统一)。和名称一样,可点击进入目录结果页。
右上部有三个输出选项(本页的所有信息):下载BIBFRAME、打印、发邮件。遗憾的是设定为.ttl格式的BIBFRAME文件为空。
该作者的作品列表在网页下部(不在截屏内),点击放大镜进入作品页(见下),点击题名进入目录结果页——特别注意是按“作品”汇集的,可能对应多个出版物(实例)。
Image may be NSFW.
Clik here to view.
SHARE目录-Person

– 查作品,进入作品页,显示作品以及其创作者。点击作品进入目录结果页。 (如:Choes and Anthesteria
左侧是出版物,可直接链接到各条书目记录(出版物/实例),小图标为收藏机构。
网页下部的创作者,点击放大镜进入作者页(见上),点击作者名进入目录结果页。
Image may be NSFW.
Clik here to view.
SHARE目录-Work

2、出版物(实例)
这是主界面,与单个输入框检索的流行方式类似:既可同时查题名、名称、主题,也可分别查,并对选择检索结果排序。另外有高级检索,不同检索途径组合之外,还可选择日期、文献类型(格式)、语言、书目层次(专著/连续)、出版国、收藏馆作限定。
检索之外,还提供按文献类型的浏览方式,方式是点击主界面下部的7个文献类型图标。结果页右侧有大量分面可供限定范围:格式、书目层次、作者、作品、出版社、语言、日期范围、出版日期、主题(个人、团体、会议、地理、论题、体裁/形式)。
出版物/实体现在检索结果的详细页,Info标签部分,可选择按MARC格式或BIBFRMAE显示——遗憾的是目前BF显示为空。

3、单件
作为多机构目录门户,在检索结果的详细页,Copy data标签,显示的即为单件,有链接到各机构OPAC。

2017年BIBFRAME更新论坛

自2012年1月ALA仲冬会议起,美国国会图书馆(LC)会在每年2次的ALA冬、夏年会上举办BIBFRAME更新论坛。LC介绍BIBFRAME开发进展,邀请其他机构介绍与BIBFRAME相关的应用等,这些机构主要是高校和厂商,几乎不可缺的常客是OCLC和Zepheira(BIBFRAME初始协约开发者)。今年的2次已召开,会议报告如下:

2017年1月,ALA 2017仲冬会议更新论坛(BIBFRAME Update Forum at ALA Midwinter Meeting 2017
– LC近期开发更新
Update on Recent Developments at the Library of Congress / Sally McCallum(LC网络开发与MARC标准办公室主任)-
– LC试验2生产计划 【列在日程上,网站未提供PPT】
LC Plans for Production Pilot 2 / Beacher Wiggins(LC采访与书目获取部主任)
– 表演音乐关联数据:为音像产品与档案编目扩展BIBFRAME 2.0
Linked Data for Performed Music : an extension to BIBFRAME 2.0 for production & archival cataloging of sound recordings & music videos / Nancy Lorimer(斯坦福大学图书馆元数据部主任)
原标题:Music Development for BIBFRAME in LD4P (Linked Data for Production)
– 把MARC带到BIBFRAME
Bringing MARC forward to BIBFRAME / Wayne Schneider(Indexdata公司工程师)
– OCLC在作品上的工作
OCLC’s Work on Works / Roy Tennant(OCLC高级项目主任),Jean Godby(OCLC高级研究科学家)

2017年6月,ALA 2017年会更新论坛(BIBFRAME Update Forum at ALA Annual Conference 2017
– 国会图书馆试验二: 更完整、 更多参与者, 更多互动
Library of Congress Pilot Two: more complete, more participants, more interactive / Beacher Wiggins, Sally McCallum
– BIBFRAME作品与OCLC作品:定义模型,发现证据
BIBFRAME and OCLC Works: defining models and discovering evidence / Jean Godby, Diane Vizine-Goetz(OCLC高级研究科学家)
– LD4P曳光弹/示踪子弹:RDF套录编目管道
LD4P Tracer Bullet 1: an RDF copy-cataloging pipeline / Philip Schreur(斯坦福大学技术与获取服务助理馆长)
– 成为数据原住民:BIBFRAME可扩展性如何向图书馆提供了走向可伸缩的革命性进化之路
Becoming Data Native: How BIBFRAME Extensibility Delivers Libraries A Path to Scalable, Revolutionary Evolution / Eric Miller(Zepheira公司总裁)
原标题:Transformation, BIBFRAME, and the Library.Link Network

总结下BIBFRAME现状大体如下:
– LC目前的重点是第2阶段试验(Pilot 2),面向实际编目环境。除了已经完成的原有记录转换,更重要的是书目和规范的原编。
– OCLC与LC在协调对于FRBR“作品”的实践差异。OCLC的结论是WorldCat作品可以对应BIBFRAME创作作品,尽管有不同层次的属性。对于已有数据,作品识别算法仍需改进。
– 斯坦福大学等的关联数据生产(LD4P)项目,应用BIBFRMAE的进展:(1)BIBFRAME的表演音乐扩展(未来会有面向不同领域的更多扩展);(2)套录MARC记录转换为BIBFRAME并进而利用的流程,复杂的过程,有待自动化处理。
2016年的2次BIBFRAME更新论坛上也有LD4P项目的报告。
– 关联数据图书馆应用Library.Link(采用BIBFRAME 1.0变体bibfra.me)
– 厂商开始从MARC转向BIBFRAME之路

参见:
重量级图书馆关联数据项目LD4P获得资助(2016-5-10)
BIBFRAME和BIBFRA.ME(就差一个点)(2015-5-10)
LC和OCLC关于BIBFRAME和Schema书目扩展的白皮书(2015-2-12)

先前部分BIBFRAME更新论坛,参见:
LC书目框架转换行动:首届更新论坛(2012-2-7)
ALA 2014仲冬会议中的BIBFRAME(2014-2-5)
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
2016 ALA年会BIBFRAME更新论坛(2016-8-27)

用类表达类型相对于属性的3个优点

BIBFRAME2.0增加了很多类,增加的类中,很大一部分来自原来的属性。参见:BIBFRAME2.0类的变化(2016-5-2)
比如1.0有数十个表示标识符类型的属性(doi、isbn等),2.0只保留了一个通用的标识符属性identifier(改为一对互逆属性identifiedBy / identifies),其他具体标识符类型大都变成了类(bf:Identifier的子类),有些则取消了(比如isbn的子属性isbn10, isbn13)。

属性变为类,用三元组表达有很大不同。以ISBN为例:
BIBFRAME 1.0(bf:isbn 定义域为实例,值域为 bf:Identifier)
<http://bibframe.example.org/5226/i1> bf:isbn “0394856309”
BIBFRAME 2.0(bf:identifiedBy 不限定使用范围,期望值为 bf:Identifier)
<http://bibframe.example.org/5226#Instance> a bf:Instance;
bf:identifiedBy [ a bf:Isbn ;
rdf:value “0394856309” ]

对人类而言,1.0方式直观、易解,2.0方式比较绕。对于机器可能完全不一样。BIBFRAME 2.0 RDF Conventions (2016-4-21) 在“4)类与类型”部分对此有如下解释:
表达类型为类而非属性有若干优点
可重用。以标识符为例。对于BIBFRAME中表达的每个标识符,创建一个bf:Identifier资源。如果创建为一个关联数据资源(赋予URI),则可被BIBFRAME之外获取与重用。用类反映标识符来源意味着会在被用时获知。如果来源仅由BIBFRAME属性传达,则该来源只当在BIBFRAME环境中访问时才获知。
查询效率。表达类型为类通常让数据更易于被查询。例如“查找类型X的东西”,当X是类时比是属性时更简单。
柔性降级。假定在某外部命名空间(ex:)中创建新的附注类型。如果新类型用属性表达,形如:
ex:noteType “note content”
另一方面,如果类型用类表达,形如:
bf:note [ a ex:NoteType ;
rdfs:label “note content” ]
如果接收系统不认识命名空间ex,则在第一种情况中,陈述完全没有意义。在第二种情况中,系统至少能够认识它是一个附注(尽管不知道附注类型)。

【需要说明的是,对于编目员/元数据制作者,只需要知道有哪些类/属性可用于揭示资源,并不需要了解实际的编码方式。那些都交给计算机程序去解决】

关于“BIBFRAME 2.0 RDF Conventions”,另参见:rdf:value和rdfs:label的差别(2016-6-22)

RDA到BIBFRAME的映射报告

PCC下属BIBCO(单行出版物)和CONSER(连续性资源)分别提出了各自的“标准记录”到BIBFRAME的映射表,同时两个映射任务组也提交了最终报告,总结映射结论及问题。9月时PCC BIBFRAME任务组曾在PCC邮件组公开征求反馈。

PCC的“标准记录”,实际就是目前的完整级记录,作为RDA应用纲要,有RDA条款(元素)与MARC21字段子字段的映射,最新版目前见各自项目的首页
BIBCO Standard Record (BSR) RDA Metadata Application Profile (September 6, 2017 revision)
CONSER Standard Record (CSR) RDA Metadata Application Profile (September 6, 2017 revision)
参见:BIBCO标准记录(BSR)及解读(2016-3-6)

此次标准记录到BIBFRAME的映射,实际上就是RDA到BIBFRAME的映射,即在原应用纲要(前4项)基础上增加6个栏目,包括:
RDA条款与元素、RDA条款号、注释、MARC字段子字段
RDA-RDF(RDA注册属性)、环境(三元组)、LC BF 2.0(属性)、期望值、任务组对BF2.0注释、问题

BIBCO的映射基于CONSER,报告也基本上认同后者观点,因此看CONSER报告就可以获取绝大部分信息。两个报告目前在PCC首页的“What’s New, Decisions, Policies, and Guidelines”部分。
CONSER报告中看到的几个特别关注点:
1、强调机器可执行性(actionable),这方面RDA和BIBFRAME都有需要改进的地方。内容散见于报告各个部分,如下:
– BIBFRAME的date属性推荐值是文字,我们建议使用机器可执行的“类型文字”
– 建议PCC最佳实践应该在可行的情况下,除当前RDA规则要求的转录数据外,鼓励提供可执行数据(如出版、生产、发行、制作)
– BIBFRAME的连续出版物首期、末期属性期望值是文字……记录为机器可操作数据会强化连续出版物描述信息的可用性
– RDA载体特征变化:数量尺寸变化,以往用附注,关联数据环境中建议再用1个带与日期相关的数量属性
– BIBFRAME中使用RDA注册的取值词表,包括:内容、媒介和载体类型,频率,附注类型,职能(关系说明语),体裁形式(作品形式)
– BIBFRAME用空节点+ISSN作为文字。当ISSN有LOD时,推荐链接到ISSN URI

2、关于FRBR四层WEMI与BIBFRAME三层WII,以及FRBR对连续出版物的适用性(“建模与关系”部分)
BIBFRAME关系属性只比RDA关系说明语省略了2个:augmented by (work),complemented by (work)(报告最后建议BIBFRAME增加)。
顺序关系如先前、后续在FRBR模型中为作品-作品关系,在BIBFRAME模型中仍为作品-作品关系,在BIBFRAME中表达相对简单。
垂直或水平关系(如语言版本、补编、部分)因FRBR作品/内容表达合为BF作品而成为很大挑战。
更大的挑战来自IFLA-LRM,建议每个连续出版物作品只有1个内容表达、1个载体表现,导致连续出版物的每个版本和格式作为1个独特的作品,其关系为作品层关系【!】……如果连续出版物的每个新实例也作为单独作品,作品到实例的属性不再需要……

3、管理元数据
如果已经没有记录结构,(基于记录的)描述级管理元数据在关联数据环境中过时了。

——— CONSER报告摘录 ———
Report to the PCC BIBFRAME Task Group: Final Report of the CONSER CSR to BIBFRAME Mapping Task Group

概要
总的来说, 小组发现BIBFRAME可以容纳描述连续出版物资源所需的信息,主要以静态文本字符串。我们还发现,BIBFRAME提供了比MARC环境更大的潜力来揭示连续出版物之间的关系。然而,我们发现,在我们的讨论中出现了一些常见的问题,包括:考虑描述/著录的变更,表示编号和年代信息,以及解决使用机器可执行的URI和使用静态文本字符串间的矛盾。我们还反复讨论了表达连续出版物间关系的复杂性,并有很多关于FRBR和BIBFRAME模型之间差异的对话, 以及在何种程度上实际的连续出版物符合那些模型。我们认为,BIBFRAME的进一步开发可以解决我们在映射工作中遇到的这些挑战。

对CONSER/PCC的建议
1、建议CONSER探索技术与基础结构相关方法,顺应更改连续出版物描述数据的需求
2、建议PCC馆日期尽可能使用类型文字
3、建议PCC最佳实践鼓励在当前RDA条款要求的转录数据之外,尽可能提供可操作数据
4、建议CONSER和BIBFRAME开发界一起开发共同结构,表达可用于连续出版物描述的各种环境的编号和年代信息
5、对变更书目信息或编号和年代信息,PRESSoo和其他关联数据词表的建模可能更详细或健壮。建议CONSER为此目的探索PRESSoo和其他关联数据词表
6、建议PCC建立工作组,承担继续监控(连续出版物前景)活动
7、建议PCC和BIBFRAME界一起识别必要的管理和起源元数据,开发在断言层简单易用记录的方法与最佳实践
8、建议PCC馆对内容、媒介和载体类型,频率,附注,使用RDA注册的取值词表

对BIBFRAME开发的建议
1、明确建模描述性元素的起始与终止日期
2、同前4
3、同前7
4、增加对应RDA关系 augmented by (work) 和 complemented by (work)的属性


BIBFRAME工具强化:MARC题名规范记录转换为BIBFRAME作品

LC最近对BIBFRAME工具进行了强化,主要是增加了MARC题名和名称/题名规范记录转换为BIBFRAME作品描述部分,包括3个部分:
1、说明书,链接在“MARC21到BIBFRAME 2.0转换说明书”中:
MARC 21 to BIBFRAME 2.0 Conversion Specifications
Process notes – R2 (Word, 28 KB, 07/27/2017)
MARC Title Authority Conversion Specifications
Authority Info: Name/Title and Title – R0 (Excel, 33 KB, 07/28/2017)
根据使用说明(Usage Notes),上述转换说明书(映射表)省略了不适用于题名规范的MARC字段。对原来的“处理注释”说明书(Process Notes)增补了转换MARC题名规范为BIBFRAME作品所需的注释(见上)。

2、转换程序,放在Github上,marc2bibframe2的with-auths部分:https://github.com/lcnetdev/marc2bibframe2/tree/with-auths

3、对照阅读器:http://id.loc.gov/tools/bibframe/compare-lccn/full-ttl?find=n79132705
就是原来的BIBFRAME比较工具,选择LCCN(而非书目ID),可以看MARC规范记录及转换为BIBFRAME的情况

LC每天使用这些工具开发与调整其BIBFRAME 2.0试验,因此在不断更新纠错中。

via [BIBFRAME] BIBFRAME tools relating to MARC title Authority records / McCallum, Sally. 2017-12-1

BIBFRAME对丛编、汇编的处理

编目相关的标准规范太多,即使能够硬着头皮从头看到底,也只能有个大致印象,到实际做时可能还是不知道如何使用。所以一直以来觉得最好的学习方法就是看权威来源的现有书目记录,尤其是有针对性的。比如现在就有一个实际问题:BIBFRAME对丛编、汇编(尤其是无总题名汇编)是怎么处理的?
学习BIBFRAME编码方法
1、看MARC21到BIBFRAME2.0转换规范:详细可操作的MARC字段/指示符/子字段到BF的映射(类/属性)
不过字段不完整。比如对丛编而言,只有490(以前大量记录用的是440、830)。
2、看BIBFRAME比较工具:MARC21记录与BIBFRAME记录对照
很多字段会转换为多个BF类,有时表中并未反映。比如丛编除了作为实例外,本身也是作品(无论是否有8XX字段)。汇编这种复杂情况,在转换规范中也没看到如何处理。
作为补充,必须用最原始的方法,先从LC联机目录中查找需要的记录,再用比较工具看实际是如何转换或标记的。
查找特定记录可参考:LC联机目录的“专家搜索”(2015-10-6)
——— 丛编 ——–
实例I(描述 440/490字段)+作品W(检索点 440/490/8XX字段)
(440/490转换)I – bf:hasSeries – I – bf:seriesStatement – literal
<http://bibframe.example.org/3384718#Instance>;; a bf:Instance ;【实例-手头文献】
……
bf:hasSeries [ a bf:Instance ;【实例-丛编】
    rdfs:label “Cambridge texts in the history of political thought” ;
    bf:instanceOf <http://bibframe.example.org/3384718#Work440-18>;; ;【实例-作品关系->作品-丛编】
    bf:seriesStatement “Cambridge texts in the history of political thought” ] ;【丛编描述】
……
<http://bibframe.example.org/3384718#Work440-18>; a bf:Work ;【作品-丛编】
    rdfs:label “Cambridge texts in the history of political thought” ;
    bf:title [ a bf:Title ;【丛编题名-检索点】
        rdfs:label “Cambridge texts in the history of political thought” ;
        bf:mainTitle “Cambridge texts in the history of political thought” ] .
——— 汇编 ———
实例I(题名 245字段)+作品W(总题名 240/243/245字段)+作品W1(组成部分 7XX分析)+W2+……
(130/240/243转换)W – bf:title – bf:VariantTitle – bf:CollectiveTitle
(245转换,实例)I – bf:title – bf:Title
(245转换,作品-有总题名、无130/240)W – bf:title – bf:Title
(7XX分析,作品关联)bf:hasPart(旧记录未做分析)bf:relatedTo
【以下数字标号只为表示各段层次相同,不表示顺序(各段顺序无关)】
<http://bibframe.example.org/3384718#Instance>;; a bf:Instance ;【1、实例-手头文献】
    rdfs:label “On liberty ; with The subjection of women ; and chapters on socialism /” ;【245字段】
……
    bf:instanceOf <http://bibframe.example.org/3384718#Work>;; ;【实例-作品关系->作品-对应手头文献】
……
    bf:title [ a bf:Title ;
         rdfs:label “On liberty ; with The subjection of women ; and chapters on socialism /” ;
         bf:mainTitle “On liberty ; with The subjection of women ; and chapters on socialism” ] .
    bf:Work ;【2、作品-对应手头文献】
   rdfs:label “Works. Selections. 1989” ;【240字段】
……
   bf:relatedTo <http://bibframe.example.org/3384718#Work740-26>;,【关联到3个合订作品】
   bf:title [ a bf:Title ;【作品题名】
        rdfs:label “Works. Selections. 1989” ;
        bf:mainTitle “Works” ] .
<http://bibframe.example.org/3384718#Work740-26>; a bf:Work ;【3、合订作品1】
    rdfs:label “On liberty.” ;【7XX字段】
    bf:title [ a bf:Title ;
        rdfs:label “On liberty.” ;
        bf:mainTitle “On liberty” ] .
<http://bibframe.example.org/3384718#Work740-27>; a bf:Work ;【4、合订作品2】
    rdfs:label “Subjection of women.” ;
    bf:title [ a bf:Title ;
        rdfs:label “Subjection of women.” ;
        bf:mainTitle “Subjection of women” ] .
<http://bibframe.example.org/3384718#Work740-28>; a bf:Work ;【5、合订作品3】
    rdfs:label “On liberty and other writings.” ;
    bf:title [ a bf:Title ;
        rdfs:label “On liberty and other writings.” ;
        bf:mainTitle “On liberty and other writings” ] .

LC开启BIBFRAME本体公开维护程序

GitHub是一个流行的软件协作开发平台。要关注BIBFRAME项目的最新进展,除了LC网站的书目框架项目主页(Bibliographic Framework Initiative)、BIBFRAME邮件组,还有一个重要网站就是LC的网络开发与MARC标准办公室GitHub帐号lcnetdev
lcnetdev帐号中大多数repo与BIBFRAME相关,包括词表(本体)及与MARC转换相关的内容。bibframe-ontology现有2次发布内容(见archive),分别是2016-5-20和2017-3-3,有兴趣也可比较差别。

上周该办公室主任Sally McCallum在BIBFRAME邮件组发布消息称,LC正开启BIBFRAME本体维护程序,让实施者通过GigHub提交调整建议。消息称,实施者可在GitHub提出问题(Issues),包括:拼写错误,定义调整,影响本体语义的问题。语义调整建议应该由实施者发起并描述他们在这个问题上的BIBFRAME经验【意指不接受纯粹的研究?】。国会图书馆将审查这些变化。那些具有语义影响的将与其他具有使用BIBFRAME本体的大型系统的实施者合作进行审查。
根据GitHub上的贡献指南(contributing guidelines),一般的讨论、提问与反馈仍在BIBFRAME邮件组进行。
目前本体部分提出了4个问题,涉及的都是属性,分别是:bf:relatedTo的定义,要求增加bf:agent和bf:contribution的逆属性bf:issuedWith的定义域与值域在MARC转换程序(777字段)与词表定义不一致。

芬兰赫尔辛基大学的Osma Suominen在邮件组对LC此举表示欢迎,认为通过GitHub开放BIBFRAME本体的公共咨询消除了其全球适应的一个主要障碍

via [BIBFRAME]: BIBFRAME consultation / Sally McCallum (2018-4-19)

BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)

LC的BIBFRAME开发仍在进行中,美国研究者已经开始对其进行扩展。保持核心词表含最基本术语,其他制定专门扩展,schema.org的这种做法应该也会被LC采用吧。
安德鲁梅隆基金资助的LD4L系列项目(LD4L,LD4P,LD4L Labs),其中2016-2018的2项很重要的一部分工作,就是对BIBFRAME词表/本体进行扩展。项目都在GitHub上。
去年LD4L-labs和LD4P已经发布BIBFRAME基本扩展bibliotek-o。目前LD4P在做艺术和珍本资料方面的扩展(Art and Rare Materials BIBFRAME Ontology Extension),包括:
ArtFrame:哥伦比亚大学与北美艺术图书馆学会编目咨询委员会 (ARLIS CAC) 协作,针对二维和三维艺术作品的描述
RareMat (Rare Materials Ontology Extension):康奈尔大学与大学与研究图书馆协会珍本图书与手稿部书目标准委员会 (RBMS-BSC) 协作,对复杂的珍本资料建模,提供BIBFRAME中未涉及的单件级描述。

已经完成的bibliotek-o,最新版本是2017.7.6发布的1.1.0 ,有独立域名:bibliotek-o.org:
bibliotek-o: a BIBFRAME Ontology Extension
bibliotek-o在类、属性和取值上都有扩展,包括直接采用BIBFRAME之外的其他词表/命名的类(如foaf、dcterms、prov、oa等),作为定义域和值域:

——— 类 classes ———
大量新增类,共计261个,大致可归为以下几种:
– 题名【补齐245子字段、246字段第2指示符对应元素,有些BIBFRAME本身可能增加 】
bf:Title:新增5个子类:Abbreviated title, Concise title, Distinctive title, Key title, Parallel title
新增部分题名类:Title element,及5个子类:Main title element, Non-sort element, Part name element, Part number element, Subtitle element
新增题名来源:Origin(见下“取值)
– 可访问性【残障使用友好】
bf:Content accessibility:新增2个子类及子子类:Accessibility feature(31子类), Accessibility hazard(6子类)
– 载体类型【由取值词表变成类】
bf:Instance:新增17个子类(+57子子类,交叉去重实际40个):Belt,Card,Cartridge,Cylinder,Disc,Film,Flip chart,Microform,Overhead transparency,Projected,Reel,Roll,Sheet,Slide,Tape,Video,Volume
bf:Electronic:新增6个子类(3个多重上位类):Computer card,Computer chip,Computer tape cartridge(重复),Computer tape cassette(重复),Computer tape reel(重复),Online resource
– 标识符【将OCLC控制号从bf:Local中独立出来】
bf:Identifier:新增1个子类:OCLC identifier
– 内容类型【由取值词表变成类;计算机程序从文本中独立出来】
bf:Audio:新增3个子类:Performed music,Sounds,Spoken word
bf:Text:新增1个子类:Source code
– 作品【内容类型?】
bf:Work:新增3个子类:Software,Stereograph(影像图),Tactile
– 活动【大量增加】
新增:Activity,及140个子类:Abridger,Acquisition,Actor……Creator【多为各种责任者】
新增:Meeting(上位类:foaf:agent, schema:event)【会议作为活动】

——— 属性 object properties———
新增互逆属性21个、13对(有些直接用已有词表,有些无逆属性),前后括号内分别为定义域、值域:
题名:(bf:Title)is title of/bf:title
首选题名:has preferred title(bf:Title)/is preferred title of
题名来源:has origin
行动者:has agent(foaf:agent)/is agent of
活动:has activity(Activity)/is activity of
授予:granted by(foaf:agent)/grants
位置:at location(prov:Location)/is location of
使用对象:is target of(oa:Annotation)/oa:hasTarget
主题:is subject of/dct:subject
范围:covered in/covers
封面:has cover art
来源:has source/is source of
拥有:(bf:Item)held by(foaf:agent)/holds

——— 取值 named individuals ———
新增取值30个,用于4个类:
– 题名来源:Origin,9个(added title page、binder、caption……)
– 动机/目的:oa:Motivation,15个(cataloging、describing supplementary content、linking table of contents……)
– 状态:bf:Status,4个(current、deprecated、invalid、status)
– 投影特征:bf:ProjectionCharacteristic,2个(three dimensional projection characteric、two dimensional projection characteristic)

参见:
LD4P : un « grand soir » pour les bibliothèques américaines ? (03/05/2017)
面向机器应用的RDA(2018ALA仲冬会议上的RDA-续)(2018-2-24)
重量级图书馆关联数据项目LD4P获得资助(2016-5-10)

LC提供BIBFRAME描述数据集批量下载

美国图书馆协会(ALA)年会前夕,美国国会图书馆(LC)开放了BIBFRAME描述数据集批量下载。

LC一年前开始BIBFRAME第2阶段测试(Pilot 2),60名编目员直接在BIBFRAME编辑器上对资源进行编目。为支持本阶段测试,全部LC目录被转换为BIBFRAME RDF结构化文档,作为测试编目员平常使用的目录。日前,LC提供文档的批量下载,供其他系统进行实验。由于仍在测试过程中,文档在持续改进,因此目前提供的是实验数据(快照),分别是5月24日的作品集(18GB)和5月30日的实例集(20GB),压缩文件,N-Triples格式。

文档下载在LC的关联数据服务网站id.loc.gov:http://id.loc.gov/download/
BIBFRMAE网站“实施、工具和下载”页面有说明文件,标识为:
BIBFRAME Works and Instances dataset [PDF, 106 KB] (Bulk Download Instructions)
实际文件名:Bulk downloads of Works and Instances

根据说明,作品集来源为3种:1、来自名称-题名或题名规范记录转换,2、来自书目记录转换,3、直接来自BIBFRAME编辑器(原编)。实例集来源为2种:1、来自书目记录转换,2、直接来自BIBFRAME编辑器(原编)。URI基于LCCN构成。
由书目和规范记录转换而来的作品描述作了去重合并。文件特别指出:“这个过程听起来很简单,但要做得准确很困难,因为很多MARC数据的文本性质、文件中混合有全部和部分记录、使用题名的MARC规范格式以及数据的不一致性和编目规则随时间推移的多样性(超过100年)”。【今年早些时候因为按作品模型处理方志书目数据,对此深有体会。】
说明指出,目前提供的数据还存在一些问题,主要涉及URI及作品和实例的相互关联,包括:作品和实例URI在LC网络外不解析,不少名称与主题缺少链接,作品-实例关联不正确造成孤儿作品,由书目记录7XX字段转换的作品有待与已有作品合并,从规范记录转换的作品没有相互链接。

——尽管还存在不少问题,始于2011年的 BIBFRAME 似乎离应用越来越近了。

via [BIBFRAME] Bulk downloads of BIBFRAME descriptions made available from Library of Congress / McCallum, Sally (19 Jun 2018)

BIBFRMAE应用进展:LD4P实施之路

BIBFRAME正迈向应用阶段,似乎离成为现实已经不远了。最近的两大进展:
一是LC的BIBFRAME第2阶段测试,直接以BIBFRAME编辑器进行编目,已进行了一年,并于上月发布了包括LC的MARC规范记录和书目记录转换的全部BIBFRAME描述数据集,供其他机构下载测试使用。参见:LC提供BIBFRAME描述数据集批量下载(2018-6-20)。
二是斯坦福等高校的LD4L系列项目(http://www.ld4l.org/),致力于由MARC过渡到关联数据,在2014-2016年的LD4L、2016-2018年的LD4L-Labs和LD4P之后,又争取到了梅隆基金为期2年LD4P第2阶段项目,名为“实施之路”(Linked Data for Production: Pathway to Implementation,没有查到直接信息)。
作为项目的一部分,LD4P正建立沙盒,与合作编目项目(PCC)合作,为所有PCC成员创建基于云的沙盒,以实验创建基于BIBFRAME的元数据。项目希望在原核心成员哥伦比亚大学、康奈尔大学、哈佛大学、LC、普林斯顿大学、斯坦福大学、爱荷华大学之外,征求更多PCC成员深度参与(称为LD4P Cohort,合伙人),将某些基于MARC的工作流程转换到以关联数据为基础的工作流程。申请需符合项目提出的最低要求,获准后可得到最高5万美元的子项目资助。

在上月ALA年会上ALCTS举办的“在真实世界中实施关联开放数据”(Implementing Linked Open Data in the Real World)会场,斯坦福大学的Philip E. Schreur介绍了本项目。
在BIBFRAME邮件组(论坛)的本项目邀请参与的附件(Proposal Request to Join the LD4P Cohort)中,有本项目的7个目标
1. 创建连续馈送的关联数据池,以基于BIBFRAME的应用纲要表达。
2. 开发扩展的图书馆合伙人(LD4P合伙人),能够通过创建基于云的沙盒编辑环境来创建和重用关联数据。
3. 开发用于以标识符自动增强MARC数据的政策、技术和工作流程,以使其尽可能清晰地转换为关联数据。【在前述最低要求中,最后一条是:在可行的情况下,将URI合并到MARC记录子字段$ 0s和$ 1s中】
4. 开发用于创建和重用关联数据及其支持标识符作为图书馆核心元数据的策略、技术和工作流程。
5. 通过与Wikidata的协作,更好地将图书馆元数据和标识符与Web集成。
6. 使用基于关联数据的发现技术,增强广泛采用的图书馆现环境(Blacklight)。
7. 通过开发一个名为LD4的组织框架,协调持续的社区协作。

via [BIBFRAME] Invitation to Join the LD4P Cohort / Philip E. Schreur (2018-7-5)
关于LD4L系列项目,参见:
重量级图书馆关联数据项目LD4P获得资助(2016-5-10)
BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)

另:作为LD4P项目成果,“艺术和珍本资料BIBFRAME本体扩展”向BIBFRAME提出了很多修订建议,提交在BIBFRAME本体开发的Github网站“问题”部分,并统一标注:”This recommendation was made on behalf of the LD4P Art & Rare Materials BIBFRAME Ontology Extension (https://github.com/LD4P/arm).”。简单说明见:[BIBFRAME] Art & Rare Materials BIBFRAME feedback – GitHub Issues / Jason Kovari (2018-7-5)

2018年BIBFRAME更新论坛

自2012年1月ALA仲冬会议起,美国国会图书馆(LC)每年2次在ALA冬、夏年会上举办BIBFRAME更新论坛。介绍BIBFRAME开发进展、邀请其他机构介绍与BIBFRAME相关的应用,这些机构主要是高校和厂商,其中从未缺席的是OCLC。今年1月ALA仲冬会议时论坛关注的重点还是探索(explorations),厂商是Ex Libris/Alma和Indexdata/Folio;6月ALA年会时论坛关注的重点已经是大型实施(large implementations),厂商是Casalini Libri和@Cult,没有空的设想,全部都是实际应用。
参见:
2017年BIBFRAME更新论坛(2017-7-26)
2016 ALA年会BIBFRAME更新论坛(2016-8-27)
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)

—– ALA 2018仲冬会议BIBFRAME更新论坛 —–
BIBFRAME Update Forum at ALA Midwinter Meeting 2018 (5个报告,只有3个上线)
* Library of Congress Pilot (PDF, 50 KB) Sally McCallum, Chief, Network Development and Standards Office, Library of Congress
实际标题: BIBFRAME Pilot 2
BIBFRAME第2阶段试验自2017年6月起,1年后评估。60个编目员参与,涉及图书、连续出版物、地图、乐谱、动画、古籍、音频。
所使用的基本库是实际编目环境,即再次转换整个MARC目录到BF目录,包括:1800万书目记录转换为BF作品、实例和单件,120万统一题名规范记录转换为BF作品。匹配合并后创建:1920万作品、2370万实例。同时每日更新装载来自200个非试验组编目员的MARC到BF转换记录。

* Alma, Linked data, and BIBFRAME (PDF, 5.5 MB) Amy Pemble, Product Manager, ExLibris
实际标题:Linked Data Implementation at Ex Libris
艾利贝斯公司2011年成立关联开放数据(LOC)工作组(成员包括波斯顿大学、LC、卢森堡国家图书馆、戴维斯加州大学、新英格兰大学、爱默里大学),收集用例和场景,为Alma平台提供建议。
2017年与哈佛合作提供第一阶段BF集成(MARC到BF转换、以BF格式发布MARC记录集、支持BF URI)。
12月发布的Alma 2017,能够以BF发布整个馆藏。Alma提供API端点,有如下关联数据格式:JSON-LD(书目、本地规范),RDA/RDF(作品、载体表现),BF(作品、实例)。
参见:艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”(2017-5-12)

* Achievements of 2016/2018 LD4P Project (PDF, 7.6 MB) Michelle Futornick, Program Manager, LD4P
实际标题:Linked Data for Production
资源->LD4P(模型、工具、工作流程、社群)->元数据->发现
*模型(BF扩展)、工具
斯坦福:PMO: Performed Music Ontology,CEDAR
哥伦比亚:ArtFrame,Karma
普林斯顿:Annotations,Annotations markup tool
康奈尔:RareMat,VitroLib
哈佛:Cartographic / Moving Image,VitroLib
LC:BF,BF编辑器和转换器
*本体门户 Biblioportal(biblio.ontoportal.org)发现、可视化、维护、映射、评估
*下一步:LD4P2,实施之路(www.ld4p.org)
工具-沙盒,工作流程-扩展,社群-LD4、标识符管理
发现:Blacklight【十年前的开源OPAC仍有强大的生命力】
参见:
BIBFRMAE应用进展:LD4P实施之路(2018-7-8)
Blacklight:佛吉尼亚大学的开源OPAC(2008-3-3)

* Folio and BIBFRAME(未上线)Sebastian Hammer, President, Indexdata
* BIBFRAME and OCLC(未上线)John Chapman, OCLC

—– ALA 2018年会BIBFRAME更新论坛 —–
BIBFRAME Update Forum at the ALA Annual Conference 2018 (4个报告)
* Library of Congress BIBFRAME 2.0 Pilot progress report (PDF, 984 KB) Beacher Wiggins, Library of Congress; Jodi Williamschen, Library of Congress
实际标题:Creating and Updating a BIBFRAME database
LC从MARC走向BIBFRAME:修订BF2.0数据模型,更新词表;新MARC到BF数据转换规程与转换程序;更新BF记录编辑器配置程序。
BF数据库当前状态:作品1900万,实例2400万,单件2260万,43亿三元组。
匹配与合并及尚未解决的问题
BF编辑器功能及尚未解决的问题
下一步:
– 继续评估和调整BF数据库的匹配与合并,需要时重新载入数据库
– 摄入CIP和ONIX数据
– 装入Casalini的RDF数据库
– 提供LC的BF文档下载,供其他人探索(已提供)
– 继续改进编辑器
– 从BF映射到MARC
参见:LC提供BIBFRAME描述数据集批量下载(2018-6-20)

* From MARC to BIBFRAME in the SHARE-VDE project (PDF, 5 MB) Tiziana Possemato, Casalini Libri – @Cult
SHARE-VDE(www.share-vde.org)是关联数据项目,由Casalini Libri(书目和规范数据提供者,PCC成员)、@Cult(ILS、发现工具、语义网解决方案厂商)开发,16个北美研究图书馆参与
总体目标:
– 用URI强化MARC记录【实体识别、调和 Reconciliation、数据强化】
– 用BF词表(根据需要和其他附加本体)从MARC转换到RDF
– 根据BF数据模型发布数据
– 批/自动数据更新过程
– 批/自动数据传递到图书馆
– 按社区定义的优先级顺序逐步实施进一步的用例

* Using BIBFRAME in multi-institutional projects (PDF, 1.3 MB) Jeremy Nelson, Colorado College
美国数字公共图书馆(DPLA)计划中的科罗拉多州和怀俄明州的Plains2Peaks服务中心项目使用BIBFRAME关联数据,将学术和公共图书馆、联盟和博物馆的元数据摄取到BIBFRAME RDF知识图谱中。通过RDF映射语言(RML)将原始数据转换为BIBFRAME作品、实例和单件,满足了支持不同的摄取词汇表(如MODS和Dublin Core)以及不同格式(如JSON,CSV和XML)到BIBFRAME RDF的挑战。 在科罗拉多联盟的BIBCAT项目中,来自三个学术图书馆和一个公共图书馆的MARCXML使用美国国会图书馆marc2bibframe软件转换为BIBFRAME RDF,然后通过RML从BIBFRAME映射到Schema.org以改进网络发现。技术: 开源模块bibcat和RDFframework

* OCLC research with BIBFRAME (PDF, 96 KB) Nathan Putnam, OCLC
实际标题:OCLC Research BIBFRAME 2.0 Converter Analysis
1分析的目标: 评估什么BF数据类型,OCLC可以使用LC转换器生产;评审LC转换样式表(是否需要修正以支持OCLC用例)
2过程:从OCLC研究部的WorldCat副本中取1100万条含LCCN的记录,转换记录到MARCXML,再送到LC BF 2.0转换器
3收获(学到些什么)
– 作品ID很重要(处理一开始就有用;OCLC聚类增加它们到OCLC研究部的WorldCat)
– URI很重要(若干空结点没有URI;空结点=不可互操作)
– 转换器含BF单件描述(但我们只使用书目记录;这使得数据中留有空白)
OCLC研究更新转换器:用作品/聚类ID填充758字段【资源标识符,2017新增字段】,修改以查找$0和$1,首选VIAF和FAST的URI
4未来实验
– 寻找标引可能性/目标/需求【indexing标引所指为何?】
– URI清理和填充到现有MARC记录以减少空节点数量
– 继续与LC合作(随着BIBFRAME的多种扩展和变化的出现,OCLC正在广泛地思考我们构建支持复杂环境的功能)


LD4P2走向实施之路:目标与工作(附LD4系列)

LD4P2是Andrew W. Mellon基金会资助的LD4系列的第4个2年期项目(2018-2020),成员为康奈尔大学、哈佛大学、美国国会图书馆?、斯坦福大学和爱荷华大学。本期项目的终级目标是实施,即以关联数据来描述图书馆资源。特别值得注意的是与合作编目项目(PCC)和Wikidata的合作。
先前曾关注项目的7个目标(见下参见),现在已看到2个有所进展,因此再重复记录如下;项目维基网站还有6个工作包,在此一并记录:
Linked Data for Production: Pathway to Implementation (LD4P2)

7个目标:
[1] 由一个学术图书馆的核心小组,创建以BIBFRAME表示的关联数据的连续馈送池
[2] 开发基于云的沙箱编辑环境,以支持扩展的图书馆合伙人创建和重用关联数据【2018.11.1宣布已招募到17家学术图书馆承担子项目:Stanford Libraries announces Linked Data for Production (LD4P) cohort members and subgrant recipients;先前已召开合伙人会议,定下2019.4开始生成数据的目标】
[3] 开发用于使用标识符自动增强MARC数据的策略、技术和工作流程,以便尽可能干净地转换为关联数据
[4] 开发用于创建和重用关联数据及其支持标识符作为图书馆核心元数据的策略、技术和工作流程
[5] 通过与Wikidata的协作,更好地将图书馆元数据和标识符与Web集成【2018.8.27 斯坦福大学为此公开招聘一位驻留维基媒体人:Wikimedian-in-Residence position at Stanford University
[6] 使用基于关联数据的发现技术增强广泛采用的图书馆发现环境(Blacklight)
[7] 通过开发一个名为LD4的组织框架来协调持续的社区协作,确保在分布式发展社区中不断交流思想和技术。

6个工作包:
WP1:Sinopia:基于云的合作编目环境/原编元数据创建环境
WP2:元数据重用(MARC-to-BIBFRAME转换管道+直接使用原生RDF描述)
WP3:链接到外部规范和Web语境数据(标识符URI+Wikidata发布、链接和丰富)
WP4:发现(Blacklight+知识面板+语义搜索+浏览+可视化+微数据)
WP5:原生关联数据描述生产流程(特藏=电影+地图+音乐+唱片:与数字化配套、与Wikimedia链接)
WP6:社区协作(建立LD4社区+2次国际会议)

——— 附:LD4L: Linked Data for Libraries (The Gateway) ———
LD4L 2014 (2014-2016):“创建一个模型,既可以在各机构内部又可以通过一个协调可扩展的关联开放数据网络运作”(100万美元;斯坦福、康奈尔、哈佛)
LD4L Labs (2016-2018):“帮助图书馆使用关联数据来改善对学术资源信息的交流和理解”(150万美元;康奈尔、哈佛、爱荷华、斯坦福)
LD4P (2016-2018):“转变技术服务生产工作流程”(150万美元;斯坦福、哥伦比亚、康奈尔、哈佛、普林斯顿、美国国会图书馆)
参见:重量级图书馆关联数据项目LD4P获得资助(2016-5-10)
LD4P2 (2018-2020):“为编目社区建立一条途径,开始转向关联数据来描述图书馆资源”(400万美元;斯坦福、康奈尔、哈佛、爱荷华)
参见:BIBFRMAE应用进展:LD4P实施之路(2018-7-8)

BIBFRAME2.0实施注册2018项目(附UIUC的关联数据来源)

又去LC官网看BIBFRAME2.0实施注册(BIBFRAME 2.0 Implementation Register),2017年7月迄今仅有3项新增或更新,都是2018年的:
(1)Reasonable Graph(2018.2.27更新)
据称是个开源项目,支持广泛的本体模型,已经实现BIBFRAME,希望用于图档博领域。
有一个在线演示,看了没什么感觉。

(2)Ex Libris, Alma(2018.4.24更新)
已完成的是:URI强化MARC记录;可以查看和导出BF格式的书目记录
计划:编辑、导入BIBFRAME记录
参见:
艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”(2017-5-12)
2018年BIBFRAME更新论坛(2018-11-14):12月发布的Alma 2017,能够以BF发布整个馆藏

(3)University of Illinois at Urbana-Champaign Library(2018.6.28更新)
UIUC在2015年BIBFRAME 1.0时期就有一个项目,当时是把30万册电子书由MARC转换为BIBFRAME。看样例,外部链接是主题词(id.loc.gov)和创作者(VIAF)。提供4个当时的核心类(作品、实例、注释、规范)的RDF文件。
本次是19世纪英国小说的数字收藏:从Dublin Core转换为BIBFRAME 2.0共7,829项,并使用关联开放数据来增强发现。看样例,外部链接有所扩大:卷册链(Internet Archive电子书),作者(VIAF),DDC(OCLC的DDC概要网站),馆藏链接(机构馆主页,可惜不是OPAC);
因为是小说,没有主题词。提供各卷册(可以算实例)的BIBFRAME 2.0 RDF。

参见:
BIBFRAME 2.0实施注册(2017-4-26)
BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25)

———- UIUC的关联数据来源 ———
UIUC的项目页(最后更新2017.6.24)有Linked Data Sources,抄录如下:
作品标识符:xISBN: Worldcat Work ID(http://xisbn.worldcat.org/xisbnadmin/index.htm)
实例标识符(本地OPAC):University of Illinois at Urbana-Champaign Vu-Find Catalog(vu-find)
BIBFRAME 2.0作品标识符OCLC WorldCat services(https://www.oclc.org/support/services/worldcat.en.html)
BIBFRAME 2.0实例标识符(同上,本地OPAC)
个人名称、团体、地理名称The Virtual International Authority File (VIAF)(http://viaf.org/)
主题
Library of Congress Authority Files (LC/NACO Authority File)(http://authorities.loc.gov/webvoy.htm)
LC Linked Data Service: Authorities and Vocabularies(http://id.loc.gov/)
Faceted Application of Subject Terminology (FAST)(http://experimental.worldcat.org/fast/)
Medical Subject Headings (MeSH) RDF Linked Data(http://id.nlm.nih.gov/mesh/)
研究者与机构
The International Standard Name Identifier (ISNI)(http://isni.org/)
ORCiD(http://orcid.org/)

可与PCC《创制和获取URI:常用词表和参考源指南》对照。参见:
创制和获取URI的常用词表和参考源指南(2018-3-2)

BIBFRAME的LC扩展更新:bflc 1.1.0发布

前几天github上BIBFRAME本体发布了bflc 1.1.0。这是美国国会图书馆(LC)用于本馆MARC数据转换处理的BIBFRAME扩展,采用bflc:命名空间。
2017年BIBFRAME 2.0更新时bflc首次发布,是为1.0版。当时是6个类、29个属性(但现在统计2017-02-02新增类和属性有41个)。参见:BIBFRAME2.0词表更新、相关组件公布(2017-3-14)
bflc:的使用情况参见:MARC到BIBFRAME转换:并列比较工具(2017-4-7)

找了个轻量级文件比较软件Compare It!,把1.0.0版和1.1.0版作了对比:没有删除,新增11个类、7个属性。大致分类如下(丛编相关2018-10-12新增,其他2018-7-12新增):
1、丛编(新增8个类、1个属性)
类:
SeriesTreatment 丛编处理(与资源中的丛编数据的编码有关的技术规范)
以下 SeriesTreatment 子类:
-SeriesSequentialDesignation 丛编顺序标识
-SeriesNumberingPeculiarities 丛编编号特例
-SeriesNumbering 丛编编号
-SeriesProvider 丛编提供者(出版地、出版者/发现机构名称)
-SeriesAnalysis 丛编分析(特定机构实践)
-SeriesTracing 丛编根查(特定机构实践)
-SeriesClassification 丛编分类(特定机构实践)
对象属性:
seriesTreatment 丛编处理(可用于:作品、实例、单件;值域:SeriesTreatment)

2、音像资料(新增2个类、1个属性)
类:
Eidr 娱乐标识符注册协会ID/Entertainment Identifier Registry Association ID(标识符 Identifier 子类)
GrooveCutting 光盘沟槽切割(声音特征 SoundCharacteristic 子类)
对象属性:
alternateMediumOfPerformance 替代表演媒介(可用于:作品、实例、单件;值域:pmo:DeclaredMedium)
【注:采用pmo:命名空间,Performed Music Ontology,斯坦福大学牵头开发的BIBFRAME扩展】

3、管理元数据(新增3个属性)
数据属性:
catalogerId 编目员标识(定义域:AdminMetadata;取值:文字)
profile LC编辑器配置文件(模板名称)(定义域:AdminMetadata;取值:文字)
procInfo 系统处理信息(定义域:AdminMetadata;取值:文字)

4、其他(新增1个类、2个属性)
题名(类):TransliteratedTitle 音译题名(变异题名 VariantTitle 的子类)
索引(对象属性):indexedIn 被收录于索引(可用于:作品、实例、单件)
资源(对象属性):target 目标资源(可用于:作品、实例、单件)

BIBFRAME扩展:Performed Music Ontology(PMO)

LD4P(2016-2018)项目很重要的工作是在不同领域对BIBFRAME进行扩展。以前关注过其基本扩展bibliotek-o、艺术和珍稀资料扩展(现合称ARM),由bflc 1.1.0发布中采用pmo:命名空间,再关注Performed Music Ontology(PMO,演奏音乐本体)。
参见:
BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)
BIBFRAME的LC扩展更新:bflc 1.1.0发布(2019-1-12)

译名说明:
Perform(ance) 可译为“演出”“表演”“演奏”等,performed music确定采用“演奏音乐”是基于RDA的术语定义:
performed music:A content type that consists of content expressed through music in an audible form. Recorded performances of music, computer-generated music, etc., are included.
由于包括录制音乐、计算机生成的音乐等,未必是具有观众的“演出”“表演”,故采用“演奏音乐”。

——— PMO基本情况 ———
“演奏音乐本体”项目旨在为所有格式的演奏音乐开发基于BIBFRAME的本体,特别强调澄清和扩展作品、事件及其贡献者的建模。这项工作是斯坦福大学、音乐图书馆协会(MLA)、录音收藏协会(ARSC)、美国国会图书馆和合作编目项目(PCC)的共同努力,由LD4P合作机构参与。项目主页:
Performed Music Ontology(由 Michelle Futornick创建, 最终由 Nancy Lorimer修改于 十二月 05, 2018)

主页上有很丰富原始资料,包括:项目计划(Deliverables)、当前活动、完成工作(分析/建模,会议报告)。
完成工作【有相关文件链接,部分在Google Doc中,需备梯子】:
* 收集演奏音乐元数据的现有用例并开发更多用例
* 调查了与演奏音乐相关的现有关联数据【其他演奏音乐相关本体、词表等】
* 关于题名的初步立场文件(提交给所有本体组)【对变异题名、并列题名、作品题名、实例题名提出异议,建议新增若干题名类,包括bf:FRBRWorkTitle——是想把BIBFRAME的3层模型变成FRBR的4层模型?】
* 分析BIBFRAME并添加与演奏音乐相关的类和属性【只有32个类,无属性;更新的完整内容见:PMO中所有类、属性和个体[取值]的列表】
* 向LC提交已添加的类bf:Identifier,对音乐相关bf:Identifier子类的定义更改,以及bf:Identifier子类更改
* 建模演奏音乐特定概念,包括主题目录和作品编号以及音乐调和调式(key and mode)
* PMO中所有类、属性和个体[取值]的列表(更新时间2018-07-03)【只有类、属性,并无Individuals】
* 分析和建模文章:1用例;2事件;3-5演奏媒介,第1部分、第2部分、第3部分;6-7作品,第1部分、第2部分-汇编
* 映射:MARC 382 字段到 PMO(草案)

PMO中所有类、属性和个体的列表(The Performed Music Ontology (PMO): an extension to BIBFRAME 2.0 for Performed Music,更新时间2018-07-03)中,有对象属性23个、数据属性8个、类40个,其中“事件”相关类和属性占了相当大的比例。
与事件有关的类有14个——在“事件”文件(Events,更新时间2018-06-27)中还有另外2个——合计16个类(Class),列举如下:
EventName 事件名称
bf:Event子类(及子子类)
– Audition 面试
– BenefitConcert 福利音乐会
– Ceremony 仪式
– Concert 音乐会
— CommandPerformance 命令演奏(应君主或其他国家元首的要求完成音乐会或演出)
– ConcertSeries 音乐会系列(相同地理区域)
– ConcertTour 音乐会之旅(不同城市、国家或地点)
– Festival 【来自 Events 文件】
— MusicFestival【来自 Events 文件】
– MasterClass 大师班(大师授课的音乐高级讲习班)
– Performance 演奏
— FirstPerformance 第一次演奏
— LivePerformance 现场演奏
— OpenMicPerformance 打开麦克风表演(业余表演者在咖啡馆、夜总会或其他场地的现场表演)
– RecordingSession 录制会话
– Rehearsal 排演/排练

Events 文件对事件建模有详细说明和举例,引文件最后一段说明备记:
“另外两个音乐领域本体(Doremus和音乐本体论)也具有事件结构,两者都更精确,更能够非常精细地描述音乐事件,特别是录制会话和相关事件。鉴于对传统编目中事件关注普遍较低,由此导致缺乏丰富的信息,以及对编目人员愿意或能够提供多少工作的现实评估,PMO试图提供一个模型,比MARC可能的更丰富,并不寻求涵盖所有可能性。相反,我们确定我们的模型与Doremus和音乐本体论的模型尽可能兼容,并期望在PMO和Doremus之间建立正式的联系。”

BIBFRAME扩展:地理空间和制图资源本体(GCRO)

地理空间和制图资源本体(Geospatial and Cartographic Resources Ontology,GCRO)是BIBFRAME 2.0扩展本体bibliotek-o的扩展本体,目前为工作草案/beta版(2018-3-30最后更新),暂时采用 http://ontology.library.harvard.edu/geo/ 作为GCRO扩展的命名空间(占位、未激活)。
GCRO是LD4P项目中哈佛大学承担的制图资料项目中的重要内容。介绍见维基:Cartographic Extension (由 Michelle Futornick创建, 最终由 Marc McGee修改于 七月 17, 2018)
项目完成了6个优先考虑的概念领域(投影Projection、空间范围-边界框坐标 Spatial Extent – Bounding Box Coordinates、比例尺 Scale、地势 Relief、制图资源类型 Types of Cartographic Resources 和本初子午线 Prime Meridians)的本体开发,以支持完成11位研究员、学生和图书管理员用例。创建了GCRO本体的OWL文档,信息见:
LD4P Cartographic Materials GitHub repository
大致统计,GCRO共定义了153个类,5个对象属性,1个数据类型属性,24个取值(Named Individuals)。

根据某网络会议PPT(Linked Data Description of Cartographic Resources (Marc McGee, ALCTS Webinar, May 2, 2018),梯子自备)
GCRO为描述地理空间和地图资源,对BIBFRAME 2和bibliotek-o模型进行扩展,可能情况下复用已有LOD本体,包括:RDA, GeoSPARQL, Web Annotations, DCMI Metadata Terms, FOAF;推荐选择支持实体取值词汇。
GCRO所用主要本体:
描述领域:作品、实例、单件 —— 模型/本体:BIBFRAME
描述领域:活动、题名、内容/载体/媒介、主题、附注和注释 —— 模型/本体:bibliotek-o
描述领域:比例尺、地势、投影、坐标、制图资源类型 —— 模型/本体:GCRO
描述领域:本初子午线 —— 模型/本体:rdau
描述领域:测度 Measurements —— 模型/本体:ArtFrame-RareMat

参见:BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)

——— 附:LD4P项目中哈佛大学制图资料项目(计划) ———
Harvard Project Proposal(由 Alissa Hafele创建, 最终由 Michelle Futornick修改于 二月 07, 2017)

哈佛大学将探索为图书馆制图资源创建本地关联数据描述的最佳实践,包括印刷地图、地图集、数字地理空间数据集和其他制图信息资源。本项目将评估BIBFRAME作为数据模型的有效性,用于描述研究需求的制图材料,并将比较BIBFRAME的有效性与其他可用的关联数据描述性模式。此外,本小组将评估与制图资源描述相关的叙词表和受控词汇表,以识别最适合描述关联数据环境中制图资源的词汇表。
本项目的LD4L-Labs部分(5.1地理空间数据集和地理空间图像)将侧重于转换哈佛地理空间图书馆、斯坦福EarthWorks和康奈尔大学地理空间信息库的OpenGeoMetadata元数据记录的子集(现在使用地理空间社区标准“联邦地理数据委员会”(FGDC)架构,ISO 19139 表示),成为关联数据描述。
目标/预期成果【据PPT增加注释】
* 识别图书馆制图资源元数据用例、用户故事和研究需求。
* 评估现有BF模式是否适合描述制图资源。【schema.org?】
* 评估其他可用的LOD词表以描述制图资源的属性。【id.loc.gov, FAST, ISNI, VIAF, ISO 19139, GeoNames】
* 开发并记录BF配置文件以描述制图资源。
* 与制图资源社区合作,开发用于描述制图资源的BF最佳实践。
* 使用开发的BF配置文件(珍稀资料到原生数字、不同的语言)编目并转换代表性的制图资源选集,并为项目三元组库提供描述。
* 制订一套由联邦地理数据委员会(FGDC)地理空间元数据标准到关联数据的映射规则
* 使用LD4L-Labs将一组OpenGeoMetadata记录转换为使用制图资料本体的关联数据描述;协调和Originators、Place和Theme关键字以及丛编作品的源元数据中的关联数据实体;将描述发布到关联数据三元组库。
* 通知元数据生成工具的开发,以确保描述制图资源的兼容性。【VitroLib】
* 通知制图资料元数据可视化工具的开发。
* 评估项目结果并分享一系列建议,以便进一步研究和开发。
* 将项目结果呈现给适当的图书馆和关联数据社区,如ALA地图和地理空间信息圆桌会议(MAGIRT)、合作编目计划(PCC)、DLF(数字图书馆联盟)、数字人文组织联盟(ADHO)。
【以上是当初的计划书,从前引维基页面看,有2项推迟到将来:1、创建GCRO的SHACL应用配置文件;2、使用VitroLib的哈佛地理空间元数据实例中的GCRO应用配置文件测试一系列地理空间和制图资源的编目】

Viewing all 122 articles
Browse latest View live