图书MARC数据类型与编码
Sep282017
MARC(Machine Readable Cataloging)机读目录,从事图书馆工作的从业人员应该都不陌生了,但是还是很多人不清楚。今天通俗的讲讲一些概念。
MARC类型
- CNMARC
- USMARC(marc21)
- JMARC(日本)
因为大家在国内都是做的中文图书居多,这个cnmarc就是中国机读目录,也就是大陆专用的。而其他国家或地区都用的usmarc,包括台湾、香港、澳门,从解析合成算法上说这二者是一样的。
MARC编码
- gb2312(gbk)
- utf-8
- utf16(unicode)
- marc-8
这是几种常见的编码类型,在国内都是用gb2312也就是ansi格式,当你打开一个记事本然后另存为你会发现下面默认就是ansi格式。这种格式对于中文图书没有问题,但当出现小语种图书ansi格式保存就会乱码,这个时候就要用utf8了。目前的现状是国内小图书软件厂商基本只支持cnmarc、gb2312,而国外软件如艾利贝斯、KOHA、美国的Sirsi默认都是utf8编码,所以当marc编目数据导入导出流转时就会涉及编码问题,如果您遇到类似问题本公司提供技术支持服务。