王静茹
(国土资源部实物地质资料中心,三河065201)
摘要 本文从元数据概念出发,结合实物地质资料信息化现状,对实物地质资料采取元数据技术实现数字化进程中的若干问题进行了探索。重点论述了元数据技术在实物地质资料信息化的重要性和可行性,阐明了在实物地质资料领域应用元数据技术可以避免其他行业在数字化进程中遇到的问题,从而更有效的实现数据共享,对促进实物地质资料成果的交流和推广,有着十分重要的意义。
关键词 元数据;实物地质资料;信息化;应用
1 概述
信息化、数字化使信息资源提供者和使用者之间突破时间、空间、地域的限制,使信息资源实现更广时空范围内的共享。随着科技水平的不断进步,交流范围的不断拓展,对数字化的信息资源采取标准化、专业化处理,已成为信息资源提供者和使用者的共同要求。目前,很多领域在数字化时选择了元数据处理技术,它通过采用普遍适用的数据标准,使信息资源具有很强“可读性”、科学性和先进性,实现了信息资源的数字化和更大范围共享,满足了不同使用者的差异性要求,取得了很好的社会效益和经济效益。
2 元数据概念与技术特点
2.1 元数据的基本概念
元数据最本质的定义是关于数据的数据(data about data)。元数据可以为各种形态的信息资源(或称本体)提供规范、普遍的描述方法和检索工具,为分散的、由多种资源组成的信息体系提供整合的工具与纽带。
元数据的功能或作用主要为描述、资源发现、数据管理、访问控制、数字化保存、内容分级等诸多方面。按照元数据的主要功能,元数据一般可分为描述性元数据、管理型元数据、结构性元数据、保存性元数据等。描述性元数据是用来描述、发现和鉴别数字化信息对象,它主要描述信息资源的主题和内容特征。管理型元数据是以管理资源对象为目的的属性元素,包括资源对象的显示、注解、使用、长期管理等方面的内容。结构性元数据用于定义一个复杂的资源对象的物理结构,以利于信息检索和显示。元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例可以表达为关系型数据库中的表,从而能够利用数据库系统或各类应用软件进行管理。保存性元数据是以保存资源对象为信息系统的开发目的,特别注重资源对象长期保存有关的属性。
元数据的提供者可以根据本体的不同,有侧重地实现某些功能。如对实物地质资料而言,由于其历史价值一般较高,要求长期保存并能基本维持其原貌,但在自然条件下,要达到这一要求具有相当的难度,必须支付相当昂贵的日常维护成本。在数字化背景下,则完全可以实现永久“虚拟”保存功能,从这一角度说,实物地质资料元数据可以认为是保存性元数据,另外,实现资源发现等其他功能也比较重要。
2.2 元数据技术特点
简单地说,元数据技术是指基于元数据标准而实现资源数字化的一整套标准、流程的总称。元数据标准是经过标准化组织认可的元数据方案。
(1)元数据标准将成为未来数字化的普遍标准。数字化是随着互联网的产生而产生的。同时,随着互联网语言标准的变化,数字化语言标准将作适应性调整和变化。目前网络环境下的数字化成果大多数基于第二代互联网语言标准。研究表明,随着互联网的飞速发展,下一代万维网——语义万维网(Semantic Web)将赋予万维网上所有资源唯一的标识,并在资源之间建立机器可处理的各类语义联系,元数据将是语义万维网的语义基础。随着新一代万维网的普及和推广,目前的大多数非元数据数字化成果将面临被淘汰,或是付出高成本将其转换为元数据标准。
(2)元数据技术以资源数字化为前提,以元数据集为内核。资源数字化是采取元数据技术的前提和基础,从理论上来说任何资源都可别标识,都可以进行数字化处理,也都可以采取元数据技术,但限于技术条件和效益—成本约束,有些资源无法(或不值得)数字化,因此也不宜使用元数据技术。
(3)元数据强烈依赖网络平台。形象地说,元数据是在网络环境下,计算机之间进行交流的语言,元数据既看不见,又摸不着,不是一种可视语言,它只有依托网络平台,其所描述的本体才能表达和展现出来,元数据对网络环境具有强烈的依赖性,离开网络,就无从谈论元数据。
3 元数据技术在实物地质资料信息资源应用中的重要性和可行性
实物地质资料一般无法复制,即使随着科学技术水平的提高和分析手段的改进,能够在特定条件下实现部分重置,但成本也是很高的。再加上同样高昂的采集成本,一份实物地质资料,其直观的经济价值就相当可观。
实物地质资料的最主要的功能是为长期、可持续地研究、分析我国基础地质、矿产资源等方面提供基础性研究样本。因此,实物地质资料的社会性和公益性价值是无法用金钱来衡量的,是一种形成于历史、发掘于现代、惠及后世的极其宝贵的社会资源。但是,由于实物地质资料大部分以实体形态存在(如岩心、矿心、岩石样本等),移动困难,资料使用者只好采取实地观察的形式,给使用者造成很大的不便。而且,这些实物资料在移动过程中易于损毁,造成无法弥补的损失。因此,利用先进的技术方法,改进和提高分析手段,对加强实物地质资料保管、分析研究和提高其使用效率,具有十分重要的意义。元数据技术就可以很好地解决这一问题,它可以在不见实物的情况下,利用网络平台,实现对实物地质资料物理、化学等属性特征的分析研究工作。在这一过程中,元数据扮演了实物“替代品”的角色,即使实体被损毁或丢失,通过元数据技术采集的信息仍可以达到“恢复”实体的效果。实体与虚拟体的分离,可以减轻对实体的维护压力,降低损耗和维护成本,亦可延长实体的使用寿命。
按照元数据技术原理,资源是可以被标识的任何东西,既可以是实体的,也可以是抽象的。实物地质资料主要以实体形态存在,包括岩心、矿心、软泥心、岩石、矿石、矿物、岩石光片、薄片、重砂等,另外,如分析材料、物理性实验结论、化验成果等则以抽象形态存在。从理论上来说,实物地质资料也是一种资源,无论其是实体形态,还是抽象形态,均可以采取元数据技术进行处理,因此,采取元数据技术在理论上是可行的。
国家已经发布了地理信息元数据(ISO 19115—2003(E)Geographic information-Metadata.GB/T 19710—2005)和国土资源信息核心元数据标准(TD/T 1016—2003),对指导和推进元数据技术在地质领域的应用起到了重要的作用。2007年12月7日,中国地质调查局发布了《地质信息元数据标准》,这一系列与元数据有关的重要标准的发布,标志着在地质领域应用元数据技术已经有了成熟的制度基础。
元数据技术是以信息数字化为实践基础,以网络为背景,以元数据集为内核,因此首先要求资源的数字化,其次对信息平台有强烈的依赖性。随着《实物地质资料管理办法》的颁布实施,实物地质资料的管理逐步规范化、制度化,实物地质资料中心已经根据国土资源部“关于建立健全地质资料网络服务体系”的通知要求,建立了自己的信息平台。岩心扫描技术和图像分析技术也越来越成熟,也使实物地质资料数字化成为现实。在实物地质资料领域采取元数据技术,在硬件方面已经没有无法逾越的障碍。
因此,在实物地质资料领域应用元数据技术,在理论上、制度上、硬件等方面已经具备成熟条件,完全可以根据元数据标准实现实物地质资料资源信息化,建立实物地质资料元数据集。
4 结论与建议
目前许多发达国家已经进入数字化时代,我国也加大了对数字化的投入和建设,相对于其他领先行业和领域,如石油行业,实物地质资料领域处于较落后的位置,数字化建设基本刚刚起步,但正是这种明显的劣势,通过各方面的努力,却可以转化为优势,即在起步阶段就采取高技术标准,就完全可以避免重走其他行业在探索阶段所必须经历的弯路,大幅度降低成本。采用元数据这一“通用”语言,就可以实现数据在国际国内间的互换,对促进实物地质资料成果的交流和推广,有着十分重要的意义。
目前,实物地质资料管理工作依旧以传统的实体整理为主,数字化成果较少且尚处于起步阶段,而且国家及有关部门对实物地质资料数字化还没有强制提出采用元数据标准。但是,元数据技术作为下一代网络信息资源整理技术的发展方向和新标准,现在数字化技术条件下的实物地质资料数字化成果将难以适应新技术发展的要求,也势必会阻碍实物地质资料的深入开发和广泛共享。因此,根据网络新技术发展要求,尽快尽早地采用元数据技术实现实物地质资料的数字化,为全社会提供更广泛的公益性服务,是实物地质资料整理、应用的重要课题之一。