赵传玉
(中国石化石油勘探开发研究院 中国石化地质资料中心)
摘 要 本文首先介绍美国的地质资料保管机构,然后从美国地调局的“全国地质和地球物理数据保管项目(简称NGGDPP)”切入,研究美国的地质资料管理流程、管理系统、地质资料服务平台与服务特点等内容。在此基础上 ,提出美国地质资料管理、服务工作对中国石化的四点借鉴,分别是依靠特色馆藏建设提高地质资料管理工作效益与形象,依靠多层次分布式地质资料全文管理系统提供利用服务,依靠地质资料统一目录标准的严格执行提高信息共享水平和以用户需求为导向建立地质资料专题服务模式。
关键词 地质资料 管理 服务 美国 NGGDPP
油气地质资料是油气勘探开发工作的主要成果之一,是广大地质工作者经验、认识和智慧的结晶,其对油气勘探开发工作的指导意义不言自明。本文通过对美国的地质资料管理、服务实例进行分析,以期能对中国石化的地质资料管理工作有所借鉴。
1 美国的地质资料管理
1.1 地质资料管理机构
美国的地质资料管理机构有两种类型,一种是兼具地质资料行政管理与保管性质的机构,这类机构主要是美国地调局(下称 USGS)及各州地调局;另一种是单纯的地质资料保管机构,这类机构主要包括其他州属机构、大学、博物馆和私人公司等,它们保存的主要是一些特有的地质资料。目前,各机构的保管条件及状况存在着差别,有些单位已将资料详细编目并数字化,可通过网络查询;也有单位尚未编目,或尚未数字化。
1.2 地质资料管理的基础建设——以 NGGDPP 为依托
1.2.1 NGGDPP 概述
2005 年美国通过了《2005 能源政策法案》,其第 351 条款责成内政部长通过 USGS 执行“全国地质和地球物理数据保管项目”(简称 NGGDPP),并批准在 2006 ~ 2010 年的每个财政年度为该项目专门拨款 3000 万美元。
NGGDPP 的主要目标是,由 USGS 牵头,统一建立全国实物地质资料库、数据档案库,以及各馆库之间的全国合作网络。据此,NGGDPP 的主要工作内容是,制定一套全国标准,确保各独立运作的馆库中数据按所采用的国家和国际格式与标准存档;以共同的标准、程序和元数据规程为指导,将各独立运作的实物地质资料库和数据档案库联网,建立全国合作网络;建立一套共用的、基于互联网的镜像目录,即“全国数字目录”,使所有库藏都得到广泛利用,服务于当前及日后需求。
NGGDPP 由联邦部分成员和州部分成员组成,联邦部分成员指收集、保管地质与地球物理资料和实物资料的内政部所辖各联邦机构,州部分成员指收集、保管地质与地球物理资料和实物资料的州地调局(或承担州地调局职能的州属机构),他们的主要任务是恰当地归档、保管分别按联邦权限和按州的权限被确定为对美国经济、社会、环境或科学事业有重要意义的地质与地球物理资料和实物资料,并提供利用。
1.2.2 地质资料的管理流程
NGGDPP 对美国地质资料的管理流程进行了规范,主要包括以下步骤:①制定规程,以评估哪些地质资料和实物资料应归档、保存、利用或销毁;②建立一个系统,来管理地质资料、实物资料及其元数据;③为这些资料提供适当的保管设施和场所;④向用户宣传这些资料并提供利用;⑤确保这些地质资料和实物资料始终有利用价值,并且可靠。
1.2.3 地质资料管理系统
NGGDPP 实施以前,美国的地质资料管理系统,以国家地学数据仓库系统(简称 NGDRS)最为著名,该系统由美国地质学会于 1994 年启动开发,其主要成果是建立了 GeoTrek 元数据目录系统,将各参与机构贡献的地质资料元数据进行了统一和规范。
NGGDPP 实施后,USGS 在 NGDRS 的基础上,将分布在各地质资料保管机构的资料数据保管系统,用“全国数字目录”进行管理,建立分布式地质资料数据保管系统。该系统由两部分构成:一是物理基础设施,主要是实物资料库;二是数字基础设施,包括地质数据档案库和标准化目录。
实物资料库由分布式运行的联邦和州属实物资料库的集成网络构成,其中联邦库主要保管 USGS 特定项目产生的实物资料、具有国家意义的实物资料,以及一些特殊的实物资料(如冰心等),由美国地调局、矿产管理局以及其他内政部下属机构负责维护。州属实物资料库主要保管在该州形成的实物资料,由州地调局负责维护,通常每一个实物资料库都具有特色馆藏。
“全国数字目录”则是用户与各实物资料库、地质数据档案库之间的桥梁。该目录包括三部分内容:一是各保管机构可供利用的地质资料和实物资料,二是各保管机构的特殊地质资料和特别库藏,三是这些地质资料的利用途径。“全国数字目录”是各种地质资料数据库的网络端口,其本身并不支持或管理真正的地质资料与实物资料,而是通过共同的元数据将各地质数据档案库和实物资料库的数据进行链接,促进联网资料的快速搜索和查询。
2 美国的地质资料服务
2.1 地质资料服务平台
美国有两个地质资料公共服务平台:一是地球科学信息中心(简称 ESIC),二是地球资源观测和科学中心(简称 EROS)。前者分布于美国的 47 个州或地区,是 USGS 对外服务的主要窗口,负责其相关网络站点的维护,提供其产品和出版物的销售服务,并承担其宣传工作。后者则是 USGS 的遥感数据管理与研究中心,主要是承担航空影像和卫星遥感影像的管理与研究工作,其中四十多年形成的数百万幅航空像片和卫星影像,全部可通过计算机检索查询。
2.2 地质资料服务特点
通过对 USGS、ESIC、EROS 平台的访问与检索,笔者总结出美国的地质资料服务具有如下四方面的特点。
2.2.1 以网络服务为主的地质资料服务方式
USGS 委托 ESIC,充分利用现代网络技术,开发、维护其相关的网络站点,大力宣传其产品和特点;接收并处理用户订单,答复用户问题;研发相应搜索软件,并加载相关地质资料信息,便于用户高效地搜索并获取所需产品。
目前,USGS 在全国范围内建立了自己相互独立的外部网和内部网,在其外部门户网站上,共有 150多个 WEB 服务器向外提供信息服务,用户只需借助门户站点即可查询浏览各类信息,以及其可提供的所有产品信息,并且大部分数字化产品可通过网络直接下载。对于部分数据量庞大的数字化产品,如国家地图集、全球范围内的 1km×1km 的 DEM(Digital Elevation Models)数据、全球范围内的地面分辨率为10m 的土地覆盖数据等。他们还开发了相应的搜索软件,以便用户在网上免费查询、获取。而 USGS 内部网提供各种管理信息、人员、文献资料、信息资源、论坛等服务,职员可随时通过网络了解单位的最新情况,查询其他职员的联络信息以及进行技术交流,获取共享资源等。这种以网络服务为主的地质资料服务方式,不仅便捷、快速,而且十分高效。
2.2.2 多机构联合的社会化服务机制
目前,随着地学服务领域的不断扩大、地学信息需求的不断增长与多样化,社会对多机构联合提供地学知识与地质资料信息服务的要求越来越强烈。USGS 本着为全社会公众服务的理念,与相关机构形成长期紧密合作,地质资料信息服务范围逐渐扩展到其他政府部门、事业单位及商业机构,形成了多机构联合的社会化服务机制。这一服务机制的典型就是“地理空间信息一站式服务”项目,目前加入该项目的联邦机构,州、地方和部落自治政府,私营企业及其他社会组织等已达 19 个之多。这些机构通过合作,提供统一服务,改善公众和政府利用地理空间数据的能力。多机构联合的社会化服务机制,既提高了地质资料的服务能力和服务水平,也改善了用户的利用体验。
2.2.3 标准化产品与非标准化产品并存的服务内容
除实行多机构联合服务的服务机制之外,USGS 在服务产品的内容上强调多样化,既提供标准形式产品的服务,也会根据用户需求生产非标准、个性化的产品来提供服务。根据用户的不同需求,USGS 可能与不同的部门合作,提供不同方面的产品服务;即使为同一部门或单位提供服务,也可能根据专题内容的不同,由不同的小组提供各有侧重的产品。目前,USGS 在全美设立了 9 个联络办公室,用于与政府及有关部门沟通,收集需求信息,解答专业方面的问题,并及时将相关信息反馈到各中心和国家测绘局,为制订计划提供参考。标准化产品与非标准化产品并存的服务内容,极大地提高了地质资料的利用程度,进一步改善了用户的利用体验。
3 对中国石化的借鉴
研究美国的地质资料管理、服务工作情况,目的是对中国石化的地质资料管理工作提供借鉴。笔者认为,美国的地质资料管理、服务工作情况,可为我们提供以下四方面的有益借鉴。
3.1 依靠特色馆藏建设,提高地质资料管理工作效益与形象
所谓特色馆藏,是指某一个馆藏机构中保管的地质资料、数据是独一无二的,是其他馆藏机构所不具有的。笔者在研究中发现,USGS 各地质资料馆库,均十分强调馆藏资源的独特性与唯一性,这些独一无二的馆藏是其各级馆库核心竞争力的体现。相比之下,中国石化目前各馆藏机构中保管的地质资料,存在着较大程度的重复。据《中国石化 2011 年地质资料管理工作年报》数据显示,截至 2011 年 12 月底,中国石化各馆藏机构中保存着 829.6 万件复制本地质资料,这其中有相当一部分是重复件,库藏资料大量重复,势必会造成低效率的重复劳动,导致管理成本增加。
开展特色馆藏建设,是以实现每一个馆藏机构保管的地质资料的独特性和唯一性为主要目标,避免各机构地质资料的相互重复,减少重复与低效率的劳动,降低管理成本,将节约的人力、物力投入到对地质资料档案信息资源的开发与综合研究方面,既利于提升各馆藏机构的核心竞争力,也利于整体提升中国石化地质资料管理工作的效益与形象。
3.2 依靠多层次分布式地质资料全文管理系统,提供利用服务
地质资料管理的主要目的,是为科研生产提供参考服务,从此角度出发,重复馆藏方便了对地质资料的利用;而开展特色馆藏建设,则要尽量减少重复馆藏,二者产生了不易调和的矛盾。笔者认为,要解决这一矛盾,可依靠多层次分布式地质资料全文管理系统。分布式系统(Distributed System)是建立在网络之上的软件系统,在分布式数据库系统中,虽然存在多个数据库节点,但用户感觉不到数据分布于哪个站点、事务在哪个站点上执行等,就如同操作本地数据库管理系统一样。
前文述及,美国依托于 NGGDPP 建立的“全国数字目录”将分布在各地区的地质数据档案库和实物地质资料库的数据进行链接。用户无需关心地质资料的实际保存位置,直接通过该目录即可进行联网资料的快速查询,实现对各保管单位地质资料的无缝检索。信息化同样是我国及中国石化地质资料管理的大势所趋,中国石化各馆藏机构都正在或准备建设本机构的地质资料数据库管理系统,提供网络服务。建立多层次的分布式地质资料全文管理系统,就是要对各机构的地质资料数据库管理系统进行资源整合,分别建立馆藏机构级别、分公司级别和中国石化级别的地质资料全文管理系统,分别向本单位科研人员、本分公司科研人员、中国石化全公司科研人员提供网络全文服务。基于网络的分布式管理系统,用户无需知晓具体的地质资料保管地点,即可实现地质资料的网络全文利用,便于解决特色馆藏建设与减少重复馆藏之间的两难选择。
3.3 依靠地质资料统一目录标准的严格执行,提高信息共享水平
目前,中国石化已经发布《地质档案元数据及著录规则》企业标准,对地质资料数据库建设中提取哪些元数据及每一元数据的具体著录要求进行了规范,但因为缺乏有效的控制措施,执行情况并不理想。
建立多层次分布式的地质资料全文管理系统,严格执行统一的地质资料元数据标准不可或缺。唯此,各馆藏机构地质资料数据库管理系统中的数据才能统一格式,分布式管理才能行之有效。USGS 在统一建立全国实物资料库、数据档案库时,要求各地质资料保管单位库中数据必须遵循统一的格式与标准,才能获得联邦财政资助。中国石化也可以此为借鉴,充分发挥资金杠杆的作用,要求各地质资料馆藏机构的地质资料数据库建设,必须遵循统一的石化企业标准,方能提供经费支持,这样便于确保地质资料统一标准目录的严格执行,提高地质资料信息共享水平。
3.4 以用户需求为导向,建立地质资料专题服务模式
前文述及,美国的地质资料服务特别注重满足用户需求,并根据不同的需求,既提供标准化产品服务,也提供个性化产品服务,提高了地质资料的利用服务水平和服务效果。笔者在工作实践中发现,中国石化总体的地质资料利用率不是很高,地质资料的作用未能充分发挥。这主要是因为各级馆藏机构对地质资料用户的利用需求把握不够准确和充分,地质资料利用服务没有以用户需求为导向,致使各级机构的服务与用户需求未能吻合。要解决这些问题,中国石化各级地质资料馆藏机构可借鉴美国的地质资料服务模式,设立专门的利用需求调研岗位,加强对地质资料用户的利用需求分析与利用效果反馈收集;针对不同项目组,不同研究人员,提供专题性服务;同时,对用户利用需求的分析和反馈的利用效果进行综合研究,开展专题性的地质资料信息资源深层次开发工作,编制地质资料的二次、三次文献。