在国家的普查方案中涉及771个指标,而北京市设计的调查表则涵盖了1392个指标。特殊的需求,决定北京市的经济普查需要在系统层面做出调整。
在奥运会前期紧锣密鼓地筹备之时,另外一项庞大的工程也在北京开始了,这就是北京市第二次全国经济普查。2008年7月19日,召开了北京市第二次全国经济普查第一次领导小组全体会议,它标志着第二次全国经济普查工作在北京市全面启动。直到现在,北京市的普查工作基本告一段落,所有普查数据已经报送国家。预计到2009年年底,北京市第二次经济普查结果将发布。
北京市此次经济普查,主要任务不仅是对第二、三产业进行深入细致的调查,也要对区域经济发展状况做出回答,还要对北京市节能减排工作进行一次全面的统计和分析。
相比较2004年第一次经济普查,此次经济普查,北京法人单位从25.6万家增加到近40万家,个体户数量从47.7万个增加到50多万个。面对如此庞大的调查范围,同时也为了满足北京市对各方面经济状况的了解,以北京市统计局计算中心人员为主组成的数据处理组,为普查数据的收集、处理、分析以及后期的资料开发、数据利用等工作提供了各类信息技术支持。
自建企业网络直报
为了满足第二次经济普查大多数省份的要求,国家统计局向各省、自治区、直辖市下发了专用的普查软件。但是,北京市作为首都,国家下发的统一软件很难满足北京市的特殊需求。“我们用的是自己的软件,是北京市经济统计所需要的。”北京市统计局计算中心主任王晓路说,“北京的企业多,经营活动各种各样,所以除了国家要求统计的经济指标之外,还要根据北京具体情况增加很多指标”。
在国家的普查方案中,有65张报表、771个指标,而北京市设计调查表126张、各类指标1392个。其中很多调查指标都是以往统计调查中没有囊括或从未全面掌握了解过的,例如电子商务、网站建设、因特网应用等信息化情况,还有各类高耗能设备的使用情况,跨国公司地区总部等总部经济发展情况等。
于是,北京市将现有的核心业务平台进行了功能完善,让企业能够通过网络实现报表的直报。北京市统计局的核心业务平台是2007年年中建成的,2007年下半年试用,到2008年开始全面使用。“这个平台实现了北京市三级统计机构(市、区县、街乡统计所)人员,按照各自的权限,在统一的平台上进行工作,企业也能够通过这个平台报送数据,各级机构能够在这个平台上按照各自的职能实现管理职能。”王晓路说,“同时,通过这个平台,上级机构还能够对下级的工作进行监管。这样就加强了数据处理的规范性,同时也能够提高数据的质量。”
就这样,在考虑支撑第二次经济普查数据处理方案的时候,相关领导提出要利用现已存在的核心业务平台。要知道,当初这个核心业务平台主要是满足常规调查的,常规调查只是对规模以上的法人单位进行调查,这部分单位仅有4.6万家;而此次普查,需要填报普查报表的法人单位有27万家,是常规调查的近6倍。面对这种情况,北京市统计局计算中心对原有系统的设备进行了扩容,并对一些功能进行了完善,以满足庞大的经济普查的要求。
在第二次经济普查中,这个平台面向的对象主要是填报企业以及统计业务人员,针对这两大对象,核心业务平台在之前已经具有了强大的功能特点,一方面可以给企业提供人性化的服务,另一方面能够减轻统计人员的工作负担。
作为企业,它们可以以口令方式或者证书方式登录到“北京统计数据集中采集平台”,这时就可以直观地看到该单位所需要填报的各种报表,并且其中会提示单位各种报表不同的报送时间,如果有些报表马上就要上报了,它会以一种醒目的方式提醒该单位。在每一张报表背后,都有一套元数据进行支撑,当鼠标点到某个指标时,就会出现有关该指标的解释。这使得填报人能够更好地理解各个指标的含义,防止误报。而一旦填报人在填报的过程中出现了错误,系统的审核功能能够发现错误,以醒目的红色提醒填报人“数据有误”。除了在单位填报过程中,有这样一些人性化的提示、提醒服务之外,北京市统计局还使用了一套语音、短信的方式进行提醒,或者通过固定的语音电话,或者通过短信,提醒企业某张报表到什么时间截止。这些措施都极大地保证了企业能够及时地填报数据,并在很大程度上保证了数据的质量。
在此次经济普查中,北京地区通过网上报送报表的单位有16万家,占27万有经济活动的单位的近60%。从时间上看,这些单位网络报送的时间是交叉的。规模(限额)以上的单位上网报送时间是2009年1月初至2月底,规模(限额)以下单位网上填报时间是2月初至3月底。
为了提高系统的可用性,北京市统计局计算中心还开发了一套数据报送的离线系统。因为在线填报的方式需要服务器进行处理,后台的数据库也要进行及时响应,而利用离线的方式,用户就可以在客户端进行数据的填写与处理,处理之后再上传即可。
对于那些没有网络条件的企业来说,他们可以将报表送到统计机构,统计机构的人员同样利用离线系统,将数据录入之后,批量上传。最终,北京市本次经济普查共获得了230万张报表、1.3亿笔原始数据,这些将对掌握北京市的经济运行状况起到基础性作用。
清查,在过程中剔重
单位清查是数据收集的源头,做好了这项工作才能确保普查数据“全、准、实、清”的必要条件。清查工作是“摸底”,是后续工作的基础。
“在清查过程中,实际上就是要搜一遍都有哪些单位以及他们的基本情况,根据他们的基本情况,确定他们需要填报的报表以及指标。”但是清查过程中的“剔重”工作一直是一项非常繁重的工作。因为一个企业在地域上可能有几个场所,不同区域的普查员可能上报来的是同一个企业,这样在后期就有了很繁重的剔重工作。
以往,这项工作是逐级进行的,比如说街乡一级如果有重复的企业,在区一级要进行剔除,但是不同区之间并不知晓彼此之间是否有重复,于是市一级再对区县级的重复单位进行剔重工作。如今,北京市统计局利用其核心业务平台将这项工作日常化了。比如最小的单位是街乡,当这一级的普查员要输入某个企业的信息时,可能在同一区域已经有了这家企业,所以系统就提示不能录入。这样一来,就防止了同一区域同一家企业的重复。到了区县一级,区县的负责人能够实时地看到平台上是否有重复的企业,并对其进行剔除。同样,市一级的负责人也能看到区县之间的重复信息,并进行剔除。就这样,通过在清查过程中进行剔重的工作,使得清查工作在两个月的时间就完成了,这在统计系统里是比较少见的。
不同的视角看数据
2009年7月22日,北京市经济普查办公室召开了北京市第二次全国经济普查资料开发应用工作培训会议,全面部署普查资料开发应用工作。北京市统计局计算中心同样要为后期的资料开发提供支持。
目前,北京市统计局计算中心正在做后期的资料开发系统,据王晓路介绍,该系统预计今年8月底即可开发完成,9月份开始测试以及培训,当国家数据评估完成之后,就可以进行系统应用。开发这套系统的主要目的是为了满足各种各样资料的分析,包括普查后期整个出版物的制作,都涵盖在内。对于业务人员来说,他们进行各种课题和资料分析的需求是不定的,可能是从不同的角度去看这些数据,因此现在主要是用在线分析工具集成做各种模型,以满足各个专业的分析。
地理信息系统在北京市第二次经济普查中也得到了应用,并将在普查结束后,成为另外一种了解北京市经济状况的方式。
“其实在清查阶段,我们就开展了地理信息系统的准备工作。”王晓路说。在之前北京市的矢量地图就已经存在了,并且根据企业的原始情况进行了建筑物标注,如果普查员在进行清查的过程中有变更,那么就需要再进行一次标注,目前,这些资料都已经在地理信息系统中进行了标注。
“当普查数据最后确认之后,我们就将针对地理信息系统的方式做数据的查询服务。”应该说,地理信息系统就是将数据以另外一种方式进行展现。这种表现形式在北京市统计局并不是第一次应用。
早在2005年进行第二次农业普查的时候,北京市统计局就已经建立了一个地理信息系统,那个时候它更多的是展示农村、农业、农民经济状况。第二次经济普查反映的主要是楼宇的分布,基于此所建立的地理信息系统与农业普查所建立的地理信息系统是衔接的,并不需要全部开发。当再进行人口普查之时,住宅情况也将纳入到地理信息系统当中,那么这个地理信息系统就能较好地反映北京市的农业、经济、人口等状况。