崔秀宁把自己关在寝宫,拿起一支炭笔,一边思索一边写写画画。
她要设计出,大唐版的大数据统计模型。当然,这肯定不能叫大数据,只能算统计年表。
古代当然也有数据统计。但因为方法论的问题,数据真实度非常可疑,而且采样元素太单一。宏观上勉强能用,微观上完全不能用。
这个问题,她和李洛之前都忽略了。大唐成立了很多新部门,却没有统计部门。这么大个国家,没有专业的统计部门,行吗?不行。
“数据还是比官员的奏章更可靠。”崔秀宁自言自语的说了一句,像做数学题那样,开始建立模型。
在调查监测过程中,最令人信服的是采集到的数据,而不是官员的主观汇报。数据很冰冷,可数据也最能反映客观问题。很多看似没有联系的不同维度的数据组合在一起,就能看出问题的真相。
这才是真正的以小见大。
前提是,数据不能失真。
崔秀宁当李洛这个“书法家”的老婆已经多年,字比当年漂亮多了。她的笔下,首先出现“县域”两个秀丽的字。
没错,经过斟酌,她要以县域为最小地域统计单位。以古代的条件,以县域为数据采集最小地域单位已经是极限了。
接着,女人的笔下出现1182四个阿拉伯数字,这是大唐所有的县域数量。
好了,最小数据统计地域定好了。那么由谁来采集数据?
当然要多方提供,而绝不能让地方官衙单方面采集。
原则上,专业部门,对口采集专业数据。
比如,某县一年的新生儿数量,性别比例,这项数据要有司妇寺来负责提供。
田亩变化数据,要有户部负责采集。
某地粮价等,要有商部负责采集。
如此一来,不同部门采集不同数据,不但便于专业操作,也增加了数据渠道,避免全盘作假。
那么地方官衙干什么呢?评审数据。
朝廷采集到的综合数据,先以草案的形式下发给郡县。郡县官衙觉得数据不对,就可以提出异议。
一旦某个地方的官衙对统计数据提出异议,那么相关调查就会展开。就这么追责,谁的责任谁承担。
特察局干什么呢?各地的特务不但提供另一套简化版的秘密数据以作参考,还要监视数据采集者的行为。
那么,统计大权由谁来主管呢?当然是准备成立的统计局。
统计局的绩效考核只有一个:数据的真实度和有效性。
数据好坏和统计局的考评完全无关,只和数据真假相关。以此为导向,统计局就会监察数据真假,就会派出统计员核查各渠道的统计数据,只要纠正错误,就有话语权。
如此一来,统计数据就是多方参与,任何一方作假都很困难。
最后得到的统计数据,会作为分析依据,供统计局研究,及时发现各种问题,为大唐政治服务。
这以上是大概构架。
崔秀宁设计完构架,就开始添加数据采集的元素。
有哪些数据需要采集呢?
有人口、主要物价、出生和死亡率、税收、就学率、服役率、田亩、人均寿命、食物种类、犯罪率、出家人口、诉讼数量、降水、旱季天数、驿站流动量、林地和渔场数、戏剧演出场次、铜簋举报次数、人均口粮等等。
最后,崔秀宁一共罗列出四十项数据,涵盖了民生、吏治、教化、治安、医疗、民意、风气等多个方面。只要数据在,哪个县的现状,立刻清清楚楚。
每年采集一次,每年都要做一个全面的数据分析。
这就是让整个大唐每年做一个全身体检,及时了解健康状况。