陈志武

陈志武:香港大学冯氏基金讲席教授与亚洲环球研究所所长 、原耶鲁大学金融学终身教授

采访者 魏尚进:复旦大学泛海国际金融学院学术访问教授 、哥伦比亚大学终身讲席教授

点击查看PDF

新知识革命:量化历史重构现代金融研究

ziyuan5.jpg


导语

大数据拓展了人类的认知,“历史大数据”还原着经济真相。量化历史研究这种新方法对历史假说、经济规律等会带来哪些意想不到的新认知呢?传统文化背后的历史数据秘密对金融改革又有哪些启示呢?


一场新知识革命正在西方悄然兴起,中国学术界可能要“缺席”了。

20世纪70年代,特别是80年代初期个人电脑出现后,计算机容量不断增加,普及度显著上升,使基于海量历史资料的研究变得可行;但在70年代到80年代的时间段中,这些潜力对历史研究的影响还很有限,因为历史档案的电子化与数据库化直到90年代才开始;2000年后,不同类别的历史数据库陆续出现,并逐步形成规模,而那时兴起的互联网热度,又把零散的历史资料库方便地连在一起,开启了“历史大数据”时代。

时至今日,无论是历史学、经济学,还是政治学、社会学界,都出现了基于各国历史的量化研究,所研究的历史长度、广度与深度都发生了质的跳跃,这些量化研究快速地拓展了我们对人类过去与今天的认知。

然而,在过去多年里,历史学界受过量化方法训练的人很少,学过经济学、政治学等社会科学的人也不多;而经济学、政治学研究领域内,了解历史的学者也少得可怜。所以,在过去的二十多年里,国内历史学与社会科学的交互研究很少,导致国内学界基本上错过了由“历史大数据”带来的这场新知识革命。

香港大学冯氏基金讲席教授、原耶鲁大学金融学终身教授、北京大学经济学院特聘教授陈志武在国内最早提出了量化历史研究的概念,并在2013年与清华大学龙登高、伦敦政治经济学院马德斌、香港科技大学龚启圣等教授一起举办了第一届量化历史讲习班。

日前,陈志武教授与复旦大学泛海国际金融学院学术访问教授魏尚进教授,就量化历史研究对历史学假说的检验、对现代经济学逻辑和金融学发展的社会意义以及对宏观经济政策制定的借鉴作用,进行了深入且透彻的探讨。

量化历史不仅仅是“用数据说话”

魏尚进:

量化历史研究不只是统计检验以前历史学家提出的假说,这种新方法是否也可以带来以前想不到的新认知?

陈志武:

量化历史方法并不是要取代传统历史研究方法,而是对后者的一种补充,是把科学研究方法的全过程带入历史领域。我们必须看到,1980年代之前电脑没有普及,更没有互联网,那时整理历史大数据很难,做统计回归分析和检验假说也很难。

当时最大的问题是没有计算工具,或者说所需要的统计方法超过了当时具备的数据处理能力。一般来说,20多个观察变量就已经很难做回归分析了;如果观察变量超过30个,就基本无法进行手动计算。但是,现在没有这些问题了。

魏尚进:

这让我想到了一个小插曲,是关于小样本的量化历史研究。诺贝尔经济学奖获得者、芝加哥大学教授米尔顿·弗里德曼提出了“现代货币数量论”,即通货膨胀起源于“太多的货币追逐太少的商品”。政府可以通过控制货币增长来遏制通胀。《政治经济学》杂志发表的一篇小样本量化研究的论文指出,中国是最早发明纸币的国家,同时也是最早发生通货膨胀的国家,并试图通过对纸币发行数量和通货膨胀的关系数据的举证,得出二者正相关的结论。历史上的数据非常少(仅10个左右),但这依然能证明米尔顿·弗里德曼的理论是正确的。

陈志武:

起初,历史研究中的“量化方法”很简单,差不多就是“用数据说话”,加上图表和一些普通的统计指标,比如均值、方差和相关系数。由于经济研究比任何其他学科都更依赖数据,所以经济史最早引进量化方法。美国经济史学会于1940年成立,标志着经济史从其他学科独立出来。但由于当时大多数经济史学家出身于历史学,他们对经济学和数理统计方法感到陌生,加之经济学本身也尚不成熟,经济史著作自然偏重史料考证与叙述,偏重靠直觉猜想历史事件之间的因果关系,更多地停留在定性分析,不在意收集大样本数据来对因果关系假说做统计检验。 

与一般科学研究方法一样,历史研究也应该分五步。第一步,提出问题或假说;第二步,为证明假说收集数据,既可以是历史数据、历史样本,也可以通过实验收集数据;第三步是做统计分析,检验假说是否能够得到历史数据的支持,不能仅停留在相关性分析的程度,而要识别因果关系是否成立;第四步就是对统计分析结果做解释;第五步是写研究报告。传统的史学研究往往只做到了第一和第二步,但在第三、第四步上有所欠缺,而量化历史方法就是要通过收集大样本的方法把第三、第四步做实。量化方法不是取代传统历史研究方法,而更多的是一种补充,使历史研究尽可能完整,克服个案历史研究带来的局限性。

1957年是一个重要转折点。哈佛大学两位经济学教授——迈耶(John R.Meyer)和康拉德(Harold Conrad)提出:经济学应该是一门用以解释历史过程的科学,尤其是历史学中的因果假说是可以证明或证伪的——通过收集历史事件的资料数据,做统计推理,就能证实或证伪哪怕是定性的历史假说 。也就是说,量化历史研究不应该停留在简单的“用数字说话”,而是基于历史数据和理论框架检验关于历史的假说。

以香港科技大学教授龚启圣等人最近的一份研究为例,他们的核心问题是如何测度儒家文化的影响并评估其实际贡献。学术领域鲜有对这些问题的量化答案,原因当然是文化很难量化。龚启圣等人尝试用各县文庙或孔庙与烈女数量等间接指标来测度儒家文化的影响强弱程度。研究人员通过研究1644——1910年山东107个县的农民暴动情况,观察儒家文化是否会显著降低各地遭遇灾荒冲击时农民暴动的冲动。通过检索《清实录》历史档案,他们发现在排除各种其他因素的影响之后(包括每个县的收入水平、起初发达程度、教育水平、社会流动性等),受儒家文化影响越深的县(即孔庙数量或烈女数量越多的县),即使遭遇灾荒冲击(通过粮价高低测度灾荒严重度),其在清代农民暴动的频率也越低。其背后的机理在于:受儒家文化影响越深的地区,家族宗族网络越强,在面对灾荒冲击时宗族内部互通互助的程度就越高,亦即隐性互相保险的程度就越强,这就减少了灾荒迫使农民走投无路的可能性和求助于暴力的必要性。在缺乏保险市场等金融产品的社会里,儒家文化可以通过上述方式促进社会稳定。

上个世纪50年代以及之后的几十年里,诺斯、麦迪森、西波拉等历史学家,以及中国史学界的吴承明、何炳棣、赵冈、郭松义、李伯仲等史学家,都是量化历史方面的开拓者。他们通过收集资料、量化各种指标,然后计算相关系数或者通过画图展示数据相关性,相对于早期的定性研究而言,这已经算是非常量化的研究。当然,我们知道相关性不等于因果关系,完全的量化研究必须做更多分析,需要对因果关系进行统计检测。

但也正因为以上原因,许多历史学者就说“量化史学只是把历史学家已经知道的结论用数据再说一遍”!这是一个普遍的误解。统计检验的价值之一是让我们在针对同一历史现象的多种假说中排除一些假说、支持一个或几个其他假说,而如果没有量化检验的方法就很难做到这一点。

因此,量化历史方法不是仅“用数据说话”,而是提供一个系统研究手段,让我们能同时把多个假说放在同一个统计回归分析里,看哪个解释变量、哪个假说最后能胜出。相比之下,如果只是基于定性讨论,这些不同假说可能听起来都有道理,无法否定哪一个,历史认知就难以进步。

VCG41533806702.png

量化历史研究 还原财富差距的真相

魏尚进:

量化历史研究对当前的经济政策有什么意义?能不能给我们一个具体的案例?

陈志武:

量化历史研究不只是帮助证明、证伪历史学者过去提出的假说,也将带来对历史的全新认识,也将引出新的研究话题、提供新的视角。我们不妨以量化历史研究来理解人类社会发展方向,从而分析当今财富差距大和收入差距大等经济问题。

人际财富差距、地位差距、权利差距等一直是学者和社会人士关注的话题。早在春秋战国时期,孔子就在《论语·季氏》中说:“闻有国有家者,不患寡而患不均,不患贫而患不安。盖均无贫,和无寡,安无倾。”意思是:治国者不必担心财富不多,但需关注财富分配不均; 不必担心人少,但需防患社会不安; 一旦财富分配均平,便无所谓贫穷;一旦人民和睦相处,便不要在乎人少; 只要社会安宁,亡国的风险就不存在。

在西方,类似论述也不少。莎士比亚的戏剧《李尔王》中一段台词讲:“从享用过度的人手里夺下一点来分给穷人,让每一个人都得到他所应得的一份吧。” “啊,我一向太没有想到这种事情!安享荣华富贵的人们啊,袒露着身体到外面来体味一下穷人所忍受的痛苦吧,分一些你们享用不了的福泽给他们,让上天知道你们不是全无心肝的人!”

VCG41N1056975286.png

财富与贫困的共存是自古以来东西方哲人都关注的话题。既然如此,从孔子时期至今,财富差距到底经历了多大变化,是拉近还是扩大了?2017年12月Nature杂志发表了一份由Kohler等18位教授完成的大规模考古研究“Greater post-Neolithic wealth disparities in Eurasia than in North America and Mesoamerica”,阐述了原始社会逐步进化到半农业、再到全农业以及其他类别社会的过程中,财富差距是如何变迁的。之所以有18位作者,是因为他们的数据来自世界各大洲的63个考古遗址,这种研究是单个或几个作者无法完成的,研究所涉及的数据库整合工作也直到最近十几年才能够实现。他们用每户人家房屋大小的基尼系数度量出一个社会的财富差距,因为相对于收入以及其他财富指标,房屋大小是考古学家可以看到、方便客观度量的指标,同时房屋大小也可以被理解为家庭方方面面财富的总体代理指数。

在他们取样的考古遗址样本中,亚洲、欧洲与非洲大陆的遗址是来自1.1万年到2千年之前的各类社会,而美洲大陆的取样则反映3千年到300年以前的社会。由于以前关于人类不平等的量化指标基本以收入为基础,所以以往对不平等程度的估算多以近代为主,比如皮凯蒂《21世纪资本论》研究的是18世纪工业革命以来的收入差距、财富差距变迁的情况。而这18位学者由于是基于房屋面积估算财富分配结构,他们所研究的时间跨度以1.1万年以前为起点。

图1给出了他们的估算。狩猎采集原始社会的房屋面积基尼系数为0.17(基于原始社会遗址估算的中位数),到半农业社会为0.27,到农耕社会则上升为0.35。这充分说明,人类生产与生存技术的每次飞跃都带来财富差距的显著扩大。尤其是这些作者也注意到,在今天美国类似的财富基尼指数为0.80、中国的为0.73等。因此,人类进步似乎毋庸置疑地带来了财富差距的扩大。

屏幕快照 2018-12-14 下午12.16.54.png

历史上,技术发展和社会组织复杂化会导致财富不平等的加剧,这个结论听起来很悲观。那么,当下的大数据和人工智能热潮是否会改变过去1万多年的规律,不再使财富分配状况恶化呢?对此,量化历史研究文献也有回答。

斯坦福大学历史学教授Walter Scheidel于2017年出版的专著甚为系统。他综合了大量近年针对古埃及、罗马帝国、中世纪欧洲以及近代世界的量化研究结果发现,在人类历史上,和平稳定时期都伴随着财富差距扩大,真正能造成财富差距持续下降的有四大驱动力,Scheidel称它们为“压平财富分配的四骑士”,亦即大规模战争、重大革命、国家崩溃、大型瘟疫。显而易见的是,战争、颠覆性革命和国家崩溃都含有暴力因素,压平财富差距的前三“骑士”都是重大暴力事件,因此可以说,暴力和瘟疫才是真正能持续调整财富分配的要素。例如,1650年至今,美国只有四次财富差距缩小,而每次财富差距缩小都是战争所致:1776年后的独立战争、1861-1865年的南北战争、1914-1918年的第一次世界大战、1939-1945年的第二次世界大战,其中从二战开始到冷战结束的近四十年里美国收入差距缩小所持续的时间最长,而与之相反的是,和平时期财富差距与收入差距都持续上升。

魏尚进:

我们不希望看到暴力革命、战争或瘟疫,但在技术创新只会继续推进、人类社会组织方式只会越来越复杂化的预期下,财富差距、收入差距看来可能只会继续加大。那么我们的出路在哪里呢?

陈志武:

经济学将经济不平等分为三类:财富分配、收入分配和消费分配结构的不平等。在原始社会时期,这三种分配结构基本一致、相差不大,因为那时每人的狩猎采集剩余不多、财富积累极少,土地不是资产、房屋没有或不多,因此收入就是财富、也是消费。可是,进入定居农耕后,不仅土地和房屋等财富载体出现了,而且其他价值储存手段也陆续被发明出来,收藏品、象征权力与地位的装饰品也随之出现,不同人的财富水平就区分开来,财富分配与收入分配结构不断分离;收入既有劳动收入,也有资产性收入,而且部分收入用于消费,其他用于财富积累;于是,人与人之间的财富分配、收入分配和消费分配就成为三种不同的存在。

到工业社会时期,权力、地位与身份符号更大,作为财富载体的奢侈品更加多样化,财富的种类与数量级进一步扩大,资产性收入的占比达到新高。到今天的互联网时代,不仅资产盈利方式发生变革,而且对未来收入提前做变现的资本市场工具也更丰富发达,虽然劳动收入与消费都因互联网增长了,但财富数量级的变化远超劳动收入与消费的增长。于是,出现了马化腾、马云的身价高达3千亿等现象,财富差距之大达到了前所未有的水平。

但是,毕竟亿万富豪也是一天三餐,私有汽车、房产、衣服再多再好,每时每刻也只能坐一辆车、住一栋房、穿一套衣服,所以财富分配甚至收入分配结构可以离谱,但不一定是问题的关键,更为关键的是消费分配。因为不管是经济学理论还是现实中,人的幸福或说效用直接取决于消费水平,而非货币收入和财富本身。俗话说“财富生不带来,死不带去”,财产超过一定水平后实际都是社会的财富,给社会提供就业和带来价值。对于社会来说,只要每个人都有基本消费能力、过上体面生活,财富差距本身不一定是核心问题,也不一定威胁社会稳定。一般而言,财富差距都远大于收入差距,而收入差距又大于消费差距。 

在古代农耕社会,财富分配、收入分配和消费分配结构还没出现足够的分离,所以古代哲人难以将三者做区分。2013年芝加哥大学两位教授Meyer和Sullivan发表一篇研究,发现从2000年到2011年底,美国收入最高的10%的群体与最低的10%群体的收入比累计增加了19%,前者的收入原来是后者的5.3倍,最近上升到6.4倍,也就是收入差距扩大了近五分之一;可是,收入最高10%群体与最低10%群体的消费比同期间却下降了,2000年时前者的消费为后者的4.2倍,最近下降到3.9倍。在经历了2008年的金融危机之后又如何呢?从2007年底到2011年的四年危机高峰期,收入最高10%与最低10%群体的收入比从5.8倍上升到6.3倍,收入差距恶化,而两者的消费比却从4.3倍降到3.9倍。这表明相对于金融危机之前,美国富人和穷人的消费都因危机有所下降,但富人的下降幅度更大。

之所以消费分配结构比收入分配、财富分配更扁平,除了人的“一天只有三顿饭”等生存需求上限外,还由于人类发展出了很多摊平消费的手段。也就是说,如果每个家庭受到的收入冲击都能通过保险、信贷、亲友和政府福利得到缓和,那么收入的上下波动就不会带来消费波动。结果是财富差距、收入差距的恶化并不总是转换为消费差距的恶化,消费可以保持平稳,因而守住消费差距是关键。

普林斯顿大学政治学教授Carles Boix以及耶鲁大学政治学教授Frances Rosenbluth在2014年发表的研究中,从身高差距判断人类不同阶段的消费差距。由于过去不同时期个人的消费数据难以找到,只好找消费的代理变量。人的身高主要取决于两大类因素,一是人种与遗传基因,二是成年之前的营养水平,而营养水平又取决于家庭经济条件亦即消费能力。

因此,身高差距可以被看成消费差距的代理指标,其变迁反映人类历史中消费不平等的历程。Boix和Rosenbluth(2014)统计了大量考古证据和历史记录。对18世纪之前的社会,主要根据出土的人骨推算身高;对18世纪以来的欧洲社会,则根据征兵时测量记录或者研究者实际量下的身高。然后,针对具体时期的具体社会,计算出当地人的身高方差系数(Coefficient of Variation,不同人身高的均方差除以平均身高)——系数越高,这个社会的消费差距越大。采用身高方差系数的最大好处是消除了平均身高的影响,也就是该指标不受不同社会平均身高各异的人种因素影响,因此可以用来作跨社会、跨时期的比较。

总体而言,虽然原始社会的房屋面积基尼系数为0.17,到半农业社会为0.27,农耕社会0.35,到当代美国的0.80、中国的0.73,人类进步毋庸置疑地带来财富差距的上升,可是由身高差距反映的穷人与富人间的消费差距并没有经历类似的恶化。由此,Boix 和Rosenbluth(2014)的长历史量化研究基本印证了Meyer和Sullivan(2013)基于2000年以来美国数据得到的结论,也就是财富差距与收入差距的恶化并不必然意味着消费差距的恶化,而消费差距恰恰是我们更应该关注的。

量化历史研究有助于了解金融政策导向

魏尚进:

您除了做量化历史研究之外,也是一位知名的金融学专家。那么,在您看来,量化历史研究对于我们的金融业发展和金融制度改革有些什么样的启示?

陈志武:

关于这个问题,我确实做过一些研究。比如,关于传统中国社会的高利贷,解释就很多。既有剥削论,也有道义经济论、市场供需关系论的解释等。那么,到底哪一种假说更接近真实呢?

我们利用清代1732——1895年间刑科题本中近5千命案记录,对民间借贷双方的关系进行了定量分析。在借贷纠纷引发的命案中,一旦借贷利率高于零,被打死方为贷方的概率为60%,而且利率越高,被打死的是贷方的可能性也随之增加,这说明一旦发生债务违约,贷方面对包括生命风险在内的违约成本是不对称地更高。这一发现与传统“高利贷剥削”论和放贷者“超经济强制”论的推断相反,但道义经济论可能最接近历史真实,因为在借贷命案大样本中,如果借贷是无息的,被打死的一方更可能是借方,但借贷利率越高,被打死的一方越可能是贷方。而之所以是这样,一个重要原因还是在于哪一方占据了“道义制高点”,在于“哪一方理亏”。

对于很多人来说,金融似乎太高大上,是一个搞不懂的迷。而对于其他人来说,金融只是一门钱的生意,所以是一个很现实、低俗的事,就像孔子在《论语》中说,“君子义以为上” ,“君子义以为质”,也就是君子立身行事应以道义为本,道义价值重于物质利益,不要动不动就谈钱。

其实,在金融市场出现之前,人类做了很多文化和社会组织创新,目的都是为了解决跨期承诺的挑战,提升人与人之间跨期交换的安全度。比如,“养子防老”就是一种金融安排,让儿子作为父母防患未然与养老保障的载体,儿子小时父母在其身上投资、供他读书,等儿子长大了必须回报父母。所以,父母与儿子之间在做跨期交换。虽然我们不用金融的术语来表述这种传统的人格化安排,但其功用实效与金融产品一样。

可是,这种养子防老安排是否靠得住呢?这就需要孝道等“三纲五常”道德伦理,去约束每个儿子的行为,保证他不会“跑路”逃债,这就是为什么儒家对“不孝”历来就是“零容忍”。

因此,传统习俗、迷信、宗教,包括爱情、婚姻、家庭、礼尚往来以及儒家、基督教等文化的背后,其实含有丰富的金融逻辑。也就是说,许多文化的内涵实际上是因为金融市场缺失而产生的,是为了解决本来应该由金融市场解决的一些问题而来的。当然,这也意味着,一旦金融市场发达了,许多传统文化内涵就会变得多余,就需要改变。

比如,我们在对18世纪和19世纪的妻妾买卖数据库做量化研究后发现,之所以在封建时期的中国和英国,或现在的非洲和印度一些地方,买卖妻妾的行为比较普遍,原因是没有规避风险的金融工具,包括发达的借贷机制等。我们采集的3000个交易数据显示,一旦碰到灾荒、饥荒,很多人活不下去,就会通过买卖妻妾维持生计,这时候妻妾的价格往往会下跌。那么,是否会出现买卖丈夫的可能?数据发现,买卖丈夫的交易成本要远远高于买卖妻妾的价格,且交易不确定性太高。

再比如,在印度父母喜欢把女儿嫁到很远的地方,如果一个家庭有4个女儿,可能会被嫁到4个地方。我们通过对印度农村数据的分析得出结论,印度父母之所以这么做,是为了分散风险,这是典型的跨地区降低自然灾害风险。一种现象在现代保险业出现之后就解决了。人们可以通过保险公司跨地区地规避气候风险。

魏尚进:

这些案例对于中国金融业改革开放有哪些具体的指导意见?

陈志武:

如上所述,金融领域的量化研究,本身就是基于对现有数据和历史数据的分析,肯定有助于我们理解金融政策的制定,进而推动金融政策的实施,同时也会帮助市场了解金融政策的导向。

但是,我认为中国金融业进一步深化改革开放的关键在于保持监管的独立性。最近这些年,尤其是2008年金融危机以后,“金融服务实体经济”突然就成为一种时髦的提法。但是理性地分析,中国金融业的问题是金融管制太多,金融业发展受到了太多抑制。相对于其他行业,比如制造业等行业具备的资源、政策扶持,金融业实际上处于一种供不应求的状态,并非是制造业的产能过剩的状态。因此,我们需要进一步鼓励金融业的改革和发展,而不是一味地提脱实向虚。

魏尚进:

那么,到底要不要金融监管?如何监管?哪些方面需要监管?哪些方面应该放开?

陈志武:

当然,金融监管是不可忽视的。但是,我们面临的问题是该管的没有管起来,不该管的又设置了太多障碍。比如,A股市场的信息披露和退市制度,股价操纵问题,这些都是监管该管的。监管部门需要组织更多专业的培训和学习,懂得如何按照专业的、职业的标准进行监管,而不是受到一些非专业、非职业因素的影响。