特码走势图   联系我们
当前位置:特码走势图 > 联系我们 > 详情
联系我们列表

李迅雷:自夸大数据照样自夸逻辑

时间:2018-12-03 13:35来源:http://www.afva.world 作者:特码走势图 点击:

  相比之下,从中国历史上所取得的科学收获望,能表现抽象思想的东西比较少,式样逻辑在中国异国足够发展,春秋战国时代,形成逻辑也曾有过发展,但终极却演变成了“诡辩术”,如公孙龙(前320年-前250年)就挑出了“白马非马”之说,因此,中国历朝历代的思想照样见长于归纳法和辩证法。

  盲现在自夸大数据并不可取

  吾国的成语中也有相通对大数据“滞后”特性的描述,如盛极而衰,外示数据固然特意时兴,但能够意味着阑珊。而且,正是由于人们偏疼好“用数据言语”,因此,数据子虚表象也习以为常,从而导致总量数据与实际相通离,或者数据之间的勾稽相关展现矛盾。本人曾在2012年特意对存在偏差能够性的宏不悦目数据做了分析(见拙作《中国经济组织存在误判》)。

  社会经济的发展,望似千姿百态,但也有其共性。比如,二战之后的今天,市场经济终极成为全球几乎一切国家的共同体制,表明这个体制相符乎经济可不息添长的逻辑。这正如价值投资成为全球绝大片面资本市场的共同理念相通,唯有如此,才能获得较大的回报。

  自夸个案照样自夸大数据“大数据”是指以众元式样,经历许众来源收集而来的重大数据组,往往具有实时性。大约从2009年最先,“大数据”成为互联网新闻技术走业的通走词汇。如美国互联网数据中间指出,互联网上的数据每年将添长50%,每两年便将翻一番,而如现代界上90%以上的数据是近来几年才产生的。

  如2015年浙江城镇居民可支配收好占GDP之比为56.3%,上海51.3%,但天津只有31.9%,与前者竟然差20%旁边。倘若说人均可支配收好偏矮与经历大数据获得的人均网购额照样比较匹配的话,那么,人均GDP或GDP总额就极大偏离平常程度了。

  三年前,吾挑出要自夸逻辑,不要自夸稀奇(个案)。现在进入了大数据时代,照样挑倡:在大数据眼前,更要自夸逻辑,固然大数据比个案更有说服力,但大数据同样存在失真、变异、滞后甚至被操纵的能够性。

  17世纪之前,欧洲人都认为天鹅都是白的,由于他们所见到的各大洲(欧洲、亚洲、非洲)及各个地方的天鹅,无一破例地都是白色的——这就是用归纳法对大数据处理所得出的结论。不息到人们在澳洲发现第一只暗天鹅之后,天鹅都是白色的结论就被推翻。

  举个例子:南宋数学家杨辉在1261年所著的《详解九章算法》一书中,表现了二项式系数在三角形中的一栽几何排列,因此,“杨辉三角”内心上是把二项式系数图形化,把组相符数内在的一些代数直不悦目地从图形中表现出来。

  此外,大数据总量数据固然主要,但“内部组织”还必要分析:为何这两年股市中的“中幼创”跌幅较大?是由于其历史的估值程度较高,尽管其结余添速并不矮,但面临市场趋向理性之后的估值程度下移压力。

  也就是说,17世纪之后,西方抽象思想得到极大发展,竖立了数学、物理的科学系统,进而又推动了科技挺进,从而拉大了中西方在科技周围的差距。

  上一片面的核心不悦目点是大数据比个案更有说服力。但是,太甚迷信大数据也有题目。以股市为例,现在A股市场的上市公司数目超过3000家,一切上市公司的结余等财务数据累添首来,也组成了大数据。

  此外,数据又并非单纯指人们在互联网上发布的新闻,全世界的工业设备、汽车、电外上有着多数的数码传感器,随时测量和传递着相关位置、行动、振动、温度、湿度乃至空气中化学物质的转折,也产生了海量的数据新闻。

  例如,2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)近期在中国公开演讲时就认为,人造智能内心上就是统计学。但吾觉得他说的有肯定道理,但过于浅易强横了。其实,他想外达的是人造智能中行使的不少手段就是以前的统计手段。

  又有人认为大数据就是全样本统计,云云理解大数据未免有点浅陋了,全样本统计只是大数据的一栽式样而已。因此,大数据的涵义要比传统意义上的统计数据普及,但实在又具有统计数据的很众属性,因此大数据必要经历正当的手段,才能发挥其作用。

  为何会发生暗天鹅事件:照样要自夸逻辑

  而大数据的行使,大片面采用归纳法——人类思想中90%以上的机率都在行使归纳法,由于归纳法不必要行使太众的知识;不像演绎法,它先要掌握不少知识或定理,然后再据此往推理。

  例如前段时间英国皇家学会前主席阿挑亚爵士宣称表明了黎曼推想,是否真的表明了暂时岂论,但表明过程所必要的深邃专科知识,肯定不是清淡人所能触及的。

  于是,盲现在偏信大数据反而容易产生误判,只有行使正当逻辑分析手段,才能把大数据的结议和特征描述隐微。例如,由于A股中大市值公司的估值程度比较矮,如银走股的收好总额添首来要占到一切上市公司总收好的一半旁边,且大片面银走的PE只有5-7倍;一切上市公司PE添权平均之后,就很矮了,但从PE的中位数望,估值程度照样不矮(现在23倍旁边)。

  从2016年最先,上市公司的团体ROE都在上升,但为何股市的估值程度却在下移呢?为何商品房销量屡创新高,房企的结余也展现了高添长,但房地产股却大幅下跌?表明借助大数据来展望异日,必须搞隐微数据与展望对象之间的逻辑相关。其实,股价答该是领先指标(或称晴雨外),大数据则是滞后指标。房地产股的下跌,或是响答了股市投资者对国内楼市异日下跌的忧忧郁。

  由于天津的人均GDP程度在2016年及之前不息为全国省市自治区中排名第一,为何网购数据那么弱呢?吾那时就认为天津有夸大GDP的能够。由于查阅《统计年鉴》,发现天津的人均可支配收好与人均GDP程度不匹配。即人均可支配收好不光矮于北京和上海,而且还矮于浙江、江苏。

  因此,步入新闻社会,大数据概念的通走对于民俗于形象思想的国人是一个很好坦荡眼界机会,从古到今,自夸稀奇的人造数不少,而自夸常识或自夸概率的却不那么众。例如,为何澳门博彩业会如此蓬勃,周围是拉斯维添斯的四五倍呢?就是由于“自夸稀奇(一夜暴富)”的国人太众了。

  例如,往年以来公布的统计数据表现企业的结余添速大幅挑高,但为何企业的投资添速却大幅消极呢?大数据不克注释,但逻辑却能够作相符理注释:供给侧改革、环保标准挑高等导致供给端被压缩,进而导致上游商品价格上涨,大企业结余添速上升。

  原形上,西方在基础钻研周围的重大收获,大片面都是在17世纪之后取得的,远异国跨入大数据时代,且大片面异国采取实验室钻研的手段,但至今大片面收获都被普及行使到社会经济、科技生产的各个周围。

  例如,外星球原形有异国生命的题目,大片面科学家都认为肯定有生命,其逻辑就是概率分布,由于茫茫宇宙中的星球不乏其人,难道只有唯逐一个地球上有生命?但概率只是代外能够性,不悦目察的样本数目再大,也无法找到一个例证来表明外星球上确有生命。

  吾曾经举过一个例子:让1000只猴子掷硬币,每次展现正面的概率为50%,倘若让一切的猴子不息掷硬币10次,那么,不息10次均为正面的概率就是50%的10次方,约等于千分之一,即一千只猴子中答该有一只猴子会连掷硬币10次均为正面。难道吾们必要把这只猴子行为典型案例,号召一切猴子向它学习,将其“成功”掷币的经验进走推广吗?

  举例来说,两年半前,吾曾经从蚂蚁金服公布的居民网络消耗数据中,发现天津在网络消耗上的稀奇表象:行为直辖市的天津,人均网消程度上清晰矮于上海、北京、浙江、江苏、海南、福建、广东,甚至矮于全国平均程度(由于前七个省市的消耗权重较大)。

  由于式样逻辑、演绎法在中国五千年的漫长历史中异国得到足够发展,这才是导致吾国近代科技发展迟缓的根本因为,而不是所谓的制度因素。为什么形而上学、宗教、文化乃至医学等都有中西方之分,但数理化就异国“中国数理化”而是照搬西方的呢?由于这些学科都不克经历经验(或称大数据归纳)、传承或辩证法来创设的。

  但他并异国在其著作给出详细推导过程,于是,吾们只能认为“杨辉三角”是经历归纳总结发现的,未能把它进一步抽象为“二项式定理”,而牛顿就给出了二项式定理的清淡公式和推导过程。即:

  有人把数据比喻为蕴藏能量的煤矿。煤炭依照性质有焦煤、无烟煤、胖煤、贫煤平分类,而露天煤矿、深山煤矿的发掘成本又纷歧样。与此相通,大数据并不在“大”,而在于“有用”。价值含量、发掘成本比数目更为主要。对于很众走业而言,如何行使这些大周围数据是成为赢得竞争的关键。

  同样,2017-18年上市企业结余团体添速超过两位数,但意外味着2019年结余添速不消极,当投资者望到经济添速下走的永远趋势,就会对企业异日的结余前景感到忧忧郁。

  今年年头,天津重新调整了其滨海新区2016年GDP的数据,从以前公布的10002.31亿元,调整为6654亿元,缩水3348亿元,缩水幅度达三分之一。可见,倘若把从支付宝获得的网购大数据与统计部分公布的数据进走相互比对,就能够及早发现题目所在。这能够说是行使好大数据的意义所在。

  从此之后,人们就把意料不到事件的发生,称之为暗天鹅事件,这表明大数据的弱点所在——样本不克被穷尽,因此,大数据能够用来“证假”,却不克用来表明。

  纵不悦目全球各国经济走势,都会发生振动,尽管振动强烈时当局部分会采取反周期的政策,试图经历干预市场来避免发生危机,但原形上却很难避免。也有些国家尽管异国爆发危机,但其代价是往往经济凝滞和债务高企。因此,就像价值投资理念对资本市场的影响相通,逻辑产生作用能够会迟到,但不会缺席。

  在国内,你会发现相通“成功学”的书稀奇好销,但就“成功”自己而言,其比例清淡都很矮,否则就不叫成功了。也就是说,成功只能是个案,但大片面人只对成功的个案乐趣味,对成功率茫然愚昧。

  文革期间,有一句口号叫“工业学大庆,农业学大寨”,但为何学了那么久,经济添速照样那么矮,工业品和粮食那么欠缺呢?由于大庆和大寨都属于幼批“成功”的个案,匮乏可复制性。而且,计划经济模式所隐含的逻辑存在清晰弱点。

Powered by 特码走势图 @2018 RSS地图 html地图