大数据时代:统计学的“冰与火”

发布时间:2016-01-22浏览次数:59

(此文刊于2015年11月15日上海财经大学校报554期)


 “985”“211”,这两个代码般的数字为广大师生家长熟知,在大家心中,这代表着重点大学、中国最好的高等教育资源。然而,这一“重点”的概念如今全面升级,我国高等教育追求的,将是统筹推进世界一流大学和一流学科建设。

    

日前,国务院出台了《统筹推进世界一流大学和一流学科建设总体方案》,根据《总体方案》,到2020年,我国若干所大学和一批学科进入世界一流行列,若干学科进入世界一流学科前列;到2030年,更多的大学和学科进入世界一流行列,若干所大学进入世界一流大学前列,一批学科进入世界一流学科前列,高等教育整体实力显著提升;到本世纪中叶,一流大学和一流学科的数量和实力进入世界前列,基本建成高等教育强国。

     

《总体方案》确定了建设一流师资队伍、培养拔尖创新人才、提升科学研究水平、传承创新优秀文化、着力推进成果转化等五项建设任务。这也与统计与管理学院“十三五”规划目标基本上如出一辙。其实,早在今年5月,我校统计学科就已经联合华东师范大学统计学科申报上海高校高峰学科,确定了学科建设目标,即到2017年,本学科总体上处于亚太领先并接近世界一流水平,部分重点研究领域达到世界一流水平且具有重要的国际影响力。到2020年,建成国内标杆性统计学科,整体学科水平进入国内前两名,在国际上具有重要的影响力和权威的发言权。显然,抓住当下重要的战略机遇期,对于我校统计学学科跻身世界一流至关重要。


“统计是一门科学,同时也是一门艺术”


在很多人眼中,统计是一组枯燥无味的数据。其实不然,在英国《大不列颠百科全书》中这样描述:统计学是一门艺术,它是对令人困惑费解的问题作出数字设想的艺术。

     

但凡艺术都有生命力,统计学的过去和未来发展表明统计学具有强大的生命力。“统计学横跨社会、经济、科学、人文、法学、历史等全学科,除了数学和哲学,再没有比统计学范畴更大的学科了。所有科学皆为数学,所有判断皆为统计学。”统计与管理学院周勇院长如是说。

     

作为学科领军人物,周勇院长希望能把更多的年轻人带入统计学的“天地”。他曾在学院学科建设会议以及新生入学见面会,多次谈及统计学的涵义:统计学科既是一门具有严谨科学理论与方法体系的独立学科,同时也是很容易与其他学科交叉的一门应用学科,发展出许多相关学科分支。例如,与生物医学结合发展出“生物统计学”、“生物信息学”和“生物计量学”;与经济与金融学结合发展出“计量经济学”、“金融经济计量学”和“金融统计学”;与工程学、化学等学科结合发展出“可靠性科学”、“质量控制”和“试验设计”;与环境科学结合发展出“环境计量学”;与保险学相结合发展出“精算学”等。除这些分支外,统计学还渗透到其它学科中而产生新的研究领域,比如,与计算机科学相结合出现了“数据挖掘”,与管理科学结合发展出了各种各样的预报方法和科学评估手段,如“西格玛管理”、“神经网络”和“灰色理论”等。这些理论分支和领域为其它学科进行量化分析提供了不可缺少的理论基础和方法。

     

统计学科覆盖面广,是我国为数不多的可按经济学或理学一级学科招生的学科。同时,统计学是保障国家经济和社会安全、促进社会进步与经济可持续发展的重要基础学科和技术支撑,与社会经济发展的多个领域密切相关。统计学科和工业工程、计算机科学、社会科学的交叉,极大地推动了社会经济、科学与管理的发展。经济金融与社会科学的现代化越来越显现出与统计科学相互交叉、渗透而发展的特色。由此可见,统计学正成为整个科学门类中重要的基础及各类应用交叉学科的核心。


“统计学依然是数据分析的灵魂”

     

离开了数据,统计学就失去了存在的土壤。离开了统计学,数据的存在也显得冗余。随着大数据时代的到来,统计的重要地位越来越凸显。著名管理公司麦肯锡声称,“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”在这样的背景下,美国政府2012年宣布投资2亿美元启动“大数据研究和发展计划”,这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署。

    

 加强大数据科学研究和促进大数据应用开发将为未来我国在大数据领域掌握竞争主动权奠定基础,是关系我国国家和社会稳定、提高科技创新水平、推动国民经济可持续发展、提升社会管理服务能力的重大需求。可以预见未来国家之间的经济与政治竞争将是大数据引领的竞争。 

     

可喜的是,我国大数据发展的宏观政策环境在不断完善中。2012 年以来,科技部、发改委、工信部等部委在科技和产业化专项陆续支持了一批大数据相关项目,在推进技术研发方面取得了积极效果。2013年2月,科技部公布了国家重点基础研究发展计划(973计划)2014年度重要支持方向,其中,信息科学领域的重要支持方向之一即为大数据计算的基础研究。同时地方政府也在积极推动大数据发展,如上海市《推进大数据研究与发展三年行动计划》提出,将在三年内选取医疗卫生、食品安全、终身教育、智慧交通、公共安全、科技服务六个有基础的领域,建设大数据公共服务平台。北京中关村《关于加快培育大数据产业集群推动产业转型升级的意见》提出,要充分发挥大数据在工业化与信息化深度融合中的关键作用,推动中关村国家自主创新示范区产业转型升级。重庆、贵州、陕西、湖北等地也提出建设大数据产业基地的计划,力图将大数据培育成本地的支柱产业。2015年9月,国务院出台了《促进大数据发展行动纲要》,系统部署大数据发展工作。

     

大数据潮流使得我们获得了海量的数据,但掌握这些海量的数据本身并无意义。真正的意义体现在对于含有信息的数据进行专业化的处理。统计学作为数据分析的工具,在大数据时代也迎来了巨大机遇。机遇即为挑战。大数据数量大、噪音大、有价值的信息稀疏,同时存在许多虚假相关性,因此,大数据的涌现给统计方法,计算和理论也带来了极大的挑战。例如,许多传统统计方法应用到大数据上,巨大计算量和存储量往往使其难以承受;对结构复杂、来源多样的数据,如何建立有效的统计学模型也需要新的探索和尝试。在过去的十几年中,分析处理高维海量的大数据一直是现代统计学研究的前沿课题。统计学家发展了许多创新的统计模型、计算方法和理论,特别是在机器学习、数据挖掘和数据降维方面,并成功地应用到了许多交叉学科中如生物医学、图像学、环境科学等, 尤其是在基因学研究中取得了巨大的成功。面对大数据发展大趋势,2015年3月,上海财经大学与国家统计局联合共建了“大数据统计科学中心”,国家统计局副局长许宪春和明尼苏达州大学沈晓彤教授为中心的学术指导委员会主任,国家统计局总统计师鲜祖德和上海财经大学副校长蒋传海教授为学术指导委员会副主任。中组部“千人计划”专家黄坚教授以及国家自然科学基金杰出青年基金项目获得者、教育部长江学者周勇教授担任中心的联合主任。大数据统计科学中心通过引入海内外专家建设科研高地,争取在大数据研究中热潮中独树一帜、起领跑作用。此外,学院在今年9月增设“数据科学与商务统计”专业方向的应用统计专业硕士,希翼能更好地培养大数据分析方面的人才。

     

面对大数据应用的快速发展、国家经济和金融安全所提出的迫切需求,统计学家面临着在大数据分析方法瓶颈及挑战,需要发展大数据基础分析的理论方法和技术,同时应用这些理论方法研究大数据下数据降维技术、算法,深入研究互联网金融风险管理,高频海量数据市场行为和管理决策等前沿问题。目前,大数据对于全球都是的新兴事物,大家都处于“同一起跑线”。更进一步,从实践运用上而言,发达国家受制于已完善的经济金融体系而无法放开改革的手脚,给发展中国家一次很好的超越机会。

     

雄关漫道真如铁,而今迈步从头越。“在全球大数据蓬勃发展的大背景下,推动统计学学科进入世界一流行列,我们必须把握时代发展的趋势,打好大数据新战役。”作为统计人,周勇院长对学科未来充满信心,“大数据不能被直接拿来使用,统计学依然是数据分析的灵魂!”


供稿:胡宋萍