当前位置:首页  研究  研究方向

研究方向


针对大数据时代下国际统计学术前沿和发展趋势,围绕国家和上海发展战略的重大需求,研究和解决一些急需的战略性问题和科学技术尖端领域的前瞻性问题。 


1)大数据基础理论研究

开展大数据的复杂性研究, 研究数据集复杂性的建模理论、处理过程复杂性的约简方法,建立大数据处理、分析的过程模型,突出大数据统计科学的理论创新、思想创新与方法创新。


研究重点:针对大数据的统计特点建立一个完整的变量选择与统计推断相结合的理论,包括置信区间的构造,假设检验,和变量选择错误率的估计等,并使之能直接应用于实际问题中;发展在超高维模型下的群组变量及带约束性群组变量选择法;发展高维复杂数据建模与分析,包括高维生存分析模型,多维张量数据分析,高维矩阵回归及双边变量选择方法;研究在广义可加模型的框架下高维半参数模型的识别问题。 


2)大数据挖掘与计算方法研究

与计算机学结合创新发展深度智能机器学习和大数据挖掘,整合多数据源并研究开发具有可扩展性、稳定性和高时效性的大数据计算方法。


研究重点:研究一些重要的凹惩罚方法,包括SCAD和MCP,在高维生存分析模型中的坐标递减算法;研究带约束的群组选择的计算方法;针对大数据最常见的一种形式—“流数据”,采用非平稳、异方差、子类中各自带有随时间变化趋势的假设,利用变加权似然、自适应决策函数等方法研究可扩展的、混合多趋势的、海量协变量自动归纳、适应的新算法,用于大数据统计分析和子趋势挖掘。改进已有数据挖掘和机器学习技术,开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;探索研究用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。


3)大数据在国民统计中的应用研究

配合国家统计需要,应用大数据技术进行政府统计,如何厘清可能的数据来源、范围及其分类,制定或调整相应的统计标准,以及如何保证依靠非传统数据源加工生产的统计数据规范、标准、真实、准确,开展大数据在价格、贸易、交通、收入、人口等专业领域的统计应用研究。


研究重点:怎样充分运用大数据打造政府统计数据来源第二轨,如何遵循统计学发展的内在逻辑与政府统计工作的迫切需求,高效准确地搜集、存储、计算各种大数据,并从已存在或动态变化的大数据中挖掘有价值的信息。重点研究如何把网上交易价格数据纳入价格统计,把电商数据和网络交易数据纳入有关专业统计;研究如何通过射频识别技术进行交通流量统计并进行货运量及经济活动景气状况分析;研究如何通过电信部门的大数据进行流动人口统计问题分析;研究如何通过网络搜索数据建立统计分析与计量模型,对经济形势进行分析预测;研究设计大数据社会指数系列等;


4)大数据互联网金融中的应用研究

互联网金融是全面基于信息和网络的一种新兴商业模式,目前规模小, 缺乏历史数据, 并未纳入全国征信系统, 相关立法也不完善, 整个行业的发展也面对较大的风险管理难题,有效控制风险是互联网金融行业一个急需解决的关键问题。有效利用社交媒体、互联网交易、网络点击流等多种数据源生成的大数据, 可以为解决互联网金融风险管理提供与传统金融业不同的方法手段。 


研究重点:根据大量社交网络媒体数据, 分析研究人及其相关群体的行为。 根据这些行为数据形成新的征信体系, 用以祢补国内在个人信用数据搜集不足的缺陷。分析和挖掘社交网络中的大量的非结构的数据,如图片,文本,视频等数据,发展全新的并行计算数据分析方法。从商业的角度,将社交网络的分析结果与互连网金融的业务有机结合在一起.将分析结论用于金融产品的推荐以及金融交易的风险的评估, 从而为企业做出更有效率的商业决策. 


5)大数据交叉领域研究

重点关注交叉学科的合作研究。与生物学和医学结合发展生物统计学,生物信息学,生物计量学;解决生物,医学和遗传学等学科中出现的大数据和临床试验设计中一些重要统计方法,计算与理论问题;同时探索基于高维数据和大数据信息,设计适合人性化与个性化医疗特点的临床试验方法,并构建其数据分析方法和相关统计理论。


研究重点:发展适合高维数据和大数据的特点与人性化、个性化医疗的要求的新型的临床试验设计,发展大数据和临床试验设计下的统计推断理论与计算方法。这方面的主要研究内容包括:基于生物标记等协变量与临床反应及其交互作用的各种最优自适应设计及统计推断理论;基于群组信息与不完全信息的自适应设计与统计推断理论;高维或超高维协变量选择和数据压缩下的自适应设计;以及大数据源作为协变量的自适应设计与数据分析方法等。


与经济学和金融学结合发展计量经济学,金融经济计量学,金融统计学,精算学;将数学理论和统计方法应用到经济与金融当中,创新地发展金融计量的理论与方法,解决中国经济快速发展当中出现的一些影响重大而又急需解决的问题;对大数据环境下资产定价和风险管理进行理论创新研究,建立一套基于风险定量研究的风险防范机制和系统定价模型。


重点研究:在非对称随机波动率模型下,研究波动率的杠杆效应,资产定价和套期保值策略;根据市场微观结构,研究如何估计具有噪声的异步高频金融数据的波动率和协方差,及其在高频金融波动率建模和投资组合选择中应用;研究在不同期限下系统性金融风险的测度、管理及一致性;研究金融计量模型的非参半参数模型估计问题,对市场数据进行实证研究;结合进化算法与统计方法,研究基于智能计算的价格预测与量化交易系统,建立一种综合的金融风险控制模型。