当前位置: 首页 >> 科研 >> 正文

云南省统计建模与数据分析重点实验室科研工作取得重要进展

2021-06-07  

近期,云南省统计建模与数据分析重点实验室唐年胜团队在各类研究领域取得了一系列进展,针对复杂抽样调查数据、医学统计及人工智能开展了大量的科学研究,2020年以来连续在统计学国际顶级期刊Journal of Royal Statistical Society: Series B” “Journal of the Ameirican Statistical Association”、计量经济学国际顶级期刊“Journal of Econometrics”、人工智能权威期刊“Journal of Machine Learning Research”等上发表学术论文,在复杂抽样调查数据的贝叶斯分析、半参数估计方程估计方法及理论、动态推荐系统、个性化医疗推荐等方向取得了重要进展。

在复杂抽样调查数据的贝叶斯分析的研究方面,唐年胜团队中赵普映副教授在统计学国际顶级期刊“Journal of Royal Statistical Society: Series B”Journal of Royal Statistical Society: Series B202082, Part 1, pp.155–174https://doi.org/10.1111/rssb.12342IF3.965)上发表题为“Bayesian Empirical Likelihood Inference With Complex Survey Data”文章。文章发展了复杂抽样调查设计下关于广义估计方程的半参数贝叶斯经验似然估计、半参数贝叶斯经验似然置信区间以及半参数贝叶斯经验似然模型选择准则,并提出了有效且计算方便的马尔可夫链蒙特卡罗(MCMC)算法。在一些正则条件下,文章证明了新提出的基于设计的半参数贝叶斯经验似然后验分布满足“Bernstein–von Mises定理、基于设计的半参数贝叶斯经验似然推断的有效性以及半参数贝叶斯经验似然模型选择准则的选择相合性。论文提出的基于设计的半参数贝叶斯方法能充分融合数据及先验分布的信息以达到改进统计推断的目的、能灵活整合估计过程中涉及到的约束条件、不需要假定任何参数分布或模型,从而是具有较强普适性的贝叶斯统计分析新方法。此外,文章提出的基于设计的统计推断方法为处理非独立同分布类型数据提供了新思想。

在复杂抽样调查数据的半参数估计方程估计方法及理论的研究方面,唐年胜团队中赵普映副教授在计量经济学国际顶级期刊“Journal of Econometrics”(Journal of Econometrics, 2020216, 516-536https://doi.org/10.1016/j.jeconom.2019.11.003IF1.577)上发表题为“Survey Weighted Estimating Equation Inference With Nuisance Functionals”文章。文章研究了复杂抽样调查设计下具有较强普适性的半参数估计方程估计方法及理论。半参数估计方程包含了一系列半参数统计模型,其在统计学和经济学领域均有广泛的应用场景。由于半参数估计方程可能非光滑且涉及无穷维的讨厌参数,导致这类模型的研究难度很大,特别具有理论挑战性。针对半参数估计方程统计推断问题,文章发展了基于设计的两步经验似然方法和两步广义矩估计方法,并提出了复杂抽样设计下针对两步调查加权半参数估计方程的Multiplier Bootstrap渐近方差估计方法。文章提出的基于设计的半参数估计方程估计方法及理论进一步为处理非独立同分布类型数据提供了新思想。特别地,新方法和新理论适用于解决基尼系数、洛伦兹曲线、收入份额以及其它经济不平等度量指标的统计推断问题,从而具有重要的经济学研究意义。

在动态推荐系统的研究方面,唐年胜团队中张艳青研究员在人工智能权威期刊“Journal of Machine Learning Research”Journal of Machine Learning Research202122(65):135https://jmlr.org/papers/v22/19-792.htmlIF3.484)上发表题为“Dynamic Tensor Recommender Systmes”文章,提出了时间张量函数下的动态推荐系统,解决了动态推荐系统的预测问题及区间估计问题。

推荐系统已被广泛应用于娱乐业、商业营销和生物医药行业。除了作为一种无监督的学习方法提供基于偏好的建议外,它还被证明在销售预测、产品推荐中很有用。由于一些消费者和企业需要为未来的预算、劳动力和供应链协调提供一个建议或预测,因此,能实现精确预测的动态推荐系统变得非常必要。课题组利用时间的张量值函数来整合时间和上下文信息,提出了一种新的推荐方法,即动态张量推荐系统。该方法通过多项式样条逼近建立时间张量分解的时变系数模型,实现了未来推荐建议的精准预测及获得有效的预测区间估计。从理论上,证明了所提出的张量分解方法的收敛速度和样条系数估计的渐近正态性。并且,将该方法应用于仿真数据、IRI营销数据和Last.fm数据的分析中。

在个性化医疗推荐的研究方面,唐年胜团队中张艳青研究员在统计学顶级期刊“Journal of the American Statistical Association”(Journal of the American Statistical Association2021:1-14DOI:10.1080/01621459.2020.1862671https://www.tandfonline.com/doi/full/10.1080/01621459.2020.1862671IF3.989)上发表题为“Multicategory Angle-Based Learning for Estimating Optimal Dynamic Treatment Regimes With Censored Data”文章,提出了针对动态多分类治疗方案的个性化医疗推荐方法,以推荐最优的治疗方案,从而最大限度延长慢性病的生存时间。

个性化医疗能为病人量身设计最佳治疗方案,以达到治疗效果最大化或副作用最小化。而针对癌症或HIV感染等慢性疾病的病人个体,一种最佳的动态治疗方案能使病人的生存时间达到最大化。课题组针对慢性疾病中多分类治疗方案的多阶段推荐问题,提出了一种生存数据下基于角度方法的最优动态治疗方案推荐方法。与现有的二分类治疗方案下最大化期望生存时间的方法不同,所提出的方法有效解决了删失数据下多阶段多分类治疗推荐的问题。在理论上,建立了Fisher相合性,并给出了正则条件下估计量的风险界。

供稿:数学与统计学院

编辑:李哲

责任编辑:曾文蕊


上一条:生态与环境学院谢平团队发表... 下一条:云南大学张志刚团队合作揭示...

【关闭】

最新文章

Copyright © 2006-2020 云南大学党委宣传部(含新闻中心) 版权所有 未经云南大学授权,请勿转载新闻文字、图片或建立网站镜像,违者依法必究  云南大学新闻网设计开发 Stat.By 站长统计