91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

SARIMA模型在大连市梅毒发病预测中的应用

  2025-05-28    46  上传者:管理员

摘要:目的 探讨季节性差分自回归滑动平均模型(SARIMA)在大连市梅毒发病预测中的应用,为该市梅毒防控提供参考依据。方法 应用SPSS 25.0软件对大连市2010—2019年梅毒月报告监测数建立SARIMA模型,用该模型对2020年1~12月梅毒发病数进行预测,并与实际报告数进行比较,以评价模型预测结果。结果 SARIMA(2,1,0)×(0,1,1)12为最优预测模型(P<0.001),统计量遵循贝叶斯信息准则(BIC)值最小原则,白噪声检验Liung-Box统计量差异均无统计学意义,残差为白噪声序列,以此模型预测的2020年各月发病数与实际发病数比较,平均绝对百分比例误差MAPE=8.93%,模型预测效果较好。结论 SARIMA(2,1,0)×(0,1,1)12模型能较好拟合大连市梅毒发病情况,可用于大连市梅毒发病数的预测。

  • 关键词:
  • 传染病
  • 季节性差分自回归滑动平均模型
  • 性传播疾病
  • 梅毒
  • 梅毒防控
  • 加入收藏

梅毒是由梅毒螺旋体感染引起的慢性、系统性的性传播疾病,为中国乙类法定传染病,发病顺位始终位居前五位,近年多地区呈发病上升趋势[1-3]。梅毒对人体危害严重,不仅可造成多器官、多组织损害,甚至导致组织破损、功能丧失、危及生命,已成为危害中国居民健康的重要公共卫生问题[4]。

大连市自2010年开始,梅毒多年位居全市法定传染病报告数首位,已成为该市重点关注及防控的传染病之一。为落实《中国预防与控制梅毒规划(2010—2020年)》[5-7](卫疾控发〔2010〕52号),了解该市梅毒发病流行特点、趋势预测,拟采用季节性差分自回归滑动平均模型(SeasonalAutoregressiveIntegratedMovingAverage,SARIMA)对大连市2020年梅毒发病数进行预测,探讨其可行效果,为该市梅毒防控、卫生资源配置提供科学的理论性支持。


1、材料与方法


1.1资料来源数据来源于中国疾病预防控制信息系统传染病监测子系统,收集2010—2019年现住址为大连市区域内的梅毒病例,病例分类为实验室诊断及临床诊断病例资料(剔除疑似病例、病原携带者),审核状态为已终审。

1.2方法对2010—2019年大连市梅毒发病数进行发病曲线绘制(图1),采用SARIMA进行预测模型构建。SARIMA目前广泛应用于季节性时间序列数据的短期发病情况预测,[5-7]模型的表达式为SARIMA(p,d,q)×(P,D,Q)s,其中p为非季节自回归阶数,d为非季节差分阶数,q为非季节移动平均阶数,P为季节自回归阶数,D为季节差分阶数,Q为季节移动平均阶数,S为季节长度。[8]

应用时间序列分析的前提条件是数据序列的平稳性,采用对数据差分预处理使原始序列转化为平稳序列。根据自相关图(Auto-CorrectionFunction,ACF)和偏自相关图(PpartialAuto-CorrectionFunction,PACF)拖尾与截尾的特征来进行模型的识别,结合差分和季节性差分的次数初步判定模型中p、d、q和P、D、Q的阶数,初步确定几个SARIMA模型进行择优选择(一般差分次数不大于2)。模型参数运用极大似然法来估计并进行显著性检验,用Ljung-BoxQ统计量判断残差是否为白噪声序列,残差序列为白噪声,说明该模型可用,用贝叶斯信息准则(BayesianInformationCriterion,BIC)对多个模型进行择优选取,BIC值越小说明模型越好。选用最优的SARIMA模型进行预测,采用预测月发病数与实际月发病数平均绝对百分误差(MeanBbsolutePercentageError,MAPE)来评估模型的预测效果,MAPE<20%,可认为模型预测理想。

1.3统计学方法采用WPSOffice表格文件进行数据处理及图表制作,SPSS25.0进行建模、统计学分析(P≤0.05表示差异有统计学意义)和预测。


2、结果


2.1时间序列调整对2010—2019年大连市梅毒月发病数进行序列图制作发现,发病数呈现夏季每年7~8月为年度发病数峰值、冬季1~2月呈现发病数低值的特征,表明大连市梅毒发病呈现一定的季节性波动,周期为12个月。原始序列图为非平稳序列,对数据采用一次差分和一次季节差分处理,经过处理后的序列数值在±150.00区间波动,可视为平稳序列。2010—2019年大连市梅毒发病数原序列与拆分序列图(图1),自相关图及偏自相关图(图2)。

图12010—2019年大连市梅毒发病数及拆分序列图

图22010—2019年大连市梅毒拆分序列自相关(ACF)及偏自相关(PACF)图

2.2模型参数的确立及验证经调整,平稳后的新序列的p、q及P、Q值惯性不大于2且不可同时为0,参数估计具有统计学意义的基础上,依照贝叶斯信息准则(BIC)最小的原则,最优模型为SARIMA(2,1,0)×(0,1,1)12,模型相关参数(表1)。为验证模型有效且可信,经Ljung-Box检验Q=18.29,P=0.248(P>0.05),可认为该模型残差为白噪声,模型可用。

表1SARIMA(2,1,0)×(0,1,1)12模型参数

2.3模型预测及模型评估采用最优模型SARIMA(2,1,0)×(0,1,1)12对大连市2020年梅毒的月发病数进行预测,实际发病数与预测发病数的MAPE值为14.63%,2020年大连市梅毒月发病数实际值与预测值比较(表3)。

表32020年大连市梅毒月发病数实际值与预测值比较


3、讨论


SARIMA是一种基于时间序列数据的自回归移动平均模型,通过自回归、差分和移动平均、季节性因素等统计计算,对时间序列数据进行分析和预测,具有较好的预测效果和广泛的应用。

分析大连市2010—2019年梅毒发病流行病学特征,虽整体呈下降趋势,但各年发病水平均高于国内平均值,故梅毒防控形势严峻,对其发病的预测尤为重要。梅毒呈现逐渐下降趋势,究其原因可能与近年来人群整体的防病意识存在大幅度攀升、健康教育及健康促进对人群的行为起到了较好的干预作用存在关联,特别是近年来大连市VCT访问解答数量、安全套的使用率都呈现逐年攀升的趋势有关。国家卫生部于2010年6月3日下发了关于《中国预防与控制梅毒规划》(2010—2019年),提出对梅毒预防和控制的具体措施和策略,在此基础之上大连市严格实施现场核查梅毒报告准确率等工作,对梅毒发病率的降低都有积极的促进作用。大连市梅毒发病呈现显著季节性规律,每年冬季1~2月发病数最低,3~4月份迅速上升,与国内多篇报道一致[9-11],分析其原因可能与春节期间患者就诊不及时和“春节效应”有关,春节假期间人口大范围跨区域移动对梅毒传播的三环节产生特异影响,梅毒潜伏期为9~90d(平均3周),患者通常在梅毒感染后2~4周开始发病,故假期过后发病数上升,5~7月份达到峰值,与国内多篇报道研究也呈现较为一致的流行病学特征[9-11],建议利用春节假期人口迁移时期,加强健康教育宣传,推广安全套及强化安全性行为,进一步降低梅毒等性病发病率。分析本地夏季发病高峰其原因,还可能与该市的人群密集地如椒金山公园、中山公园等为露天场所环境有关,夏季着装轻便对可能发生的室外性行为存在一定便利条件,建议加强该区域监督管理,减少梅毒等性病传播机会。该研究利用2010—2019年大连市梅毒月发病数,采用SPSS软件确立最优模型SARIMA(2,1,0)×(0,1,1)12,对2020年梅毒月发病数进行预测,实际值均在预测值95%可信区间内,MAPE均值为14.63%,依据时间序列模型预测评价理论,MAPE<20%可认为模型预测良好,可用于外推预测工作,表明该模型可较好地预测短期发病数。与其他研究相比,虽各地最优模型与预测精准度不完全相同[12-16],SARIMA模型都取得了较好的预测效果,说明该模型对时间序列数据预测的可行性很高。

SARIMA模型也存在一定的局限性,该模型预测只是与数据时间及季节变化相关,且只适用于短期预测,因此要判断模型对于传染病的预测精度,也要考虑除时间、季节性以外的相关因素,要针对综合可能影响疾病传播的因素进行较全面的研判,是此次研究存在的难度所在。

综上,经拟合分析大连市梅毒发病采取SARIMA(2,1,0)×(0,1,1)12可较为理想的适用于短期内梅毒的发病预测工作,但是随着时间推移,真实数据的不断积累,也要不断的对预测模型进行修订,提升预测拟合精准度,更好的为大连市梅毒防控工作提供理论基础。


参考文献:

[1]郭艳,张小斌,张秀劼,等.云南省2004—2021年梅毒流行特征和发病趋势[J].中国艾滋病性病,2023,29(9):1024-1028.

[2]张辉,李思瑶,寇玲玲,等.2005—2020年西安市梅毒流行病学特征分析[J].现代预防医学,2022,49(4):614-620.

[3]杨筠,胡宏章,胡凤姣.成都某综合医院住院患者梅毒血清流行病学、血清学检测及合并HIV感染情况分析[J].公共卫生与预防医学,2021,32(5):112-115.

[4]张珍,刘星言,李言言,等.基于贝叶斯结构时间序列模型评估我国梅毒流行趋势[J].疾病监测,2023,38(9):1087-1093.

[6]马宁.辽宁省性病防治体系建设现状分析[J].共卫生与预防医学,2019,30(5):41-44.

[7]陈辉,周翔,叶建君,等.2011—2020年湖北省梅毒防治终期评估分析[J].公共卫生与预防医学,2021,32(5):61-65.

[8]钱晓涵,郑敏.贵州省2010—2022年梅毒流行特征分析及ARIMA模型预测[J].应用预防医学,2023,29(6):383-387.

[9]方兰兰,潘贵霞.ARIMA模型在安徽省梅毒发病预测中的应用[J].公共卫生与预防医学,2020,31(6):19-23.

[10]魏珊,陆一涵,高眉扬,等.中国主要法定报告传染病的“春节效应”研究[J].复旦学报(医学版),2013,40(2):153-158.

[11]李芳芳,刘建华,张皓,等.2011—2020年宜昌市梅毒流行病学特征分析[J].公共卫生与预防医学,2023,34(2):105-108.

[12]陈芸,王丹,侯雅楠,等.基于SARIMA模型的我国梅毒发病趋势预测及应用[J].中国艾滋病性病,2020,26(10):1121-1122.

[13]张鹏,蔡晶,黄淑琼,等.2010—2021年湖北省淋病流行特征分析及发病趋势预测[J].公共卫生与预防医学,2022,33(4):63-66.


文章来源:孙巍,白金剑,安庆玉,等.SARIMA模型在大连市梅毒发病预测中的应用[J].公共卫生与预防医学,2025,36(03):60-63.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

现代预防医学

期刊名称:现代预防医学

期刊人气:10969

期刊详情

主管单位:国家卫生和计划生育委员会

主办单位:中华预防医学会,四川大学华西公共卫生学院

出版地方:四川

专业分类:医学

国际刊号:1003-8507

国内刊号:51-1365/R

邮发代号:62-183

创刊时间:1975年

发行周期:半月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定