如何分析2023年全国大学生数学建模竞赛题目?

作者: 产品中心 发布时间: 2023-10-29 19:26:23

  虽然国赛还没开始但是根据以往的题型可以分析近几年的建模方法万变不离其宗,具体可以借鉴如下:

  一般A题偏物理方面,专业性更强,偏难,新手不建议选择A题,原因主要在于可能不理解题目,B题难度一般介于A题和C题之间,题型一般不固定,大部分还会考察优化模型,也会考察预测、分类模型等。C题难度一般相较于A、B简单,并且往往选择C题的人最多,也最不容易拿奖,所以参赛队伍如果想拿奖,通常要论文或者处理问题的模型比较优秀,如下展示近五年的ABC题以及模型等,通过总结分成两大处理、四大模型、六大算法,如下:

  数据清洗一般来说包括缺失值处理和异常值处理,如果数据中有缺失值,能够直接进行删除处理,或者平均值、中位数、众数等填充,其中众数一般适用于分类数据,除此之外,还能够正常的使用线性插值、牛顿插值、拉格朗日插值法进行插值可以借鉴下方资料。

  数据变换:有些数据在分析前还有必要进行变换,处理量纲问题等,比如因子分析或者主成分分析前需要将数据标准化,一些综合评价法也需要将数据来进行处理,比如指标为正向(越大越好),则能够直接进行正向化处理,有些指标为负向(越小越好),则能够直接进行逆向化处理等等,可以借鉴下方资料。

  标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。

  归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。

  中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不有必要进行特征之间的比较的情况。

  正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。

  逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。

  适度化:这种方法适用于指标值差异较大的情况,比如花了钱的人某产品的满意度等。

  区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。

  评价类模型一般来说包括权重计算和做综合评价对比,分析前搜集原始数据,然后对数据来进行预处理,比如标准化,正向化逆向化等等,一般评价类模型,需要将计算权重的模型和做综合评价的模型相结合分析,比如熵权topsis法等,计算权重包括主观方法和客观方法,各自有各自的优缺点,但在分析中往往二者相结合做多元化的分析对比更为准确,一般最终目的得到综合评价结果。具体如下:

  一般在分析评价类模型是一般会用组合赋权法,即通过主观赋权法和客观赋权法综合得到权重,然后结合综合评价方法得到结论。参考资料如下:

  预测模型一般来说包括回归预测模型、时间序列预测模型,灰色预测法、马尔科夫预测、机器学习(神经网络、决策树)等。一般预测模型的流程如下:

  时间序列模型是一种根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般都会采用曲线拟合和参数估计方法,如非线性最小二乘法,来对时间序列数据来进行拟合,从而建立相应的数学模型。适合中长期预测。

  灰色预测模型为小样本预测模型,适合短期预测,其利用微分方程来充分挖掘数据的本质,建模所需信息少,精度较高,运算简便,易于检验,也不用考虑分布规律或变化趋势等。

  马尔科夫预测是一种基于马尔科夫链的预测方法,大多数都用在预测随机过程未来的状态。这种方法假设一个系统的下一个状态只与前一个状态有关,而与之前的状态无关。

  分类模型通常能解决国赛数学建模的小问,一般常用的方法有聚类分析、判别分析以及机器学习(决策树、神经网络等)等。聚类分析前提不明确数据对象应该分为几类,常用的计算有欧式距离、pearson相关系数、夹角余弦法等,判别分析一般是分析前就明确观察对象应该分为几类,一般在分析中可以将二者结合进行分析以及还有机器学习可以进行分类。

  一般可以利用优化模型得到最优目标,比如在经济问题、生产问题、投入产出等等,人们总希望用最小的投入得到最大的产出,一般分析的流程如下:

  其中决策变量一般有0-1规划或者整数规划,通过目标函数和约束条件,确定优化模型的类型,一般有动态规划,线性规划,非线性规划以及多目标规划。

  一般常用的算法有现代优化算法、蒙特卡罗算法、规划算法、图与网络、排队论以及差分和微分等。

  现代优化算法一般包括遗传算法、模拟退火法、禁忌搜索法、蚁群算法等。一般遗传算法通常解决决策变量为离散变量时,跳出局部最优解的能力较强,模拟退火法跳出局部最优解能力最强,紧急搜索法是组合优化算法的一种,可以记录已经打到过的局部最优点。

  蒙特卡罗算法主要手段是随机抽样和统计实验,利用计算机实现统计模拟或抽样,得到问题的近似解,可以进行微分方程求解,可以将微分方程转化为概率模型,然后通过模拟随机过程得到方程近似解同事也能解决积分方程非线性方程组等等。

  规划算法一般用于解决优化模型,常用的动态规划、线性规划、非线性规划、多目标规划、整数规划等。

  图与网络算法可以解决最小路径问题,最优着色问题,最大流问题,以及最小生成树等问题,但是其计算复杂度较高,并且消耗大量资源和储存空间。

  排队论研究的内容包括性态问题、最优化问题以及排队系统的统计推断,排队论主要是解决服务系统的排队问题,通过分析排队系统的概率规律性和优化问题,提出最优的排队策略,同时也可以提供精确的数学模型,对排队系统的性能进行定量分析和预测,如平均等待时间、平均队列长度、平均服务时间等。但是使用该算法需要很多参数,需要保证参数的精确性。

  差分算法可以解决连续型问题,能够用迭代的方式求解方程,避免了微分方程中的导数,更便于计算。例如商品销售量的预测等,微分算法适用于基于相关原理的因果预测模型,大多是物理或几何方面的典型问题,可以通过数学符号表示规律,列出方程,求解的结果就是问题的答案,可以处理连续型问题,假设条件清晰,规律性强。但是涉及求导所以计算更复杂。

  可以在论文中多画图进行描述问题,更加直观,可以使用SPSSAU、python、以及R和MATLAB等等。

  可以使用LaTeX或者Markdown文档,LaTeX数学符号和命令很方便,还可以处理复杂的数学公式和图表。Markdown与LaTeX相比,Markdown语法简单,易于上手。它可以将Markdown文本轻松转换为HTML、PDF等格式的文档。还有其他的软件,比如Office、WPS等,但它们可以根据个人习惯和需求,选择适合自己的排版软件即可。

  一定要重视摘要,因为评委可能看你的论文的速度特别特别快,如果没有亮点很大可能不能拿奖,一定要写明自己分析什么问题,如何解决,用了哪些方法,得到了什么结论,并且整篇论文的格式也需要规规整整,可以多读几篇优秀论文然后在进行书写。

  全国数学建模大赛常常会使用到分类模型、预测模型、评价模型、优化模型等等。其中评价模型和优化模型几乎每年必用。那么ABC三题有什么特点?一般使用哪些模型?下面依次进行说明。

  一般A题偏物理方面,专业性更强,偏难,新手不建议选择A题,原因在于可能看不懂题目,如果不理解题目,看不懂题目,就会导致分析问题不彻底,甚至没思路,可能半路换题(强烈不建议半路换题!!),A题考察优化算法比较多,近五年国赛A题考察的题型参考如下:

  B题难度一般介于A题和C题之间,题型一般不固定,大部分还会考察优化模型,也会考察预测、分类模型等。近五年国赛B题考察的题型参考如下:

  C题难度一般相较于A、B简单,并且往往选择C题的人最多,也最不容易拿奖,所以参赛队伍如果想拿奖,一般需要论文或者解决问题的模型比较优秀,C题的开放较高,很多情况没有固定答案,一般从实际问题角度出发,题目易于理解,如果是新手,建议可以优先考虑C题,C题所考察的模型也比较宽泛,近五年国赛C题考察的题型参考如下:

  所以通过近五年的ABC题发现国赛数学建模常用的模型有分类模型、预测模型、评价模型以及优化模型。接下来进行说明。

  分类模型主要包括聚类分析和判别分析,其中聚类分析又包括K-means聚类,系统聚类、模糊聚类等,判别分析又包括Fisher判别、Bayes判别、距离判别以及逐步判别等。聚类分析将数据分成若干组或者类的过程,并且组内数据对象具有较高的相似度,组间的数据对象是相似的(前提是不明确数据对象应该分为几类),判别分析是也是分类模型的一种方法,与聚类分析不同的是它在分析前就明确观察对象应该分为几类,用此方法的目的是从现有已知类别的观察对象中建立判别函数,然后去判别同质未知类别的观察对象。

  典型的聚类分析一般包括三个阶段,特征选择、特征提取和数据对象见相似度的计算,可以对样品进行聚类也可以对变量进行聚类。具体划分如下:

  K-means聚类算法效果分析一般可以看SSE指标、轮廓系数法、CH系数,需要分析人员在分析前进行多次对比从而达到模型更优的目的。

  其中C_{i}表示簇,i=1,2,3,….k一共k个簇。m_{i}表示质心,p表示每个散点。

  从图片上来看SSE(左图)SSE(右图),同时也可以看出左侧更稀疏右侧更密集,SSE想要达到最优解,还需要初始聚类中心的选择,否则只能达到一个局部最优解,初始聚类中心的选择可以参考“肘部法”,一般认为“拐点”即下降率突然变缓慢时,认为此点为最佳k值。比如:

  s=\frac{b-a}{max(a,b)},其中a为与同类别中其它样本的平均距离,b是与它距离其他类别的平均不相似程度的最小值,取值范围为【-1,1】,同类别中距离越近,不同类别距离越远越好,即轮廓系数越大越好。

  利用协方差进行判断,类别内的协方差越小越好,类别之间的协方差越大越好,计算如下:

  模糊聚类,每个样本以一定的隶属度进行分类,首先进行构建模糊相似矩阵,不需要训练样本,一般计算原理使用夹角余弦法以及相关系数法。

  根据方差分析原理建立的判别方法,基本思路为投影,依据组间均方差与组内均方差之比最大的原则,进行选择最优的线性函数。

  概率型判别函数,需要知晓各类别的先验概率或者分布密度,以每个样本属于某个类别的最大概率进行归类。

  类似于回归分析,通过检验找出显著变量,剔除不显著变量,一般有向前法、向后法、逐步法。

  一般进行fisher判别比较多,但是变量较多也可以先进行逐步判别进行筛选下。

  预测模型常见的方法有:拟合插值预测(线性回归)、神经网络预测、时间序列预测(指数平滑法、移动平均法等)、logisitic回归模型、灰色预测、马尔科夫链预测、微分方程预测等等。

  其中拟合插值算法(线性回归)最为简单,线性回归模型可以进行拟合也可以进行插值,拟合是预测的基础,模型拟合好,预测一般更准确,线性回归一般用于短期预测,并且如果数据有缺失,也是用此方法进行插值,使用该方法进行预测前,需要数据满足线性回归的要求(线性、独立性等等)。

  神经网络预测比较考察编程能力,属于现代优化算法,如果使用比较顺畅,当然可以使用此方法进行预测。但是此模型需要大量数据进行训练模型,并且对数据质量要求较高,并且结果不易于解释,如果没有接触过此算法,建议换用其它方法就进行预测,常用于股票预测、水位预测、能源预测等等。

  时间序列一般预测定量数据的分析方法,使用该方法进行预测前需要考虑数据是否需要季节性调整或者趋势去除等等,常用于气象预报、经济发展情况预测、环境污染预测等等。

  logistic回归模型用于分类和预测性分析,适用于二分类和多分类问题,他根据给定的自变量数据集来估计事件发生的概率,比如“购买”和“未购买”,但是logistic回归模型容易出现过拟合或者欠拟合的情况,并且在特定条件下,对异常值较敏感,分析前需要注意。一般用于预测客户是否违约,或分类客户的风险等级。

  灰色预测一般适用于小样本数据进行预测,马尔科夫链常用于地理或者市场占有率的预测,销售期望利用的预测等等,微分方程常用的模型有传染病模型。理想火箭模型、人口模型等。也可以用于疾病的传播预测等。以及还有其它SVM、小波分析等预测方法。

  评价模型一般分为权重模型以及优劣评价模型,常见的有模糊综合评价、层次分析法、熵权法、主成分分析法、数据包络分析、TOPSIS等等。

  模糊综合评价一般在数据建模中应用较多,其适用于无具体的评价标准,通过统计问卷等形式进行评价的问题,其可以解决模糊的难以量化的问题,如果评价指标之间存在强烈的关联性和相互作用时,该方法则不适用,比如对于一个品牌的评价,品牌忠诚度与品牌形象等等,往往存在一定的关联性和相互作用,所以此种情况不建议使用。常用于风险评估以及层次分析问题。

  层次分析法一般用于计算权重需要的信息较少,适用于具有分层交错评价指标的目标体系,但是使用该模型需要满足数据一致性判断,如果不满足,则不适用,比如专家打分不一致等等。

  熵权法与层析分析方法不同,熵权法适用于客观数据进行计算权重,相较于层次分析法具有一定的精确性,并且确定的权重也可以进行修正,适应性较高,目前只能进行计算权重。

  主成分分析的目的可以进行数据的压缩,便于数据的解释,从而达到分析的目的,一般用于寻找判断实物或现象的综合指标,并对综合指标进行合理的解释。

  数据包络分析对具有可比性的同类型单位相对有效性评价的一种数量分析的方法,一般适用于评价生产效率或者综合竞争力水平等。

  可用于优劣评价,大体系的综合评价,对于数据分布等没有严格限制,原理上是计算每个方案各自与最优解和最劣解的距离,根据最优解和最劣解计算得分然后进行排序,除此之外,还有秩和比法,BP神经网络综合评价法,因子分析等等。

  排队论模型、图论模型、规划模型(目标规划、线性规划、非线性规划、动态规划)、现代优化算法(遗传算法、模拟退火算法、禁忌搜索法)、机器学习(神经网络模型、决策树、随机森林、SVM等)等等。

  (1)图表一般插入图表会使论文更加美观易懂,但是不能盲目的、大量的进行插图,可以使用matlab、SPSSAU、R等进行绘制。

  (2)排版建议尽量使用图文穿插,并且整体格式要正确,善于使用三线表,分段和标题要清晰。

  (4)摘要一定要重视摘要,可以在写论文前,多看几篇优秀论文,建议简单明了+精准。

  选题是很重要的一个环节,适当的选题不仅可以避免之后临阵换题的慌乱,还可以提高获奖概率。

  一言以蔽之,选哪个题的队伍少,就选哪个题。观察数据发现,选择某题的队伍数量恰与选择该题队伍的获奖比例成反比,具体数据可以阅读以下文章。

  另外需要注意的是,每赛题/每学校最多推荐4个国奖,且每赛题/每学校最多推荐2个国一。如果你们学校参赛队伍很多,还都是老牌强队,尽量不要和大佬们选一样的题,错位竞争优势更大。

  想获得更多信息,如竞赛论文评阅过程、国奖评阅标准、竞赛宗旨、论文常见顽疾等可以阅读以下文章。

  这是一个定日镜场但目标多变量非线性优化问题,以最大程度地提高单位镜面面积的年平均输出热功率,同时满足额定年平均输出热功率要求。

  问题1:在给定定日镜的尺寸和安装高度,以及定日镜位置的情况下,计算该定日镜场的年平均光学效率、年平均输出热功率以及单位镜面面积年平均输出热功率。

  问题2:假设所有定日镜的尺寸和安装高度相同,设计定日镜场的参数,包括吸收塔的位置坐标、定日镜尺寸、安装高度、定日镜数目和定日镜位置,以满足额定年平均输出热功率的条件下,最大化单位镜面面积年平均输出热功率。

  问题3:允许定日镜的尺寸和安装高度不同,重新设计定日镜场的参数,以满足额定年平均输出热功率的条件下,最大化单位镜面面积年平均输出热功率。

  解决这些问题需要建立一个数学模型,考虑太阳入射光线、定日镜的位置和参数、光学效率、输出热功率等因素之间的关系。模型需要包括光学效率的计算和输出热功率的计算,以及针对问题2和问题3的优化算法,以找到最佳的定日镜参数和位置。

  问题1:针对多波束测深系统,需要建立一个数学模型来计算覆盖宽度和相邻条带之间的重叠率。模型需要考虑换能器开角、坡度、海域中心点深度等因素。

  问题2:在一个矩形待测海域内,需要建立另一个数学模型,考虑测线方向与海底坡面的夹角,以计算多波束测深的覆盖宽度。模型的目标是根据开角、坡度、海域中心点深度等参数来计算在不同位置的覆盖宽度。

  问题3:针对一个南北长2海里、东西宽4海里的矩形海域,需要设计一组测线,满足多波束测深的要求,包括覆盖整个海域、重叠率在10%~20%范围内。这是一个优化问题,需要寻找最佳的测线设计,以最短的测线长度来满足要求。

  问题4:基于附件提供的海水深度数据,需要设计测线布局,使得扫描的条带能尽可能覆盖整个海域,同时保持相邻条带的重叠率低于20%。在设计好测线后,需要计算测线的总长度、漏测海区的百分比以及重叠率超过20%部分的总长度。

  这个关注蔬菜类商品的自动定价和补货决策,涉及市场需求分析、销售策略、商品定价、补货规划等多个方面。

  问题1:首先要分析不同蔬菜品类和单品之间的销售量分布规律和相互关系。这可以通过统计分析销售数据,了解各品类和单品之间的销售趋势,发现是否存在某些品类或单品之间的关联关系。这有助于商超更好地理解蔬菜市场的动态。

  问题2:针对商超以品类为单位的补货计划,需要分析各蔬菜品类的销售总量和成本加成定价之间的关系。通过建立数学模型,可以确定每个品类的未来一周的日补货总量和定价策略,以最大化商超的收益。这需要考虑销售量、成本、定价等因素,同时考虑蔬菜的保鲜期和品相变化。

  问题3:商超还希望制定单品的补货计划,需要满足可售单品总数的限制和最小陈列量的要求。这是一个组合优化问题,需要在控制可售单品总数的前提下,确定每个单品的补货量和定价策略,以最大化商超的收益。这需要考虑单品的销售情况、成本、保质期等因素。

  问题4:商超还需要收集哪些相关数据以更好地制定补货和定价决策?建议采集以下数据:

  这个问题旨在最大化年化出栏羊只数量,同时考虑了多种不确定性因素,如受孕率、分娩羔羊数、羔羊的死亡率以及哺乳期和育肥期的调控。

  问题1:首先需要确定湖羊养殖场中种公羊与基础母羊的合理数量。在不考虑不确定因素的情况下,可以使用数学模型计算基础母羊和种公羊的最佳比例,以确保养殖场稳定运营。随后,通过对各个阶段的羊只进行统计,估算年化出栏羊只的范围,并找出现有标准羊栏数量的缺口。

  问题2:在问题1的基础上,需要制定具体的生产计划,以最大化年化出栏羊只数量。这个问题需要考虑不同阶段的羊只数量和羊栏的需求,以及如何分配种公羊与基础母羊的配种时机和数量,来实现最大的收益。

  问题3:在考虑不确定性因素的情况下,制定生产计划将变得更加复杂。不确定性因素包括受孕率、分娩羔羊数、羔羊死亡率、哺乳期和育肥期的调控等。这个问题需要建立一个灵活的生产计划,以应对各种可能情况,最小化整体方案的期望损失,损失由羊栏使用情况决定,包括空置和租用费。

  问题1首先需要建立数学模型,分析黄河水的含沙量与时间、水位、水流量之间的关系。通过模型估算近6年该水文站的年总水流量和年总排沙量。

  问题2在问题1的基础上,需要深入分析水沙通量的特性,包括突变性、季节性和周期性等。这可以通过统计和时间序列分析方法来实现。

  问题3基于问题2的分析结果,需要建立预测模型,用于预测未来两年该水文站水沙通量的变化趋势。然后,制定最优的采样监测方案,以便在最大程度上减少监测成本资源,同时及时获取水沙通量的动态信息。

  问题4根据水沙通量和河底高程的变化情况,需要分析小浪底水库进行“调水调沙”的实际效果。如果不进行此操作,需要预测10年后该水文站的河底高程,以了解未来的河床演变趋势。

  先把几年前制作的论文模板贴上来,去年我总结了一个新的论文模板,过几天我整理一下贴在这里

  这里可领自1992年至今的全部「高教社杯」全国大学生数学建模竞赛赛题和优秀论文礼包(包括2022年的优秀论文也已经更新进去啦)。

  简单介绍一下我自己:博主专注建模四年,参与过大大小小数十来次数学建模,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。参与过十余次数学建模大赛,三次美赛获得过二次M奖一次H奖,国赛二等奖。希望各位以后遇到建模比赛可以艾特一下我,我可以提供免费的思路和部分源码,以后的数模比赛只要我还有时间肯定会第一时间写出免费开源思路。博主紧跟各类数模比赛,每场数模竞赛博主都会将最新的思路和代码写进此专栏以及详细思路和完全代码且完全免费。希望有需求的小伙伴不要错过笔者精心打造的文章。

  前两问都已经解决且都有对应的详解思路和源代码,直接运行就可以出来结果了:

  问题 3 根据该水文站水沙通量的变化规律,预测分析该水文站未来两年水沙通量的变化 趋势,并为该水文站制订未来两年最优的采样监测方案(采样监测次数和具体时间等),使其 既能及时掌握水沙通量的动态变化情况,又能最大程度地减少监测成本资源。

  根据之前我们的第一问和第二问,可以确定水文站水沙通量数据就是十分典型的季节时间序列数据,描述这类序列的模型称作季节时间序列模型(seasonal ARIMA model),用SARIMA表示。季节时间序列模型也称作乘积季节模型(Multiplicative seasonal model)。因为模型的最终形式是用因子相乘的形式表示。例如周日期部分车站客运量:

  给大家普及一下平稳时间序列和白噪声序列。平稳是指宽平稳,其特性是序列的统计特性不随时间的平移而变化,即均值和协方差不随时间的平移而变化。 时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。平稳时间序列粗略地讲,一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。

  平稳时间序列是时间序列分析中最重要的特殊类型。到目前为止,时间序列分析基本上是以平稳时间序列为基础的,对于非平稳时间序列的统计分析,其方法和理论都很有局限性。若一个平稳时间序列的序列值之间没有相关性,那么就意味着这种数据前后没有规律,也就无法挖掘出有效的信息,这种序列称为纯随机序列。在纯随机序列中,有一种序列称为白噪声序列,这种序列随机且各期的方差一致。平稳时间序列分析在于充分挖掘时间序列之间的关系,当时间序列中的关系被提取出来后,剩下的序列就应该是个白噪声序列。

  水文站水沙通量数据呈现一定的周期性波动,描述这类序列的模型称作季节时间序列模型(seasonal ARIMA model),用SARIMA表示。季节时间序列模型也称作乘积季节模型(Multiplicative seasonal model)。因为模型的最终形式是用因子相乘的形式表示。

  SARIMA(Seasonal Autoregressive Integrated Moving Average)是一种基于 ARIMA 模型的季节时间序列预测模型。ARIMA 模型是一种广泛应用于时间序列预测的经典模型,它考虑了时间序列的趋势性和周期性。SARIMA 模型在 ARIMA 模型的基础上增加了季节性,因此可以更好地应对具有季节性变化的时间序列数据。

  季节周期 (Seasonal period):时间序列数据呈现季节性变化的周期,例如一年、一周、一天等。

  差分次数 (Order of differencing):对时间序列数据进行差分的次数,以消除数据的非平稳性。

  自回归项 (Autoregressive terms):用于建立时间序列与其过去值的关系,表示时间序列数据的趋势性。

  移动平均项 (Moving average terms):用于建立时间序列的随机波动性与过去的误差的关系,表示时间序列数据的随机性。

  SARIMA 模型可以用来预测具有季节性变化的时间序列数据,例如销售额、气温、股票价格等。它需要基于历史数据来拟合模型,然后使用模型来预测未来一段时间内的数据。在使用 SARIMA 模型时,需要选择合适的参数和模型结构,并进行模型诊断和调优,以获得更准确的预测结果。

  这里就不展示具体的建模过程了,想要具体的建模过程可以去看笔者的专栏文章:

  根据建模步骤我们首先对时间序列数据进行平稳性校验和季节性差分等操作。如果数据不平稳,需要进行差分操作使其变为平稳时间序列。同时,如果数据具有季节性,需要对其进行季节性差分,消除季节性影响。

  我们可以看到数据有上升的趋势,可以定性地判断该序列非平稳。可以使用seasonal_decompose()做多元化的分析,将时间序列分解成长期趋势项(Trend)、季节性周期项(Seansonal)和残差项(Resid)这三部分。

  ARIMA模型要求时间序列是平稳的。所谓平稳性,其基本思想是:决定过程特性的统计规律不随着时间的变化而变化。

  通过观察ACF和PACF图,可以看到哪些滞后值是显著的,从而得到p和q的估计。如果想要深度了解获取源码我的专栏文章有:

  :它是检验的关键指标之一。如果它小于某个临界值,我们可以拒绝原假设。更负数的统计量表明序列更有可能是平稳的

  :它表示在原假设成立的情况下,观察到测试统计量或更极端结果的概率。通常情况下,如果p-value低于显著性水平(如0.05),我们就会拒绝原假设。

  :在给定的显著性水平下,这是测试统计量的阈值。如果测试统计量小于这个阈值,我们可以拒绝原假设。

  可以得出结论:在给定的显著性水平下,时间序列是稳定的,拒绝了存在单位根(非平稳)的原假设。

  基于VMD(变分模态分解)-SSA(麻雀搜索算法优化)-LSTM的风光、负荷等时间序列预测模型

  基于减法平均优化器优化算法(SABO)-极限学习机(ELM)的时间序列预测模型

  基于量子粒子群算法(QPSO)优化LSTM的风光、负荷等时间序列预测算法

  基于北方苍鹰算法(NGO)优化长短期记忆网络(LSTM)的多变量风电功率时间序列预测

  基于EMD(经验模态分解)-KPCA(核主成分分析)-LSTM的风光、负荷等时间序列预测模型

  基于融合正余弦和柯西变异的麻雀优化算法(SCSSA)-CNN-BiLSTM(双向长短期记忆网络)的时间序列预测模型

  基于改进莱维飞行和混沌映射粒子群优化算法(LPSO)-BP神经网络的时间序列预测模型

  基于改进莱维飞行和混沌映射粒子群优化算法(LPSO)-BP神经网络的分类预测模型

  基于算术优化算法(AOA)优化参数的随机森林(RF)六分类机器学习预测算法/matlab代码

  电力系统预测和优化方向研究生必备matlab-yalmip代码!!祝您快速入门,早日发paper!!!!包含需求响应/两阶段鲁棒优化/微电网经济调度/多目标优化/时间序列预测/经验模态分解/场景生成与削减/copula相关性分析/综合能源系统/低碳经济调度/碳交易/综合需求响应/电动汽车/多时间尺度/智能算法/配电网最优潮流/无功优化/共享储能/分布式算法/主从博弈/合作博弈等文献复现matlab代码【一直更新】