|
经典图书 2 机床结构逐步回归建模
机床结构逐步回归建模方法为:依据拉丁超立方抽样试验设计,逐次进行机床结构分析并在每次分析结束后重构回归模型,设定一定数量的检测样本点对重构的回归模型精度进行预测,当预测精度稳定地达到预定精度时则停止计算并输出回归模型。
2.1 拉丁超立方抽样
建立逐步回归模型所需样本点一般由试验设计获得,常用的试验设计方法有正交设计、均匀设计等,通过试验的因素和水平可确定试验设计表,上述两种试验设计方法的特点是在试验全部完成后才能保证样本的均匀分布。由于需要在逐步回归模型达到预定精度后即停止试验,本文采用拉丁超立方抽样(Latin hypercube sampling,简称LHS)。LHS是一种随机多维分层抽样方法,它的特性之一是在总数为n的抽样中任意抽取m个试验样本点,这m个试验样本点在设计空间内仍近似服从均匀分布,因此采用LHS使得不论在何时停止试验,都可以保证已经获得的样本点均匀分布,从而保证回归模型在整个设计空间的近似精度。LHS的另一个特性是对于任意数量的抽样,都可通过固定算法方便获得,不需要查询表格,因此适合计算机程序化计算。
2.2 逐步回归分析
回归分析所建立多项式近似模型称为响应面模型。二阶响应面模型为二次多项式,其表达式为
式中
——近似模型预测的响应
x——设计变量
αo、αi、αii、αij——待定系数,可以由最小二乘法确定
实际问题中,影响响应的因素有很多,为了得到一个可靠的回归模型,可以用逐步回归方法从众多影响响应的设计变量中挑选出对响应贡献大的变量,在它们和响应之间建立回归方程。逐步回归的基本思想是:每次向回归方程中引入对响应影响最显著的变量,引入一个变量后,即对方程中已有变量进行检验,逐个删除不显著的变量,直到没有可删除的变量后接着引入变量,此过程反复进行,直到回归方程中既无可引入的变量也无可删除的变量为止。
2.3 机床结构回归分析建模的实现
根据上述方法,在VB中结合SQL SERVER数据库软件开发了通用的机床结构回归分析建模程序。输入数据后,程序自动运行,期间无需人机交互。程序的具体运行流程如图3。
图3 回归分析建模流程图
(1)读取输入文件信息。为了保证程序的通用性,编程遵循程序与数据分离的原则,因此程序只负责逐步回归算法和流程控制,输入输出数据则存储在数据库中。输入文件含有设计变量名称及上下限、SolidWorks文件路径、Python文件路径和输出变量名称等。用户完成输入文件的定制后就可以启动程序,程序首先将输入文件中的信息读入以备调用。
(2)拉丁超立方抽样试验设计。根据设计变量上下限和样本总数进行拉丁超立方抽样,取前P个样本作为检测样本表(P默认为5),余下样本作为试验样本表。
(3)检测样本的CAD/CAE集成分析。根据检测样本表进行CAD/CAE分析并将结果存为检测文件。
(4)最小回归样本的CAD/CAE集成分析。设定最小回归样本数q(默认为5),即对试验样本表前q个样本连续进行CAD/CAE集成分析。
(5)逐次进行CAD/CAE集成分析并生成逐步回归模型。从第q+1次分析开始,每次分析完成后生成逐步回归模型,然后分别计算P个检测样本的回归模型预测值与检测样本的相对误差,取其中最大者作为回归方程的精度预测值。
(6)回归模型精度监测。当试验样本表对应的CAD/CAE集成分析全部完成或所有回归方程都连续r次达到预定精度时(r默认为3,并命名为稳定判定系数),转步骤(7),否则转步骤(5)。
(7)输出回归模型。将回归模型信息写入输出文件,输出文件中含有回归方程、R2值和精度预测值。
回归模型的预定精度根据实际情况确定。一般来说,回归模型预定精度较高时,需要将较多的自变量引入回归方程,所需的样本点数量也会较多,从而使分析的时间增加,反之亦然。程序默认的是二阶逐步回归模型,如果试验设计表全部完成时仍不能达到预定精度,可在程序中设定更高阶的逐步回归模型,同时试验样本数量也要相应增加。 |
|