在股市投资中,什么是数据驱动法?
数据驱动法利用统计的方法来对预测模型中的因素进行选择并确定其比重。这种方法将收益率作为因变量,同时将因素作为自变量。有很多的估计方法可以用来估计这些模型,比如神经网络法、分类树法和主成分法。通常我们需要改造统计量作为判定模型是否成功的标准。统计方法的算法是评估数据并将结果与标准进行比较。
很多数据驱动法没有关于由统计方法发现的潜在关系的结构性假设。所以,有些时候要理解甚至要解释模型中使用的因变量之间的关系是困难的。
Deistler和Hamann给出了用于模型构建的数据驱动法的一个例子。他们构建的模型被用于预测金融类股票的收益率。首先,他们将数据样本分成两部分——一部分是用于构建模型的样本内数据,另一部分是用于验证模型的样本外数据。他们使用三种不同形式的因素模型来预测股票收益率:拟静态主成分模型、带特异噪声的拟静态因素模型和降秩回归模型。
对于模型的选择,Deistler和Hamann采用的是迭代方法,在其中他们发现了基于Akaike的信息准则的因素和基于Bayesian的信息准则的因素的更佳组合。他们使用样本外数据对大量不同的模型进行了比较。他们发现降秩回归模型表现更好。在所有被评估的模型中,该模型提供了更高的样本外R值、命中率和Diebold Marian检验统计量。