主要观点总结
文章介绍了基于逐笔成交数据的信息挖掘在量化投资中的重要性,通过资金流模型和事件驱动模型构建选股因子,并提出改进模型结构以提升预测能力。文章还介绍了融合因子的表现以及基于不同因子的中证1000增强组合的回测结果。
关键观点总结
关键观点1: 高频量价数据在量化投资中的重要性
高频量价数据涵盖多种类型,如分钟k线、tick、逐笔成交等,对量化投资具有关键作用。逐笔成交数据作为最精细的交易明细记录,包含更丰富的微观结构信息。
关键观点2: 资金流模型
通过构造大小单、主动买卖等资金流特征,采用深度学习模型捕捉数据规律。改进模型在传统时间线基础上,拓展出tick线、成交量线等增量数据,利用transformer模型学习跨时间和跨k线的规律。
关键观点3: 事件驱动模型
识别逐笔成交数据中的重要成交事件(如大单、价格底部、价格顶部等),构造相应的事件特征。改进模型采用分层注意力机制设计,捕捉跨事件的交叉注意力。
关键观点4: 融合因子的表现
将改进后的资金流和事件驱动选股因子等权合成,得到逐笔成交融合因子。在回测期内,融合因子表现优于单一因子,构建的中证1000增强组合也取得了良好的超额收益。
关键观点5: 风险提示
基于逐笔成交数据的选股模型对市场微观结构的依赖较强,未来市场变化可能导致模型失效。Transformer架构的复杂性可能增加训练和推理时间,并带来过拟合风险。
免责声明
免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。
原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过
【版权申诉通道】联系我们处理。