“看这个,”林语晨的白大褂随动作轻晃,口袋里的mit钢笔露出半截,笔帽上的激光刻字在灯光下闪烁,“‘北向资金净流入’与‘两融余额增长率’的pearson相关系数达078,”她调出2024年6月的波动率曲面,两个因子的相关性热力图呈现深红色,“超过我们设定的07风险阈值,可能引发权重震荡。”
小李将17个有效因子拖入权重池,因子图标如彩色磁贴般排列,代表“北向资金”的蓝色图标格外醒目:“注册制后外资持股占比提升至42,在消费、科技板块的定价权占比超15,”他的声音带着技术人员的执拗,“共线性可以通过l2正则化处理,牺牲一点方差换取趋势捕捉能力。”
陈默调出402章的连板因子失效报告,红色的回撤曲线刺痛眼球:“多重共线性不是方差问题,是逻辑陷阱,”他的指尖在相关性矩阵上划出红色警示线,“连板因子当年的夏普比率更高,但忽略了生态变化,现在这两个因子同样面临市场结构风险。”他转向小李,目光如手术刀般锋利,“你是要模型记住历史,还是理解市场?”
午后的阳光斜照在会议桌上,林语晨的键盘敲击声如鼓点,逐步回归法的迭代过程在屏幕上实时更新。当“两融余额增长率”因子被剔除时,夏普比率从32降至27,小李的脸色瞬间发白,手指在触控屏上划出挽留的轨迹:“这两个因子贡献了模型35的超额收益,放弃它们相当于砍掉模型的一条腿。”
“但能避免模型在压力测试中骨折,”陈默调出蒙特卡洛模拟界面,10万次模拟中,保留高相关性因子的模型在波动率超30的场景中,有12的概率出现权重震荡,“就像汽车高速行驶时爆胎,后果比减速更严重。”他指向林语晨,“把‘