Quant使用LLMS创建因果图来查找Alpha
喜欢指数的未来?加入我们的Xpotential社区,通过Xpotential University的课程进行未来的证明,阅读有关指数技术和趋势,连接,观看Keynote或浏览我的博客。
缅因州的离婚率以及人造黄油,冰淇淋销售和溺水事件的消费 - 很容易找到虚假统计联系的例子。当然,那些处理数据应该很好地知道因果关系和相关性是不同的事情。毕竟,没有人会期望冰淇淋引起溺水。但是,在投资的舞台上,真正的因果和效力很难建立,尤其是当您试图大规模地进行赚钱的方法时,尤其是当您认为该地区缺乏严格性是该行业的问题时,这是一个问题。和机会。
他们认为,除非有详细的因果分析,否则应将AI定量交易模型视为不科学的。否则,错误指定的模型可能会找到自己的生产方式,并挤出对市场如何真正运作的真实表现,因此许多投资者希望在投资上获得回报。
为了追求对市场的齿轮和车轮的更纯粹的了解,一些智慧已经开始测试不同的方法。这并不容易。这里的目的是创建一个所谓的DAG(有向无环图),本质上是这些因果关系的数据图,它是指指向另一个变量到另一个变量的箭头网络。
因果营认为,以这种方式记录因果关系比提出广泛的假设要获得积极回报的广泛假设。因此,创建DAG的室内方式是使用因果发现算法。这些算法能够从原始观察数据中确定什么驱动了什么。
在这个阶段,它会比最好的人更好吗?我不知道。但是,当大规模应用时,它将有用吗?多伦多大学的Alik Sokolov机器学习机器学习董事总经理以及Sibli的联合创始人兼首席执行官说,该公司为投资者建立了AI工具。
Quant可以访问有关世界的更多数据。而且更多的计算机电源也应该有所帮助。但是,算法必须计算大量变量的组合,这些变量与模型的复杂性呈指数级增长。在金融中,凭借其山上的数据,基于数据,该过程可能是耗时的,有时是不可能的。因此,另一条途径仅仅是依靠人类的专业知识。不过,遵循这种方法也遇到了问题。
绘制相对简单的因果图可能需要多个专家。在迅速发展的市场中,这种练习甚至可以在完成之前就已经过时了。因此,Quants提出了第三个想法,也是当今世界上一个明显的想法:将大型语言模型(LLMS)应用于任务。一个2021年的项目使用了由公司因果关系链接构建的大型语言模型,以基于专家的意见来生成因果图,它每天从50,000篇新闻文章中收集到。
研究人员构建了示例图,这些图形链接了宏观变量,例如美元强度,食品价格,黄金,石油需求,美国通货膨胀等。研究人员说,通过这种“人群的智慧”方法的因果图的建立时间可以简化为“几秒钟的问题”。
在去年年底进行的另一个项目中,Quants使用GPT-4将153个因素组织成簇,并在这些集群中绘制出因果图。研究人员发现,一位小但有影响力的干部说,数千万美元的投资行业基于有缺陷的科学,GPT-4预测的每月收益以及常规基于相关的版本的分组较少,并且相关性较小,并且较不易于解释。GPT-4与统计因果测试一致的关系的高率(三分之二)。
从事该项目的Sokolov说,以这种方式使用大型语言模型的诀窍是正确询问模型,有时还要使用提示链。索科洛夫(Sokolov)认为,以这种方式,企业将来可能会使用模型来建立策略搜索循环。
他说:“您可能提出了10种候选策略,这些策略更有可能是从第一原则中获得的。”“在这个阶段,它会比最好的人类更好吗?我不知道。但是,在大规模应用时会有用吗?”
他认为,众包因果图可以帮助建立策略的信念。“六个月的研究周期可能成为一个三个月的研究周期。”当然,这个过程不是傻瓜证明。需要人类专家来审查输出。但是,在一个建立因果关系成为量化模型的起点的世界中,有些问题认为会发生这种情况 - LLM可能会发挥作用。