应聘如何做量化投资资工作需要哪些技术

谢邀不管应聘成不成功,假如伱担心策略泄露那它就已经泄露了;假如你老东家是某数字开头的HF的话,传票可能已经在路上了最好的办法不谈具体策略不透露详細数据假如觉得不确定,拿着跟以前公司签的 NDA 找个律师朋友问问什么能谈什么不能能谈的可以谈到什么程度。公司想知道的无非是你昰否有为公司做出贡献的能力而展示这一点并不需要你把具体策略和盘托出。

此外那些真的期望你自带策略过来的公司会因此不聘用伱,而这绝对是一件好事

P.S. 至于找合作伙伴什么的,问我就如同问一个二等兵“作为军长我和政委不太对付怎么办”我也不知道怎么办,真的爱莫能助

著作权归作者所有商业转载请聯系作者获得授权,非商业转载请注明出处

策略的成功需要确保流程的每一步都成功,如下图:

流程执行周期可以是每周一次每天一佽,也可以是每分钟一次甚至每秒一次。

从事量化的投资者都是数据驱动的所有的投资行为都是由数据发起。随着大数据技术的发展鉯及数据服务商提供越来越丰富的服务我们可以很容易的拿到经过整理的、干净的、结构化的数据。

美国市场Quantopian作为个人量化平台的先驅,提供了丰富的数据以及用户教育社区国内市场,除了传统的大智慧、同花顺、新浪财经提供的基础数据服务以外也有一批新崛起嘚量化平台提供更多数据服务:



在数据阶段,我们需要思考的问题是“哪些数据集能够帮我们预测未来的收益?”也就是说,在挖掘數据的金矿之前我们先要决定从哪里开始挖!

Quantopian已经覆盖了8000多只美国股票的历史价格数据,国内的Ricequant等也覆盖了所有的3000多只A股/指数10年的历史價格数据以及财务数据在开始进入策略研发之前,我们必须从这么多股票中选择出一个大小合适、可供交易的股票池比如,Quantopian提供了 这類标准化的股票次供开发者使用你也可以根据个人偏好自定义股票池。

你可能会问为什么要限制自己,为什么不直接使用全量的数据这样做主要是考虑到一些实际的问题,比如最起码我们需要过滤掉缺乏流动性的股票另外,还有一个不太明显但是很重要的原因:一個成功的cross-sectional(横截面)如何做量化投资资策略需要对股票池中价格数据的自相似性离散性之间做出平衡我们先来看看什么是横截面分析?顾名思义横截面分析是将一只股票与其所经营的行业进行比较,或直接与同一行业内的某些竞争对手进行比较以评估绩效和投资机會。那么从数据的角度来看为了评价体系更加智能和有效,这些股票在某些特征上需要具有一定程度上的一致性比如把st股和非st股放到┅起就不太合适。

在构建股票池的时候必须特别注意你内在的投资理论,两者需要严格匹配举两个例子, 如果你想基于“”这个理论研发一个策略, 那么首先你需要过滤掉所有的ADR因为时差的原因导致这套理论在ADR上是行不通的(ADR:美国存托凭证,主要解决非美国企业在美仩市问题而存在的一种证券形式)第二个例子,如果你的策略主要基于财务报表比如“”,那么对于无法对这类指标进行有效的测算嘚股票就应该过滤掉(比如银行股)

Alpha是一个数学表达式,将它应用与我们选定股票池的横截面时可以得到一组结果用于预测这些股票未来回报的相对大小。Alpha可以是由直接的评分构成也可以是一个无量纲数向量。(无量纲化:简单说来就是为了将一些原本不可比的数据變的可比无量纲化常见的方法包括:标准化方法、指数法、均值化等等)Alphas也通常被称为因子

如果使用Quantopian你可以通过学习因子建模。在洇子探索阶段不需要担心真实世界的一些细节问题,比如交易、手续费或者风险你只需要不停的提出猜想,猜想存在一个因素会导致市场无效这个因素可以是投资者行为、市场结构、信息不对称或任何其他潜在问题,并看看这个猜想是否具有预测能力这非常考验脑仂,实在提不出任何猜想怎么办你可以试试用Google搜索“equity market anomalies”。当然更好的办法是访问这里有很多有意思的研究等着你去发现。

Alpha探索是艺术囷科学的交叉是奇迹发生的地方。Alpha探索也包含一个产品迭代流程:猜想、测试、修正 在Quantopian里,可以通过Pipeline API表达你的alphas通过分析alphas的有效性。

茬当前的市场里很少有单个因子足够有效,能够支撑起整个策略一个成功的策略往往包含多个独立的因子,如果这些因子非常有效那么只需要少数几个就够了。在这个阶段的目标是找到一种加权方案使得多个标准化后的因子放到一起产生比任何一个单因子更好的预測效果。

加权方案可以非常简单:很多时候仅仅是对因子进行等级划分或者对多因子进行平均化处理就能产生显著效果实际上,有一个非常流行的模型仅仅组合了两个因子参见《 》。 随着复杂度的不断增加你可以通过学习经典投资组合理论取得帮助,比如这篇文章《》中作者尝试找到最佳因子权重使得最终组合具有最低方差。

最后我们还可以通过最新的机器学习技术去捕捉因子之间的复杂关系,仳如将你的因子转换为特征值并输入到机器学习分类器中,这也是一个非常热门的研究方向如果感兴趣可以参考下面两片文章《》《》。

直到这个阶段我们一直在进行纯粹的研究,不去考虑实际执行过程中的复杂因素这样就可以在快速验证我们的想法。那么新的问題出现了如何将研究成果落地?我们需要围绕最终的因子向量构建一个投资组合并进行交易从而捕捉价值。在策略的每个循环流程期間(比如每天)我们计算多因子的最新值,组合成最终因子计算出新的投资组合;然后,从上一个执行周期继承投资组合进行对比後,生成一个交易列表从而实现投资组合的完美更新

在创建理想中投资组合的过程中,有新的问题产生:投资组合会存在哪些风险(即风险模型)投资组合构建步骤中的目标函数是什么? 怎样去约束投资组合这三个问题必须明确的给出答案。而且三个问题中的每一個的答案变得更加复杂时,投资组合结构中的复杂性就会增加

接下来,我们使用最简单的技术:基于最终因子向量的分位数构造一个投資组合举个例子,我们挑选股票池中前20%的股票以相等的权重做多同时挑选后20%的股票以相等的权重做空,投资组合中包含了多空两种资產并且多空仓位在绝对值上保持平衡。(在A股无法做空的情况下可以做出适当调整,比如通过做空股指期货进行替代)

上一个阶段嘚产出是一个理想的投资组合和一个将目前投资组合过渡到理想投资组合的交易列表。而交易阶段就是在市场中进行有效的交易。迄今為止我们所做的每一个选择在这里都面临一些实现的问题:我需要的交易速度要多快?因子的预测能力衰减的有多快在市场中被动的緩慢的执行更有效,还是积极的快速的执行更有效总而言之,我们需要做好平衡如果说股票池的构建是在价格分散自相似性之间做岼衡,投资组合的构建是在风险回报之间做平衡那么交易则是在因子衰变显性成本隐性成本以及投资意图的暴露之间做平衡。

你鈳能想知道是不是必须使用这个确切的流程才能取得成功?实际上想要构建一个稳定的高夏普比率的策略,并没有一个完美的方法留给投资者的研究空间非常大,而这个流程只是展示了大多数成功的投资者是如何解决这个问题的你可以保持学习和实践,然后在这个鋶程上进行持续改进和创新

我要回帖

更多关于 如何做量化投资 的文章

 

随机推荐