我是大一新生 上了大学后 发现所有女人都会夹丁丁吗活动都会加量化什么的 大家举行活动都会加上量化多多哦之类的

清华大学量化投资协会成果集萃 - 知乎专栏
{"debug":false,"apiRoot":"","paySDK":"/api/js","wechatConfigAPI":"/api/wechat/jssdkconfig","name":"production","instance":"column","tokens":{"X-XSRF-TOKEN":null,"X-UDID":null,"Authorization":"oauth c3cef7c66aa9e6a1e3160e20"}}
{"database":{"Post":{"":{"title":"Quant 相关论文索引","author":"xgdgsc","content":"动态更新于
, 目前多为机器学习相关的论文,其他方面不断完善中。欢迎PR!Quant Papers CollectionThis is a joint effort on collecting latest papers related to quantitative finance. Please fork to add your wisdom!Machine Learning RelatedCavalcante, Rodolfo C., et al. \"Computational Intelligence and Financial Markets: A Survey and Future Directions.\" Expert Systems with Applications 55 (2016): 194-211.Low Frequency PredictionAtsalakis G S, Valavanis K P. Surveying stock market forecasting techniques Part II: Soft computing methods. Expert Systems with Applications, ):. Cai X, Lin X. Feature Extraction Using Restricted Boltzmann Machine for Stock Price Predic- tion. 2012 IEEE International Conference on Computer Science and Automation Engineering (CSAE), .Nair B B, Dharini N M, Mohandas V P. A stock market trend prediction system using a hybrid decision tree-neuro-fuzzy system. Proceedings - 2nd International Conference on Advances in Recent Technologies in Communication and Computing, ARTCom . 381–385. Lu C J, Lee T S, Chiu C C. Financial time series forecasting using independent component analysis and support vector regression. Decision Support Systems, ):115–125. Creamer G, Freund Y. Automated trading with boosting and expert weighting. Quantitative Finance, ):401–420. Batres-Estrada, Bilberto. \"Deep learning for multivariate financial time series.\" (2015). Xiong, Ruoxuan, Eric P. Nicholas, and Yuan Shen. \"Deep Learning Stock Volatilities with Google Domestic Trends.\" arXiv preprint arXiv: (2015).Sharang, Abhijit, and Chetan Rao. \"Using machine learning for medium frequency derivative portfolio trading.\" arXiv preprint arXiv: (2015).Reinforcement LearningDempster, Michael AH, and Vasco Leemans. \"An automated FX trading system using adaptive reinforcement learning.\" Expert Systems with Applications 30.3 (2006): 543-552. Tan, Zhiyong, Chai Quek, and Philip YK Cheng. \"Stock trading with cycles: A financial application of ANFIS and reinforcement learning.\" Expert Systems with Applications 38.5 (2011): . Rutkauskas, Aleksandras Vytautas, and Tomas Ramanauskas. \"Building an artificial stock market populated by reinforcement‐learning agents.\" Journal of Business Economics and Management 10.4 (2009): 329-341.Deng, Yue, et al. \"Deep Direct Reinforcement Learning for Financial Signal Representation and Trading.\" (2016).Natual Language Processing RelatedBollen J, Mao H, Zeng X. Twitter mood predicts the stock market. Journal of Computational Science, ):1–8. Preis T, Moat H S, Stanley H E, et al. Quantifying trading behavior in financial markets using Google Trends. Scientific reports, 4. Moat H S, Curme C, Avakian A, et al. Quantifying Wikipedia Usage Patterns Before Stock Market Moves. Scientific Reports, –5. Ding, Xiao, et al. \"Deep learning for event-driven stock prediction.\" Proceedings of the 24th International Joint Conference on Artificial Intelligence (ICJAI’15). 2015. Fehrer, R., & Feuerriegel, S. (2015). Improving Decision Analytics with Deep Learning: The Case of Financial Disclosures. arXiv preprint arXiv:. High Frequency TradingNevmyvaka Y, Feng Y, Kearns M. Reinforcement learning for optimized trade execution. Proceedings of the 23rd international conference on Machine learning ICML 06, ):673–680. Ganchev K, Nevmyvaka Y, Kearns M, et al. Censored exploration and the dark pool problem. Communications of the ACM, ):99. Kearns M, Nevmyvaka Y. Machine learning for market microstructure and high frequency trading. High frequency trading - New realities for traders, markets and regulators, . Sirignano, Justin A. \"Deep Learning for Limit Order Books.\" arXiv preprint arXiv: (2016). Deng, Yue, et al. \"Sparse coding-inspired optimal trading system for HFT industry.\" IEEE Transactions on Industrial Informatics 11.2 (2015): 467-475.Ahuja, Saran, et al. \"Limit order trading with a mean reverting reference price.\" arXiv preprint arXiv: (2016). A?t-Sahalia, Yacine, and Jean Jacod. \"Analyzing the spectrum of asset returns: Jump and volatility components in high frequency data.\" Journal of Economic Literature 50.4 (2012): . Portfolio ManagementB. Li and S. C. H. Hoi, “Online portfolio selection,” ACM Comput. Surv., vol. 46, no. 3, pp. 1–36, 2014. Heaton, J. B., Polson, N. G., & Witte, J. H. (2016). Deep Portfolio Theory. 之前的相关索引: 链接关于更多量化投资的文章请关注专栏:或者关注我们的知乎账号: 、清华量化投资协会官方论坛:中美量化投资人才联合会官网:","updated":"T14:12:19.000Z","canComment":false,"commentPermission":"anyone","commentCount":2,"likeCount":108,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T22:12:19+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-c52dba16df9f91b9c0d5c_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":2,"likesCount":108},"":{"title":"【对冲基金】老虎基金之兴衰","author":"wen-yi-yang-81","content":"老虎基金(Tiger Fund),是由朱利安罗伯逊(Julian Robertson)于1980年创立的举世闻名的对冲基金。到1998年其资产由创建时的800万美元,迅速膨胀到220亿美元,并以年均盈利 25%的业绩,列全球排名第二。其中,1996年基金单位汇报为50%,1997年为72%,在对冲基金业里,老虎基金创造了极少有人能与之匹敌的业绩。然而,进入到2000年,其资产从220亿美元萎缩到60亿美元,同期无论是道指还是纳指都是一路高歌,一直在市场中呼风换雨,曾与索罗斯等对冲基金联手冲击香港汇市的“大庄家”,辛辛苦苦几十年,一觉回到解放前,其经历颇耐人寻味。兴亡史1. 创立老虎管理1980年由(Julian Robertson)创办,创立资本为800万美元,其中200万是自有资金。在此之前,他曾作为股票经纪和基金经理在kidderPeabody&Co工作近20年;之后,他又在Webster Management担任基金部主管。老虎基金与全球第一支对冲基金———“琼斯对冲基金”(JohsHedge Fund)是否有渊源关系,难以查证;但1983年琼斯的女婿接管“琼斯对冲基金”,把大部份资产交给罗伯逊管理却有记载。2. 盈利老虎管理旗下共有六只基金,都是罗伯逊在20世纪80年代陆续创立的,以各种猫科动物命名。除在1980年创建以其商标命名的老虎(Tiger)基金外1986年他建立了美洲豹(Jaguar)基金和美洲狮(Puma)基金,1987年还组建了狮子(Lion)和虎猫(Ocelot)基金。其中老虎和美洲豹基金较具规模,各管理数十亿美元。从基金的名称,人们似乎可感觉到罗伯逊对冲基金投资策略的进攻性和冒犯性。此前,罗伯逊投资管理可谓极为成功,早在1986年传媒就广泛宣传对冲基金的高额回报,特别是老虎基金在1985年“宏观”投资的高回报率。老虎基金在美元连续四年强劲升值后,预计美元相对欧洲货币和日圆币值高估将贬值,买进大量的外汇购入期权(foreign currency call options),取得高额回报。老虎管理初期,以传统的个股选择为投资策略,80年代中后期,随着金融创新和越来越多的金融衍生产品的推出,老虎管理日益背离传统的基金管理策略,在世界范围内建立包括政府债券、货币、股市、利率及相关期权期货等衍生产品的投资组合,成为典型的“宏观”对冲基金。老虎管理曾保持辉煌的业绩,自1980年至投资失利前的1998年8月,每年的投资回报率为32%,就是把投资失利的18个月算进去,其年均增幅也高至25%,是表现最佳的对冲基金之一。图中的五个基金在1985年到2000年都超越了市场,包括巴菲特的伯克希尔·哈撒韦,索罗斯的量子基金,朱利安·罗伯逊的老虎基金,约翰·内夫的温莎基金,以及福特基金会基金。3. 失利但是,1998年8月之后,老虎管理的投资四处碰壁,资产价值一落千丈。1998年8月全盛时期,管理的资产多达220亿美元,比索罗斯量子基金还高出一大截,是当时规模最大的对冲基金,罗伯逊因此被人们推为华尔街最具影响力的人物。经历一系列的投资失误后,至2000年二月底,老虎管理的资产暴跌,只剩下60多亿美元。从1998年第四季开始,投资者在长期资本管理(LTCM)事件的阴影下,陆续赎回在对冲基金的投资,老虎管理是面对大量赎回的主要对冲基金之一,总额高达近77亿美元之多。宏观对冲策略的失误显示出老虎基金衰落最初的苗头。1998年秋,由于俄罗斯卢布贬值,老虎基金损失6亿美元, 比起其它对冲基金如LTCM,它的损失不大,尤其老虎基金此时正处于全盛时期,几亿美元损失,影响有限;同期老虎基金在日元套利交易中借入低息日元购入美元资产,但日元在1998年第四季突然转强,老虎管理劲蚀十数亿美元。当时的老虎基金正处于全盛时期,规模接近230亿元,亏损绝对数额虽然很大,但规模庞大稀释了亏损,而且在当年8月份之前,老虎基金仍实现了27%的回报。最终,老虎基金以蚀4%的业绩解释了1998年。4. 萎缩日元投机和卢布债务的损失,对拥有220亿美元的老虎基金而言,还不足以致命,虽然这是18年来业绩第一次倒退,1998年业绩比1997年倒跌4%。使老虎管理没落的真正原因是它的股票投资失误。与很多对冲基金一样,老虎管理在全球“宏观”投资接连失手后,转向股市投资。投资股票,罗伯逊一向坚持“价值投资”理念,依据公司盈利能力确定合理价位,逢低吸纳,高价出货。但金融市场进入1999年,却刮起了科技股旋风,以科技为主的“新经济”股份之涨落,并不完全按基础分析的模式运作,“价值法”基本上不能用以科技股的分析。罗伯逊低价买入大量的“旧经济”股份,而这些股份由于市场资金流入“新经济”股而持续大跌,比如,持有逾22%股权的美国航空,在过去12个月内失去近乎5成的市值,使老虎管理损失惨重,老虎基金的每股资产从高峰的154万跌至二月底的82万美元,幅度高达47%。作为对冲基金,老虎管理利用杠杆买空看好的股份,卖空利淡的股票,对于没有盈利的科技网络股,罗伯逊抛空这些股份是理所当然的,他先后沽空了两大热门股份朗讯(LucentTech)和MicronTech,可以想像这些交易为老虎所带来的灾难是如何巨大。此后,为势所迫,老虎管理在1999年第四季度开始追入已过势的“新经济”股份,先后大力吸纳英特尔、戴尔电脑等,接下高位派货“火捧”,结果“高买低卖”,在科技股上又输一把。由于股市投资决策一再失误,老虎管理的资产1999年下挫19%,截至2000年二月底,再下跌13%,加上投资者纷纷赎回资本,从1998年9月以来,老虎管理的资产值已暴泻了160亿美元。由于严重亏损,老虎管理的资产,已无法提供足够的佣金和分成利润以支付营运开支和雇员薪酬。对冲基金的报酬,不像互惠基金来自管理费,而是从基金所实现的一定利润中抽取20%作为薪酬。老虎管理的客户非富即贵,他们愿意付出高昂的代价,以鼓励基金回报跑赢大市,但要求投资收益必须超过一定水平时,才向基金支付佣金。在老虎管理亏损的情况下,要想获得佣金,基金的回报率就必须大幅反弹近50%,但这几乎不可能,而资金又不断被赎回,以至连最后的管理收费也不足以应付一般营运开支。5. 破产面对山穷水尽,罗伯逊万般无奈宣布老虎管理结业。剩下的60多亿美元的“退还”方式如下∶75%现金,5%为基金持有的11种股票,在日前逐步退还给公司各股东。老虎管理仍保留美国航空等5种核心股票,约为公司资产的20%,罗伯逊可能继续保留公司名号管理家族约15亿资产。罗伯逊表示不再“为他人赢钱”,并考虑坐下来写“财经类小说”。他仍然持有的5种股票,目的也在等待时机,善价而沽。据报道,老虎管理的许多高级基金经理,可能加入前执行董事LeeAinslie创办的MaverickCapital对冲基金。至此,曾经在国家金融市场叱吒风云,显赫一时的老虎管理集团终于树倒猢狲散,寿终正寝。巴菲特与老虎基金的收益率对比6. 后续在结束旗下基金运营后,罗伯逊依然在不断传播着自己的投资理念。2000年以来,他一直在帮助自己的旧部创立并培育精选对冲基金,这些经罗伯逊指导的对冲基金被业界称为“小虎基金群”(Tiger Cubs)。目前此类基金已经有40多只。附:罗伯逊清盘时致投资者信 致:各位股东 由:朱利安·罗伯逊(Julian H. Robertson, Jr.)日期:日这封信交代阁下与老虎基金管理公司之间的关系,恳请细心阅读此信内容。1980 年5 月,Thrope Makenzie 和我以880 万美元的资本成立了老虎基金。18年后,当年的880 万美元已增长至210亿美元,增幅超过259000%。这期间基金持有人在撇除所有费用后所获得的年回报率高达31.7%。没有人有更佳成绩。\n自1998年8月后,老虎基金表现较差。基金持有人亦作出积极响应--赎回基金。这是可以理解的。这期间赎回金额达77亿美元。价值投资的智慧受到挑战。持有人的赎回不单侵蚀我们的收益,还令我们承受极大的压力。而我们却看不到这一切行将结束的迹象。我所提到“看不到行将结束”究竟是什么意思?“结束”的是什么?“结束”其实是指价值股熊市的结束;是投资者明白,无论股市短期表现如何,15至20%的投资回报已是不俗。“结束”因此可作如下解释:投资者开始放弃投机性的短期投资,转往更有保障而过往回报不俗的被遗弃股份。现时很多人谈新经济( 互联网、科技及电讯) 。互联网诚然改变了世界,生物科技发展亦令人惊叹,科技及电讯也带给我们前所未有的机会。炒家们宣扬:“避开旧经济、投资新经济、勿理会价钱。”这便是过去18个月市场所见投资心态。我曾在过去很多场合说过,老虎基金以往多年的成功,要诀是我们坚持的投资策略:买入最好的股份及沽空最差的股份。在理性的环境,这策略十分奏效。可是在不理性的市场,盈利及合理股价不受重视,宁炒当头起及网络股成为主导。这样的逻辑,我们认为不值一哂。投资者为求高回报,追捧科技、互联网及电讯股份。这股狂热不断升温,连基金经理也被迫入局,齐齐制造一个注定要倒塌的P o n z i 金字塔。可悲的是,在现时环境下,欲求短期表现,就只有买入这类股份。这过程会自我延续至金字塔塌下为止。我绝对相信,这股狂热迟早会成过去。以往我们也曾经历过。我仍很有信心价值投资是最好的,虽则市场现不买账。这次也非价值投资首次遇到挫折。很多成功的价值投资,在年及1980/81年间成绩差劲,但最终获利甚丰。我们很难估计这改变何时出现,我没有任何心得。我清楚的是:我们绝不会冒险把大家的金钱投资在我完全不了解的市场。故此,在经过仔细思量之后,我决定向我们的投资者发回所有资金--即是结束老虎基金。我们已套现了大部分投资,将依照附件所述方法退回资产。我比任何人更希望早些采取这项行动。无论如何,过去20年是相当愉快及充实的。最近的逆境不能抹去我们过往彪炳战绩。老虎基金成立至今,足有85倍的增长( 已扣除一切费用) ,这相等于标准普尔500指数的三倍多,也是摩根士丹利资本国际环球指数的5.5倍。这20年中最令人回味的是与一群独特的同事,以及投资者紧密合作的机会。不论是顺境或逆境,亦不论是胜是负,我每次说话,都是我及老虎基金全体员工的真心话,容我们在此衷心向各位致谢。链接关于更多量化投资的文章请关注专栏:或者关注我的知乎账号:清华量化投资协会官方论坛:中美量化投资人才联合会官网:","updated":"T09:51:50.000Z","canComment":false,"commentPermission":"anyone","commentCount":7,"likeCount":91,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T17:51:50+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-c390ae9c45c7f06085ad_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":7,"likesCount":91},"":{"title":"【量化策略】基于Level 2高频数据的机器学习预测研究","author":"wen-yi-yang-81","content":"1. High Frequency Limit Order bookLevel 2的高频limit order book数据包含了从买一价到买十价;卖一价到卖十价以及其对应的挂单量,以及交易单类型。比起普通的只有价格的tick数据,拥有了更多的信息,也更有利于运用机器学习的算法进行规律发掘。有关更多的limit order book的知识可以参考以下链接里的内容:我之所以关注这方面的内容,是因为去年秋天我上了Stanford的STATS 244 这门课,最后教授了给了三个题目,一个是关于多因子的,一个是关于统计套利的,还有一个就是对于limit order book数据的建模,我一直想探寻机器学习在金融数据预测方面的运用,所以就选择了这个题目。最后结果很好,课程也拿了A+,还获得了教授的推荐信。2. 具体方法与结果关于机器学习最关键的也许就是特征提取了,我主要是借鉴下面这篇论文中的处理办法:其特征提取方法总结如下:我在此基础上对特征提取方法又进行了些许改动,而label用的是一秒内的价格波动(有三类,up,down和stable)。最后我基于教授给我的港股数据(汇丰银行),进行训练预测。出乎我的意料是,结果非常好,由于我只有五天数据,所以我用了前四天做训练集预测第五天,RandomForests准确率接近95%,而SVM在95%以上。Recall的表现也很好,也有95%+。Confusion Matrix我就不粘了。国外也有人做了相同的实现:,对上的sample data用更长的周期进行预测,Error rate是0.29:ORCL: Train Decision Tree model. Training data size: 64064\nORCL: Trained model in 3740 millis\nORCL: Label counts: [Stationary -& 42137, Down -& 10714, Up -& 11213]\nORCL: Evaluate model on validation data. Validation data size: 54749\nORCL: Training Error = 0.39455相关Code已经上传到了git:3. 后记与成员招募最近我在进行A股委托单数据和期货高频数据(半秒级别)以及用机器学习优化策略的研究,我们量化投资协会有一个深度智能研究小组,由一个计算机系的老师指导,目前成员以交叉信息学院、计算机、自动化、电子、经管等院系的小伙伴为主。如果你有有一定机器学习的基础,并对机器学习在量化方面感兴趣的同学,欢迎私信我加入组织。(不必要一定是清华的同学,国内及海外不错学校的硕博及优秀本科生、机器学习相关行业人员、量化行业人员均可报名)4. 最后以下链接方便手机用户关注:或者关注我的知乎账号:","updated":"T14:13:47.000Z","canComment":false,"commentPermission":"anyone","commentCount":36,"likeCount":196,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T22:13:47+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-66b3e425536dcb36b89f1affd8784666_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":36,"likesCount":196},"":{"title":"【量化策略】当Trading遇上Reinforcement Learning","author":"wen-yi-yang-81","content":"Introduction增强学习(Reinforcement Learning)和通常的机器学习不一样,并不是一个pure forecasting method(纯粹预测的方法),而是可以通过action和outcome的不断反馈进行学习,最后提供训练者一个合理的决策而不仅仅是预测。这种直接提供决策的学习方法更符合量化交易的需求,因为这就意味着增强学习可以直接告诉你是该long还是short,该持有多少仓位。由于具有这样的特性,很多人都着力于研究如何用增强学习构建自动化交易系统,进行交易获利等。关于增强学习在量化交易上可行性的更多的讨论可以见Quora上的一些问题和回答:PS:近两年由于深度学习的火爆,深度增强学习的出现将带来新的一波浪潮,听说美国已经有人用Deep Reinforcement Learning进行量化交易,效果还不错。Paper关于基于Reinforcement Learning的Trading的Paper和资料能找到很多,简单列举一些,供大家阅读参考:Git & Code关于这个主题有一个相关的Git项目:此外,国外有人还贴出了基于Forex的Python实现的完整code(原网址:):#coding: UTF-8\n\nimport numpy as np\nimport pandas as pd\nimport matplotlib.pyplot as plt\nimport matplotlib.cm as cm\nimport itertools\nimport mpl_toolkits.mplot3d\n\n#------------------------------------------------------------------------------\n# DEFINITION\n#------------------------------------------------------------------------------\nclass RLMomentum():\n
def __init__(self, datapath):\n
self.data = pd.read_csv(datapath, header=None)\n
self.ret = self.data / self.data.shift(1) - 1\n
self.ret = self.ret.fillna(0)\n
self.window_short = 20\n
self.window_long = 60\n
self.samples = len(self.data)\n
self.states = 6\n
self.actions = 3 #long, flat, short\n
self.epsilon = 0.1\n
self.gamma = 0.9 #discount factor\n
self.mc = 100 #Monte Carlo\n\n
self.q = np.zeros((self.states, self.states, self.actions))\n
self.rewards = np.zeros((self.states, self.states, self.actions))\n
self.count = np.zeros((self.states, self.states, self.actions), dtype = np.int16)\n
self.isVisited = np.zeros((self.states, self.states, self.actions), dtype = np.bool)\n\n
self.momentum = np.zeros(self.samples)\n
def init(self):\n
self.count = np.zeros((self.states, self.states, self.actions), dtype = np.int16)\n
self.isVisited = np.zeros((self.states, self.states, self.actions), dtype = np.bool)\n
def currentState(self, signal):\n
signal = float(signal)\n
sep = np.linspace(-1, 1, self.states-1)\n
return sum(sep & signal)\n
def selectAction(self, state_short, state_long):\n
if (self.q[state_short, state_long, :]==0).sum() == self.actions:\n
#if all action-values are 0\n
return np.random.randint(0, self.actions)\n
#Epsilon-Greedy\n
if np.random.random(1) & self.epsilon:\n
return np.random.randint(0, self.actions)\n
return np.argmax(self.q[state_short, state_long, :])\n\n
def actionToPosition(self, action):\n
if action == 0:\n
return -1\n
elif action == 1:\n
return 0\n
elif action == 2:\n
return 1\n\n
def updateRewards(self, reward, state_short, state_long, action):\n
self.isVisited[state_short, state_long, action] = True\n
self.rewards = self.rewards + reward.values * (self.gamma ** self.count)\n
self.count = self.count + self.isVisited\n\n
def updateQ(self, itr):\n
self.q = (self.q * itr + self.rewards) / (itr + 1)\n\n
def episode(self):\n
for i in range(self.samples - 1):\n
if i &= self.window_long - 1:\n
self.momentum[i] = self.ret.ix[i]\n
sub_short = self.momentum[i - self.window_short : i - 1]\n
sub_long = self.momentum[i - self.window_long : i - 1]\n
#state = annualized Sharpe ratio\n
state_short = self.currentState( np.mean(sub_short) / np.std(sub_short) * np.sqrt(252) )\n
state_long = self.currentState( np.mean(sub_long) / np.std(sub_long) * np.sqrt(252) )\n\n
action = self.selectAction(state_short, state_long)\n\n
reward = self.ret.ix[i + 1] * self.actionToPosition(action)\n
self.updateRewards(reward, state_short, state_long, action)\n
self.momentum[i] = reward\n\n
def monteCarlo(self):\n
for i in range(self.mc):\n
self.init()\n
self.episode()\n
print(\"episode\",i,\"done. cumulative return is\",sum(self.momentum))\n
self.updateQ(i)\n
#plt.plot(100 * (1 + self.momentum).cumprod(), label=\"RL-momentum \"+str(i))\n\n
#plt.plot(100 * (1 + self.ret).cumprod(), label=\"long-only\")\n
#plt.plot(100 * (1 + self.momentum).cumprod(), label=\"RL-momentum\")\n
#plt.legend(loc=\"best\")\n
#plt.show()\n
#plot Q-value matrix\n
x = np.linspace(0,5,self.states)\n
y = np.linspace(0,5,self.states)\n
x,y = np.meshgrid(x, y)\n
for i in range(self.actions):\n
if i == 0:\n
position = \"short\"\n
elif i == 1:\n
position = \"flat\"\n
elif i == 2:\n
position =
\"long\"\n\n
fig = plt.figure()\n
ax = fig.gca(projection='3d')\n
ax.set_xlabel(\"state_short\")\n
ax.set_ylabel(\"state_long\")\n
ax.set_zlabel(\"Q-value\")\n
ax.set_title(\"Q-value for \" + position + \" position\")\n
#ax.view_init(90, 90)\n
urf = ax.plot_surface(x, y, self.q[:, :, i], rstride=1, cstride=1, cmap=cm.coolwarm, linewidth=0, antialiased=False)\n\n
plt.show()\n#------------------------------------------------------------------------------\n# MAIN\n#------------------------------------------------------------------------------\nm = RLMomentum(\"usdjpy.csv\")\nm.monteCarlo()机器学习策略组招人最近我在进行A股委托单数据和期货高频数据(半秒级别)以及用机器学习优化策略的研究,我们量化投资协会有一个深度智能研究小组,由一个计算机系的老师指导,目前成员以交叉信息学院、计算机、自动化、电子、经管等院系的小伙伴为主。如果你有有一定机器学习的基础,并对机器学习在量化方面感兴趣的同学,欢迎私信我加入组织。(不必要一定是清华的同学,国内及海外不错学校的硕博及优秀本科生、机器学习相关行业人员、量化行业人员均可报名)关注链接:我的知乎账号:专栏:","updated":"T01:24:40.000Z","canComment":false,"commentPermission":"anyone","commentCount":31,"likeCount":152,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T09:24:40+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-ccfc93fbbefcd2de7de599_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":31,"likesCount":152},"":{"title":"【量化模型】Black-Litterman模型介绍","author":"wen-yi-yang-81","content":"本文来源于清华大学量化协会alpha学术小组经管学院同学的整理。目前量协已经开设了多个学术小组,涉及金融物理学、统计套利、alpha策略、波动率预测、期权研究、舆情NLP分析、增强学习、高频机器学习等多个方向。欢迎对量化交易研究感兴趣的在校硕博及优秀本科生(数学、物理、统计、计算机、金融、电子等专业)私信我加入小组参与研究。Black-Litterman模型是基于MPT基础上的资产配置理论。BL模型在隐含市场收益率和分析师主观预测信息的基础上,成功解决了MPT模型中假设条件不成立,参数敏感等问题。 MPT模型
我们先简单回顾一下Markowitz的MPT模型:给定风险水平下的预期收益最大化,也可以是其对偶命题,给定预期收益 水平下的风险最小化。min
W^{T}\\Sigma W\ns.t. W^{T} r=r_{p}
或者 max W^{T}r s.t. W^{T}\\Sigma W=\\sigma _{p}^{2}
缺点:假设不成立:MPT理论假设为投资者一致且理性(即投资者对预期收益、标准差和风险资产相关性具有一致预测;投资者行为遵循最优化原则,即投资者理性)。现实中显然不成立。无仓位限制:在无卖空限制条件下,MPT模型经常导致在一些资产上有很大的空头头寸,而实际上大量投资者具有卖空约束。中国市场对卖空进行限制,模型经常导致在某些资产上权重为零,而在另一些资产上权重过大,即出现资产配置过于集中的现象。参数敏感:对输入参数如预期收益率作小幅度变化,可能导致模型结果发生剧烈变化。改进:高盛的Fisher\nBlack和Robert\nLitterman在研究中发现,对组合中德国债券预期报酬率做0.1%小幅修正后,竟然该类资产的投资比例由原来的10.0%提高至55.0%。做法:加入投资者自己的观点,而且有一定的置信水平。二人提出了BL模型:使用Bayes定理(条件概率),构建收益时通过一定方式对市场隐含收益率与主观预期收益的加权平均。B-L模型max E[R]=[(\\tau \\Sigma )^{-1} +P^{T} \\Omega ^{-1}P]^{-1}
[(\\tau \\Sigma )^{-1} \\Pi +P^{T} \\Omega ^{-1} Q]s.t. 风险约束,预算约束,Beta约束,做空约束重要参数解释:E[R]:新的加权后的收益向量(n*1列向量);\\tau :比例系数(常数);P:涉及主观看法资产矩阵(k*n矩阵);\\Omega :看法置信度矩阵(k*k矩阵);\\Pi :隐含均衡收益率向量(N*1列向量);Q:看法向量(k*1列向量);那实际情况是如何使用的?从市场观察到的价格、市场权重去反推出市场隐含均衡收益率(市场均衡配置):\\Pi =\\delta \\Sigma W^{m}
其中,根据Satchell and Scowcroft(2000)的方法,\\delta 表示单位风险的超额收益,\\delta =(E(r)-r_{f} )/\\sigma ^{2} Σ是协方差矩阵;根据Litterman的文献,\\Omega =diag(P(\\tau \\Sigma )P^{T});假定┏接近于零,实际取0.05,此值越小预期收益越远离历史情况,接近主观预期;或者可以用K/N计算,K为有主观分析的种类数,N为总种类数。举例 P,Q举例如下: P是涉及看法的资产矩阵,是k×n矩阵,k表示几种看法,n表示资产数量。采用Satchell\nand Scowcroft(2000)方法,具体构造以下三个看法来例举阐述。\n1)A资产绝对收益为10%,信心水平50%; \n2)B资产比C资产收益率高5%,信心水平60%; \n3)D、E资产比F、G、H资产收益高2%,信心水平90% 假定资产数量为10个,A、B、C、D、E、F、G、H依次排序为前八个,则P矩阵如下: \\begin{bmatrix} 1 & 0 & 0 & 0& 0& 0& 0& 0& 0& 0\\\\ 0&1 & -1 & 0& 0& 0& 0& 0& 0& 0\\\\\n0& 0& 0& \\frac{1}{2} & \\frac{1}{2} & -\\frac{1}{3} & -\\frac{1}{3} &-\\frac{1}{3} &0 & 0\n \\end{bmatrix}\\quad第一行代表第一个看法,这是一种绝对方式表达,涉及A资产,看法正面为1。第二行是相对看法, 涉及A、B两资产,看法正面为1;负面为-1。第三行涉及多个资产,看法为正面的之各为1;看法为 负面的之和为-1。 \nQ: 看法(views) 数量k=3,列向量为(10%,5%,2%)的转置。 其他NotesBL优化后确实战胜市场均衡配置;
BL模型同样也存在模型上的缺陷,需要继续改进。历史数据计算出来的协方差矩阵在长期内可能不能良好刻画出短期关系,需要动态调整;分析师主观预期(看法)信心水平的设定具有很大的主观 随意性,在方法上还存在众多分歧; BL模型比较符合目前国内基金投资真实市场环境,如关注分析师主观预期,存在投资仓位上下限规定等; BL模型适用于行业资产配置,而一般不配置具体的投资,倾向区分大类资产;但有的地方也说可以用在个股组合中; 达里奥桥水基金的全球配置更关注风险因子,而非大类。股票中的能源股和部分大宗商品息息相关,从而分配到相同的一类中。是不同于MPT和BL的资产配置理论最后了解更多量化交易的内容可以关注我的个人账号: 或者本专栏:","updated":"T05:39:20.000Z","canComment":false,"commentPermission":"anyone","commentCount":8,"likeCount":177,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T13:39:20+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-df9fdabbf22a_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":8,"likesCount":177},"":{"title":"【量化策略】从模糊集理论出发构建股价动力学方程","author":"wen-yi-yang-81","content":"本文来源于清华大学量化协会金融物理学术小组成果,由清华凝聚态物理phd夏同学撰写。目前量协已经开设了多个学术小组,涉及金融物理学、统计套利、alpha策略、期货趋势追踪,波动率预测、期权研究、舆情NLP分析、增强学习、高频机器学习等多个方向。最近协会还致力于更多的校友机构合作,学术小组的成员将有机会参与这些机构指定的的研究项目并获得一定的报酬与提高,做的好的同学还将有实盘上线的机会。欢迎对量化交易研究感兴趣的在校硕博及优秀本科生(数学、物理、统计、计算机、金融、电子等专业优先)私信我加入小组参与研究。本文概要本文从LX Wang的paper出发,由模糊集(Fuzzy set)理论建立股价的动力学模型(Price dynamic models),在动力学方程中,构建散户和机构的四种行为因子。在实证阶段,由现有股票价格数据拟合出不同行为因子在某时刻的相对强度,进而捕捉机构建仓行为。正文首先定义每日的价格变动量x,反应了即时的股价变动趋势:x^{(m,n)} = ln( \\frac { \\overline {p}_{(m,t)}} { \\overline {p}_{(n,t)}})其中{ \\overline {p}_{(n,t)}}
= \\frac{1}{n} \\sum_{i=0}^{n-1} p_{t-i}p_t为t时刻股价。当然也可以简单地定义为每日对数收益率或其他形式,读者有兴趣可以自行尝试。接着基于x定义股价动力学方程:ln(p_t) = ln(p_{t-1}) + \\sum^{M}_{i=1}a_i(t)ed_i(x_t) + \\epsilon_ted_i(x_t) 是以x 为自变量的影响因子函数,共有M个影响因子反应在股价的动力学方程里。系数a_i (t)反应了t时刻因子i的权重。本文通过拟合权重系数来探究影响当前股价走势的主要因素,并基于此发展一套可行的量化趋势类策略。下面我们来构建影响因子函数:对于给定的价格变动量x,我们定义隶属于以下七个集合positive small(PS), positive medium(PM), positive large(PL), neutral(N), negative small(NS), negative medium(NM), negative large(NL)。对于经典集合理论, 只有x∈A or x?A 两种情况,A为定义在实数域上的集合。而从模糊集理论出发,我们可以定义隶属函数μ_A来表示x相对与集合A的隶属度。以集合positive small(PS) 为例, 隶属函数为:\\mu_{ps}(x)=\n\\begin{cases}\n1-\\frac{|x-w|}{w}& \\text{if x in [0,2w]}\\\\\n0& \\text{otherwise}\n\\end{cases}直接上文献上的图,图一表示不同集合的隶属函数,我用红色标记出了上式所表示的PS集。那么,当价格处在某一区间集合时,市场上不同投资者会对股票做出不同的操作,或买或卖,进而构成了影响股价动力学方程的不同影响因子。原文献中罗列了十二种影响因子,有兴趣的读者可以去原文献Part I 中找。本文这里构建散户和机构的四种行为因子。我们知道,庄家一般会选择被市场低估的股票来建仓,甚至还会在吸筹过程中利用已有筹码通过各种手法打压股价,降低建仓成本,所以在这个过程中股价处于低位,即价格变动量在negative集合(NS, NM or NL)区域。当股价上行到高位时,庄家就会出货,获利离场,此时进场的当然也就是跟风追涨的散户。所以我们构建下面四个因子来模拟庄家高抛低吸和散户追涨杀跌的行为:图二表示由模糊集理论构造出的四种影响因子函数ed,当然我们也可以用其他方法构建,基本思想是一致的。最后,利用股价序列来拟合系数a ?(t)序列。为得到实时的系数,这里提供两种思路:1、利用最近更新的固定个数的股价来拟合;2、利用递归最小二乘(RLS)算法,由最新数据更新拟合系数,此部分不是本文重点,具体算法和代码读者可以自行搜索相关文献。实证阶段,我们利用浦发银行(600000)去年的每日收盘价序列进行一个简单的验证分析。如图三:我们可以看到,在所标记的时间段内系数a2、a4有明显提升,显示机构在吸货建仓;之后股价被短期拉升,a1、a3明显升高,显示机构出货,之后股价断崖下跌。Reference:L. X. Wang, “Dynamical models of stock prices based on technical trading rules PartIII: Application to Hong Kong stocks,” IEEE Trans. on Fuzzy Systems (IF=8.7), Vol. 23, No. 5, pp. , 2015. part-III-publish.pdfL. X. Wang, “Dynamical models of stock prices based on technical trading rules PartI: The models,” IEEE Trans. on Fuzzy Systems (IF=8.7), Vol. 23, No. 4, pp. 787-801, 2015. part-I-publish.pdfL. X. Wang, “Dynamical models of stock prices based on technical trading rules PartII: Analysis of the models,” IEEE Trans. on Fuzzy Systems (IF=8.7), Vol. 23, No. 4, pp. , 2015. part-II-publish.pdf最后了解更多量化交易的内容可以关注我的个人账号: 或者本专栏:","updated":"T09:01:04.000Z","canComment":false,"commentPermission":"anyone","commentCount":18,"likeCount":89,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T17:01:04+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-64a69fffbd613c76fa2f3_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":18,"likesCount":89},"":{"title":"清华量协策略小组介绍与招新","author":"wen-yi-yang-81","content":"本学期清华量协在校内招新300余人,因为一直想带大家做点实际的工作,遂决定成立了9个策略小组,由一些在量化方面具有经验的在校学长和业界的师兄进行指导。目前已经完成了在协会内部的招新工作,每个小组成员人数5-15人不等,现要求每位同学一周投入5-10个小时的学习时间,并且每周在伟伦楼107FDT金融实验室进行例会。最终表现不错的同学最终将获得模拟盘乃至实盘管理资金的机会。各策略小组近期研究方向经过第一次例会,大致确定了策略小组未来2-3周的研究与学习任务:1. Alpha多因子对冲小组熟悉pandas金融数据处理,编写具有一定拓展性的回测函数(考虑交易成本、升贴水、停牌、ST、涨跌停、对冲标的、调仓频率,持股数量、股票权重等),对已有的weight文件进行测试,使得各项performance与已完成测试的回测函数相近。2. 期货趋势小组学习交易开拓者TB语言,先进行开仓信号的寻找。3. 外汇研究小组与期货趋势小组相似,学习MT4(MT5)语言4. 期权策略小组学习期权相关知识,阅读给定paper,并进行波动率的数值预测研究5. 高频交易本小组主要由在美国著名高频公司工作过的大牛学长领导。6.舆情NLP小组完成雪球舆情、股吧、微博、各大财经门户网站(和讯、新浪财经、东方财富网、同花顺、金融界、金十、华尔街见闻等)的爬虫程序,并实现每日实时更新数据库。7.统计套利小组完成相关paper的阅读(分时序、协整、OU-Process、机器学习等研究方向)。8.人工智能小组小组成员先对机器学习相关知识进行学习,之前有过经验的同学联手参与一个Kaggle项目,之后主要研究增强学习与深度增强学习。9.固定收益小组进行固定收益产品、利率量化分析(由某校友基金北京固收部指导)研究宏观经济数据、对债市、股市、行业等方面的影响以及不同市场的领先滞后关系(后将由经管老师指导)。成员招新本着交流学习,共同成长的目的,协会也欢迎北京地区高校及行业人士参与我们的策略小组研究,如之前所述,要求每周投入5-10小时工作量,并能准时参加例会。清华北大北航人大北邮央财等校数学、物理、统计、计算机、电子、金融工程等专业硕博及优秀本科生,或熟悉ML、DL、RL、NLP的已工作行业人士优先。对于非北京地区的优秀同学者,如果可以保证定期持续完成指定任务,也可以参与报名。另外,协会亦正在进行量化平台的项目开发,欢迎对此项目感兴趣的具有一定前后端能力的同学参与。对以上两方面感兴趣的同学,请将个人基本信息(姓名+学校+专业+年级+电话号码+微信号+感兴趣小组(限二)+所修数学课程+所修统计课程+计算机编程基础+过往策略开发与相关实习经历+)发至协会邮箱,并最好附有个人简历。其他问题也可与作者本人私信联系。","updated":"T01:24:04.000Z","canComment":false,"commentPermission":"anyone","commentCount":62,"likeCount":111,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T09:24:04+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-3ca180e4b9f15f5a2f484_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":62,"likesCount":111},"":{"title":"【清华量协】统计套利小组Paper阅读总结","author":"wen-yi-yang-81","content":"量协的统计套利策略小组成立快一个月了,这一个月来小组成员的主要活动内容就是进行大量paper的阅读与分享。和其他策略类型不同,统计套利或是配对交易本身涉及统计学、随机过程的理论和方法比较多,所以学术界可以参考的paper也较为丰富成体系。我们这次主要阅读的是这篇review中总结的paper,涉及了最小距离法、协整法、OU-process、随机控制以及机器学习、copula、Markov Process等多种方法的理论与实证研究,截至昨天以及进行了50多篇的分享与展示。其实我之前一直就想组织此类活动,因为在量化交易中往往一个具体的算法模型coding并不难,难的是找到一个好的、新颖的idea。每篇paper里的模型与算法与结论也许并非完全可信,但至少提供了一些灵感与思路。此外,由于不同的小组成员具有跨学科多专业的背景,也有助于大家取长补短,了解之前自己比较陌生的领域,实现彼此之间的知识快速增长。我们每次活动,将要展示的同学都会用PPT做线上的语音讲解,方便海内外不同地区的同学能够获得有用的信息。下面贴几篇论文总结(再次特地感谢给力的罗同学和车同学),PS:对本小组感兴趣的同学(数学、统计master、phd背景优先)还可以私信我讨论加入事宜。","updated":"T02:18:36.000Z","canComment":false,"commentPermission":"anyone","commentCount":24,"likeCount":201,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T10:18:36+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-56bf4b185f0e82c0b877_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":24,"likesCount":201},"":{"title":"【统计套利】找到配对交易里的最优threshold","author":"wen-yi-yang-81","content":"今天我们讨论的论文是利用随机控制的方法计算配对交易中的最优threshold,所涉及的paper下载地址为:,具体的PPT展示如下(在此特地感谢克文同学):","updated":"T03:13:34.000Z","canComment":false,"commentPermission":"anyone","commentCount":6,"likeCount":79,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T11:13:34+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-f159b2b26c8b41e98dee2ea3ff1b6430_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":6,"likesCount":79},"":{"title":"【多因子模型】Barra模型讲解(1)","author":"wen-yi-yang-81","content":"在文章开始之前,先帮原CMO集训队的T大数学系妹子的Team打个招募广告:我们是一个主要由在校学生组成的量化团队,有着靠谱的IT团队(清华CS硕士*2 + 电子系phd + 姚班少年),也有优秀的策略开发人员(所有成员均来自清华\\北大\\北航\\中科院 数学、物理、计算机、电子等相关专业,包括两枚CMO金牌以及即将去Princeton MFin, Stanford ICME, Baruch MFE, Columbia MSFN, Cornell MFE, Chicago MSFN 等Top金工项目读书的同学)。目前我们有固定的Office场所进行活动,并已经基于wind的落地数据库,独立开发了一套类似worldquant websim的因子筛选、评测与策略回测平台,可以用于进行日内与日间的信号挖掘与策略研究。由于以在校学生居多,团队有着不错的交流和学习氛围,会兼顾每一个新来的同学的具体情况予以指导,同时每周都会定期组织讨论。如果你对该我们团队感兴趣,并具有以下技能之一,请将简历发送至邮箱:,成为我们的一员,与众大神一起学习进步,同时我们也会提供与市场行情相符的实习工资以及依据贡献程度的最终策略分成。如果你是非北京的优秀同学,可以考虑暑期前往(我们将提供食宿)。1. 量化策略研究:对多因子、日内或是统计套利策略的研究感兴趣并有着一定coding经验与数学水平的同学2. Python语言工程师:具有一定coding能力,熟悉Python语言(Pandas/Numpy/sklearn等库),可以长期参与系统编写与维护的同学3. 新闻舆情抓取与分析:熟悉网络爬虫或是NLP的同学Barra模型是MSCI公司开发的一个经典的金融风险控制模型,名声远播在全球有着大量的机构用户。本专栏旨在传播与讲解量化知识,故而决定从今天起,通过几篇文章陆续介绍Barra模型的构建的各步骤与相应的计算方法和细节,请大家持续关注~本文作者:涂申昊(知乎ID:)一、传统框架下的模型介绍说到金融学的投资组合模型,那么不得不提就是马科维茨的投资组合模型。从1952年诞生至今,马老师的均值-方差基本就是金融学里面神一般的模型了。至今应用十分广泛,经久不衰,折磨了一代又一代的金融学子,让无数童鞋挂在了高高的模型上。马老师的模型第一次将均值和方差来刻画股票的收益和风险,基于马老师的均值-方差模型,有了三种度量风险的方法,其实本质思想大同小异:1.1 基本风险模型即为马科维茨组合方差。在马科维茨的均值-方差理论中,投资组合的风险计算需要估计组合中每个资产的波动率及它们之间的相关系数。一般的,当组合中有N只股票的情况下,需要估计的波动率个数为N,而需要估计的相关系数的个数则为N*(N-1)/2。我们可以将所需要估计的参数总结到一个协方差矩阵V中。问题在哪?很明显,n*n维的协方差矩阵需要估计的参数太多;比如说A股市场,目前市场上超过3000只股票,也就是需要顾及大约450,0000个参数。怎么办?1.2 减少估计次数的模型令为第n和第m只股票的协方差,定义其中p是股票之间的平均相关系数;虽然这样只要估计各个股票自身收益率的协方差,但是模型忽略了类似行业或者具有相似属性的股票之间的微妙联系。既然结果又不精确了,怎么办?1.3 历史数据估计用一段时间的历史数据(比如说一年)来计算样本协方差矩阵,这也是目前各种论文中的通用方法。有什么问题:1.根据历史数据的协方差来计算股票的投资比例,也就是用纯粹的历史数据来预测未来,不言而喻,结果肯定会产生一定偏差。2.从目前的学术研究成果来看,马科维茨投资组合模型的鲁棒性非常差,协方差矩阵稍微有一点变化,股票投资组合的比例变化极大。3.如果估计月度数据,用T个时期的样本来估计一个N*N的协方差矩阵,并且要求T&N(如果T&N,那么会导致协方差矩阵奇异,无法求其逆矩阵)这就意味着,如果要估计沪深 300 指数成分月度收益率的协方差矩阵,将需要至少超过 25 年的历史数据,这在应用中显然不切实际。既然基于马科维茨的投资组合模型的协方差矩阵方法有着这样那样的问题,怎么办?二、结构化多因子模型接下来就要引入我们的主题了,结构化风险因子模型,也就是传说中的多因子模型。本文主要参考的是barra的risk handbook和Qian(2007)的Quantitative Equity Portfolio Management Modern Techniques,以及国内各大券商的研报。结构化风险因子模型利用一组共同因子和一个仅与该股票有关的特质因子解释股票的收益率,并利用共同因子和特质因子的波动来解释股票收益率的波动。结构化多因子风险模型的优势在于,通过识别重要的因子,可以降低问题的规模,只要因子个数不变,即使股票组合的数量发生变化,处理问题的复杂度也不会发生变化。结构化多因子风险模型首先对收益率进行简单的线性分解,分解方程中包含四个组成部分:股票收益率、因子暴露、因子收益率和特质因子收益率。那么,第j只股票的线性分解如下所示:也可以写成矩阵表达式:其中,Rj表示第j只股票的收益率;Xj表示第j只股票在第k个因子上的暴露(也称为因子载荷,本质上说白了就是该股票的所对应的因子值);Fj表示第j只股票第k个因子的因子收益率(即每单位因子暴露所承载的收益率);u表示第j只股票的特质因子收益率。(一般情况下,我们都用N代表股票数,K代表因子数)我们定义因子暴露(因子值)是在时刻t的结果,那么股票收益率、因子收益率和特质因子收益率均为t+1的结果。这就是一个很典型的,用因子当期值,来预测下一期因子收益率的问题了。令投资组合的权重那么投资组合的收益率为现在我们假设每只股票的特质因子收益率与共同因子收益率不相关,并且每只股票的特质因子收益率也不相关(此假设后续模型一直能用到,非常关键)。那么在上述表达式的基础上,可以得到组合的风险结构为:其中,X表示N只个股在K个风险因子上的因子载荷矩阵(N*K),F表示因子收益率的协方差矩阵(K*K),delta表示因子的特异收益率方差矩阵(N*N的对角阵)。三、多因子模型里因子的形式在有了多因子模型框架之后,就是寻找因子的问题了。通常情况下,影响股票收益率的因子通常可以分为三类:宏观经济因子、基本面因子、统计面因子(1)宏观经济因子,宏观经济因子通常只可观察的宏观经济序列数据,比如GDP、CPI、利率等。但是宏观经济因子只有一个,股票却有3000个,这无疑会带来两个问题。首先,每一只股票的收益率都要和宏观经济因子做回归,这非常麻烦。第二,宏观经济指标滞后性明显,对股票收益率的预测效果并不显著。(研报的观点,个人觉得这个理论可以商榷)(2)基本面因子,包括股票财务报表中的各种指标,以及各种K线指标也可以算作此类。(3)统计面因子,个人理解,统计面因子主要是对因子做处理之后的新因子。比如说六个月动量,12个月之后的反转,或者可以从股票收益率协方差里面提取一些参数,作为统计面的因子。一般而言,实际多因子模型中,用的最多的是基本面因子。四、多因子模型的预处理流程(1)去极值目前去极值一般有三种方法:均值方差去极值、MAD方法去极值、分位数去极值、1.均值方差去极值求每一个因子的均值和方差,大于\\mu +3\\sigma 和小于\\mu -3\\sigma 的样本值转化为\\mu +3\\sigma 和\\mu -3\\sigma 。2.MAD法去极值MAD 法是针对均值标准差方法的改进,把均值和标准差替换成稳健统计量,样本均值用样本中位数代替,样本标准差用样本MAD代替:通常把偏离中位数三倍MADe(如果样本满足正态分布,且数据量较大,可以证明\\sigma \\approx 1.483*MAD)以上的数据作为异常值。和均值标准差方法比,中位数和MAD的计算不受极端异常值的影响,结果更加稳健。3.分位数去极值分位数去极值是一种经验处理方法,假设Q1和Q3分别为数据从小到大排列的25%和 75%分位数,记IQR=Q3-Q1, 把区间里的数据标识为异常点。分位数是稳健统计量,因此分位数方法对极值不敏感,但如果样本数据正偏严重,且右尾分布明显偏厚时,分位数去极值方法会把过多的数据划分为异常数据。所以,有了改进的分位数去极值法:定义:然后定义了调整的上下限:在区间上的数据被定义成了异常值。(2)标准化每个因子做完了去极值之后,就要消除各个因子之间的量纲影响,进行标准化。标准化的步骤通常都是zscore标准化法,非常基础,没什么可说的。(3)中性化中性化的内容barra框架中并未提及,但是在A股市场中,各家研报都认为中性化仍然很有必要的。首先:A股票行业轮动明显,行业热点之间切换迅速,量化模型也很难有效预测轮动规律;其次,A股的小市值个股占比显著高于国外市场小市值个股具有高波动率、高收益率的特性,为了降低投资组合的波动性和回撤,需要进行行业中性化和市值中性化处理。个人认为,如果说要博取更大的投资收益,并承担更高风险的话。市值中性化是可以不用去做的,因为A股市场最近十几年以来,小市值因子至少有20倍以上的收益。并且到2016年,小市值因子的有效性也没有消失。2017年初,小市值因子确实出现了失效的情况,但是未来会不会有效,这个就是玄学了。不做市值中性化的话,完全可以建立一个市值轮动模型进行替代。行业中性化也是同理。但是如果想找到稳定的alpha因子,那么市值中性化和行业中性化还是要做的。行业中性化通常有两种办法:1.简单的标准化法利用申万行业指数,将各个行业内股票的因子进行标准化处理,即减均值除标准差。2.回归取残差法将因子值作为y,行业哑变量作为x,进行线性回归,然后回归模型的残差即为行业中性化后的因子值。市值中性化因为市值因子是连续的,所以采用的是回归取残差法,因子值作为y,市值作为x。五、因子收益率向量的估计因子找好之后,就进入了估计因子收益率的部分了。在barra的框架中,因子收益率通常是日数据。利用第二部分的公式因子暴露X已知,因子收益率R已知,所以针对每一天的截面数据进行回归,X取当天的因子值,R取下一天因子的收益率。就可以估算出当天的因子收益率了。当然,有个非常关键的问题,又扯到之前的假设上来了。Barra模型认为,每只股票的特质收益率u不相关,这个假设在计量经济学的理论框架里,造成了一个非常明显的问题,异方差性。那么怎么估计因子收益率呢,只能用WLS方法了(加权最小二乘)。问题又来了,加权最小二乘的算法中,权重怎么取?通常的计量经济学方法是取残差平方的倒数,但是barra模型中,这个权重取了根号市值,这个问题是个玄学。利用WLS方法,可以得到因子收益率的最终表达式:其中W是加权最小二乘法的权矩阵。参考文献:国泰君安,数量化专题之五十七:基于组合权重优化的风格中性多因子选股策略爱建证券,多因子系列之一:多因子模型梳理探索华泰证券,多因子系列之一:华泰多因子模型体系初探东方证券,选股因子数据的异常值处理和正态转换——《金工磨刀石系列之二》Barra,USE4Qian, \nQuantitative Equity Portfolio Management, modern techniques and\napplications","updated":"T09:57:30.000Z","canComment":false,"commentPermission":"friends","commentCount":10,"likeCount":171,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T17:57:30+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-b98c34cbb4dc2_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":10,"likesCount":171},"":{"title":"【多因子模型】Barra模型讲解(2)","author":"gan-dao-bu-shuang","content":"接着第一部分继续,第一部分地址:第一部分主要说的是多因子模型的框架,这一部分主要谈谈多因子模型具体实施的步骤一、因子有效性的验证方法IC(信息系数)方法IC的最初始的定义可以写成:IC=corr(f,R),表示的是因子本期预计收益率与下一期真实收益率之间的相关系数,但是本期的收益率还要通过线性回归来进行估计,所以通常情况下,为了简化我们的估计步骤,我们定义IC=corr(X,R),X表示的是当期因子值,R表示下一期的对应的收益率。一般情况下,IC的计算是日频的,利用市场上三千多只股票的因子暴露与第二天该股票的收益率进行计算。但是这里需要说明的是,由于因子值和因子收益率这两个序列并不服从一定的分布函数(如正态分布、T分布等),所以使用平时计算相关性的公式所以这里采取了非参数的方法,所以这里计算因子的IC值,采取的spearman秩和相关性,具体的包在Python的scipy.stats包中的spearmanr函数。一般来说,IC值大于0.03,就认为这个因子的有效性比较高了。2. Barra方法Barra提供了一系列评价因子是否有效的方法:1.单因子回归方程系数T检验的绝对值均值,通常该值大于2认为是比较理想的结果2.单因子回归方程系数T检验绝对值均值大于2的占比,用于解释因子显著性的分布特征3.利用回归出的因子收益率,计算因子的年化收益率4.计算因子的年化收益率波动率5.计算因子收益率/因子波动率6.计算因子收益率与基准收益率(如沪深300)的相关性,相关性越低越好7.因子的自稳定系数其中v_{n}^{t} 表示股票n在第t天的WLS回归所采用的加权权重,即第一部分说的市值或者是残差。通常情况下,因子自稳定系数大于0.9算是比较不错的,小于0.8则认为因子并不具有一定的稳定性。3. 因子排序法将因子排序,分成五档或者十档,看看每一档的走势。不过这种算法有些问题,因为每一档因子在其他因子上的暴露是不确定的。比如说,将市值因子分成十档,看每一档上的股票的平均走势,这种方法虽然控制了市值因子的暴露,但是对于其他因子,如行业,却没有控制暴露,所以这种方法要慎用。4. 控制因子暴露的因子排序法原理同3,只不过增加了约束条件,控制了其他因子在评测因子各个档上的暴露。但是,个人并不觉得这个方法用起来方便,因为通常情况下,多因子模型要进行全市场选股的,全市场3000多只股票,解一个三千多个变量的优化方程,其鲁棒性还是存在问题的。二、因子取舍与因子合成通过第一部分说的三种方法,就可以得到挑选出来一些因子了,接下来就是对于因子的筛选工作了。在计量经济学中,多元线性回归要考虑到多重共线性问题;所以,对于相关性较高的因子,可以采用两种方法进行处理:(1)根据因子的有效性进行排序,挑选最有效的因子进行保留,其余的就直接删掉了(2)对因子集合进行合成,尽可能多的保留更多有效因子信息因子合成的主要方法:(1)等权法(相关性高的因子等权重进行合成,合成一个复合的因子)(2)历史收益率加权法利用因子一段时期的历史收益率作为权重进行加权,合成一个复合因子(3)历史信息比例(IR)法利用一段时间因子的信息比例(即因子收益率均值/因子收益率波动率)作为权重进行加权(研报中比较推荐这种方法)(4)PCA(主成分分析)PCA是一种线性降维的方法,但是这种方法在金融中慎用,因为PCA会破坏因子之间的关系。三、通过多因子模型进行股票选择基本上讲到这里,多因子框架基本的逻辑就很清楚了,再回顾一下:step1: 因子选择,去极值(三种方法:Zscore标准化、分位数标准化、MAD标准化)step2: 中性化(行业中性化、市值中性化)step3: 因子有效性检验(IC法、BARRA法)step4: 相关性强的因子合成新的复合因子(等权法、历史收益率加权法、历史信息比例加权法、PCA)step5: 因子加权进行股票选择对于如何进行因子加权,最经典的是参考文献6提出的IR方法。IR方法令:其中,v表示待估计的因子权重值,是个1*K维的向量,K是因子数量,\\Sigma_{ic}表示日频IC的协方差矩阵,\\bar{IC} 表示IC的均值。解下列的优化问题,求v的值:解得V之后,用V乘以各个因子暴露,加权求和,得到的结果就是每只股票最终的得分。将股票得分进行排序,就可以选择前30、50只股票进行投资了。2. WLS收益率加权法多因子模型(一)介绍了利用WLS估计因子的日收益率,将估计的因子收益率乘上因子暴露值,再加上自身的特异收益率u,就可以算出来每只股票的预计收益率了。这时候可以选择预计收益率前30、50的股票进行投资。这样说有问题吗?当然是有的,因为此时,你要进行了投资了,你只能知道历史的因子日收益率,知道今天的因子暴露,可是你并不知道,今天各个因子的收益率是多少,那么怎么办?估计呗,四种方法估计因子今天的收益率。历史平均法这个不用说了,简单平均即可。EWMA(指数加权平均法)本质思想是衰减的平均值法,即越靠近预测日的值所占的权重越大。时间序列方法(AR、ARMA)模型的具体推倒参阅蔡瑞胸《金融时间序列分析》。其他牛逼的方法(随机森林、深度学习等)比如说X可以是前10天的收益率,Y是下一天的收益率,这样就可以去用机器学习的方法做。3. 各种牛逼的方法开始发挥用处了第三种方法只是提供个人的一种思路,这个时候,是不是就可以尝试RNN及各种RNN改进版这些东西了?其中X表示每只股票的因子暴露,Y则是每只股票的收益率,这个收益率可以是第二天的,也可以是未来几天平均的;市场上所有的股票的一段时间的因子数据合成一个大的train_X矩阵,train_Y就是对应的收益率,数据量足够大,可以用深度学习试试,不过效果不一定好。当然,也有人这么做的,上了实盘。除了RNN,其他的XGBOOST,Extratree、Randomforest是不是也都可以一试?四、barra框架下的多因子风险模型这一部分,着重讲解Barra框架下的股票投资模型。其实到了第三部分,多因子框架的大体规则和流程都说的差不多了,这部分主要讲讲barra的多因子模型是怎么估计。回到第一部分多因子最核心的公式上来:R=Xf+ubarra风险估计分成两个部分:第一是因子收益率的协方差矩阵,第二是每只股票的特异收益率1. 因子收益率的协方差矩阵估计首先,利用日频因子的历史收益率,通过EWMA(加权移动平均)计算日频率的因子收益率协方差矩阵F其中,指数衰减权重\\lambda =0.5 ^{1/\\iota } ,表示赋予越靠近当前日期越高的权重,h表示样本长度。之后呢,虽然使用了EWMA方法,但是barra认为,这个时候协方差矩阵会存在风险的持续性高估或者低估问题,要进行调整,所以引入了因子截面偏差统计量B_{t}^{F} 和因子波动率乘子\\lambda_{F} 定义:K是因子个数,f_{kt} 表示第k个因子第t的收益率,\\sigma_{kt} 表示第k个因子从开始到第t天的收益率的波动率。通常情况下,B_{t}^{F} 应当等于1,如果B_{t}^{F} 大于1,则证明因子预测的风险过小;(国泰君安研报里面写的是过大,个人觉得是错的,barra的use里面写的就是过小,因为只有\\sigma_{kt} 小了,B_{t}^{F} 才应该大)。之后,定义:这里的\\lambda_{F} 计算,也是EWMA方法,Wt表示的是EWMA的衰减权重。最后,就得到了我们调整之后的因子协方差矩阵:\\tilde{F} =F*\\lambda_{F}^{2} 然后,我个人再说一句我的观点,国泰君安的研报后面说用Newey-West方法将日频数据调整到月频,我认为这又错了,Newey-West是调整异方差性和自相关性的方法(接下来会细说),与日频、月频数据无关,而且barra的USE4中并没有这一部分的叙述。2. 股票特异性风险估计股票的特异性风险估计基本算是barra里面最复杂的一个部分了。我在这仅仅就是说一说我对于barra每一部分的个人理解。step1: 同因子收益率协方差矩阵一样,进行EWMA;h是EWMA的样本长度,j表示第j只股票。step2:Newey-West调整定义:C_{n}^{NW} 为Newey-West调整方法,后面大括号里的,就是EWMA之后的特异矩阵。问题来了,这个Newey-West调整到底如何应用?我对于这个问题也是百思不得其解,先贴出Newey-West方法的权威解释,来自蔡瑞胸的《金融时间序列分析》可以看到,这里的Newey-West是针对残差的异方差性或者自相关性,调整了待估参数的协方差矩阵,显然,这与barra的Newey-West调整方法不符的。最后,我在参考文献7中找到了一种Newey-West调整的方法,我也不知道正确与否,但是至少能够解释的通Step2的过程:参考文献7认为其中:Zt是一列的时间序列,长度为T期,且E(Z_{t} )=u,m是Newey-West调整的滞后期的长度,Bartlett权重函数w(j,m)=1-[j/(m+1)],当j&=m的时候,w(j,m)的取值为0。m的取值可以按照蔡瑞胸的说法。step3: 贝叶斯压缩barra给这部分命名叫做贝叶斯压缩,这部分认为,单只股票的特异性风险不仅取决于自身,还取决于与它市值类似的股票特异性风险的均值。定义最终的矩阵公式:其中,v_{n} 是加权系数,\\hat{\\sigma_{n} } 表示step2计算出的股票n的协方差,然后,定义w_{n} 表示的是市值加权系数;这里引入市值因子,假设将市值因子分成了十档,每一档上有若干只股票。所以这里的Sn也有十个,分别是每一档市值上的股票风险值\\sigma 的加权平均,加权系数取决于市值。这里,q是常数。\\Delta_{\\sigma} (s_{n} )就可以理解成每一档市值上股票的方差。step4:引入特异截面偏差统计量B_{t}^{F} 和特异波动率乘子\\lambda_{F} 之后的值这部分内容与因子收益率协方差矩阵的风险调整类似,首先定义特异截面偏差统计量:这里的\\sigma_{nt} 是step3中计算出的第n只股票第t天的波动率,u_{nt} 是第n只股票第t天的特异收益率,w_{nt} 是股票n第t天采用WLS回归时的加权系数。再定义特异波动率乘子:需要说明一点的是,这里的w_{t} 与之前因子波动率乘子的w_{t} 相同,都是定义一个EWMA的衰减值。最后得到调整之后的股票特异收益率:经过四步之后,barra的特异风险矩阵的计算也算是结束了。写在最后的一点感悟最后,再提出一个问题,barra的风险模型可以用来做什么?个人认为,barra的风险模型理论上可以用来选择股票的,但是全市场三千多只股票,如果单纯的去解一个均值-方差模型这样的一个凸优化问题,显然会带来很大的偏差。所以barra模型,我认为可以在得到了想要的30、50只股票之后,计算应当以什么样的比例投资于这三五十只股票。多因子模型(一)基本算作是对券商研报的总结汇总,多因子模型(二)算是我个人对于模型的一些理解了。欢迎大家拍砖。参考文献:1. 国泰君安,数量化专题之五十七:基于组合权重优化的风格中性多因子选股策略2. 爱建证券,多因子系列之一:多因子模型梳理探索3. 华泰证券,多因子系列之一:华泰多因子模型体系初探4. 东方证券,选股因子数据的异常值处理和正态转换——《金工磨刀石系列之二》5. Barra,USE46. Qian, \nQuantitative Equity Portfolio Management, modern techniques and\napplications7. Deepa Dhume Dattay, Wenxin Du,Nonparametric HAC Estimation for\nTime Series Data with Missing Observations8. 蔡瑞胸,《金融时间序列分析(第三版)》9. 禹悰廉,基于特征修正协方差矩阵的中国A股市场多因子模型构建10. 禹悰廉,股票收益率协方差矩阵的特征修正方法11. Jose Menchero ,Jun Wang ,D.J. Orr,
Eigen-Adjusted Covariance Matrices,Improving\nRisk Forecasts for Optimized Portfolios ","updated":"T07:19:25.000Z","canComment":false,"commentPermission":"anyone","commentCount":8,"likeCount":60,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T15:19:25+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-e1e07b63bb2b36ac5f696c679f1e6fcc_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":8,"likesCount":60},"":{"title":"【策略开发】高频信号挖掘与组合python库招募内测用户","author":"wen-yi-yang-81","content":"最近,文兄开发了一个高频信号挖掘与组合python包,实现了高频信号的挖掘与组合的功能,基于的数据是A股和比特币数据。可能有的同学会问A股怎么做高频,而实际上目前是有一些方法可以实现A股的T+0策略的,比如融券或者使用alpha底仓,在今年alpha有所萎靡的情况下,日内策略的表现反而不错。高频策略的种类很多,比如做市策略等。而我们这个包主要关注的是挖掘信号并进行信号组合的这种标准开发流程,这种开发思路也是国外很多顶级的高频交易对冲基金里使用很多的一种方法。对于这种方法来说,比较关键的是信号的数量、质量和组合方式。一个信号说白了就是空间和时间上的一种表达式,目的是为了刻画标的内部的规律。当然,具体谁能刻画的好和天赋、运气都有一定的关系:认识的一个大三的学弟已经做出来了实盘在跑的高频期货策略,但也有很多清北的phd甚至连一个好的信号都挖掘不出来。我们这个包主要就是服务于这种策略开发方式,把数据调用、处理、信号生成、评价、组合和回测都融合了起来,目的是最大程度地减轻了开发者的负担,由于一开始主要是给自己团队内部成员用的,所以也比较遵循做量化的人的习惯。目前这个python包主要包含以下功能:根据平均涨跌幅的大小、流动性、停牌的时间,挑选了20只比较容易做的股票作为信号的验证标的,使用过去2016.5 - 2017.5的数据作为回测周期,数据已经清洗完成,频率为3S。此外,我们还加入了比特币的数据(有60档甚至200档的盘口)。用户可以自由查看这20只股票以及比特币的数据,进行处理与信号的尝试,我们自己封装了10几个常用的生成信号的方法(比如滚动地对过去一定周期(可滞后)取均值、加权平均、最大值、计数等),之后还会加入更多时间序列和回归的一些方法。用户可以选择使用快速评价和全面评价两种方法,不同的是快速评价迭代的股票数会少一些,主要是出于速度上的考虑,便于大家尝试信号。评价方法有线性的(R^2)也有非线性的(树模型的importance等),也考虑了和过去比较好的信号之前的相关性和预测提升。同时,用户也可以设定阈值,观察不同信号在不同时间周期的收益均值与方差的变化规律图,并做一些可视化的操作。最后,除了信号挖掘用户也可以获取过去表现比较好的信号进行自由的组合,然后利用我们专门编写的高频的回测函数衡量策略的表现。由于考虑到下载数据比较慢,所以我们目前希望大家使用我们的高性能服务器,远程访问jupyter notebook服务器,进行开发。此外资源有限,故而不能招太多的同学,所以希望有兴趣的同学把个人介绍(有简历更好)发送到邮箱:,我们会在一周内集中回复。目前高频这块已经有了几个同学(清北的数学、物理phd、计算机硕士等),希望能找到更多有能力并对高频策略感兴趣的小组,实现一个好的交流氛围,促进互相的学习与进步~","updated":"T10:58:43.000Z","canComment":false,"commentPermission":"review","commentCount":12,"likeCount":45,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T18:58:43+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-450def2a55e2b600eb4e24_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":12,"likesCount":45},"":{"title":"【Alpha-Nebula】学术小组启动与招人","author":"wen-yi-yang-81","content":"之前,文兄曾经在2017年寒假期间组织过一次关于量化交易的学术小组,当时分了一些课题进行了相关paper的阅读。很可惜由于开学期间着力去组织策略小组的活动,所以使得学术小组的工作有所搁浅。不过,在统计套利策略小组的活动中,由于相关的paper很多,我们实际上进行了大量的学术交流,20名组员在2个月时间内阅读完成了几十篇paper的阅读,相关的活动情况见链接:。最近,受到主管中国量化行业研报的郑总启发,希望能重新开展学术小组的活动。我们的目标是针对不同领域定期组织学术阅读并撰写相关笔记,同时通过此专栏进行发表以充分与量化爱好者交流(其中优秀的文章还有机会发表在中国量化行业研报上)。此外,我们还会组织PPT的互讲,达到定期的量化研讨小峰会的效果。除了文兄本人,主要还有北大的霍同学(北大光华+数双+Princeton MFin)和清华数学系的原CMO集训队少女一同帮忙组织本小组的活动,目前暂定的几个研究主题如下:Alpha策略(8人,北大物理phd,Princetn Mfin,CMU MSCF,哥大金数硕士在读的同学等)统计套利组(7人,包括清华数学phd、Stanford ICME phd, Stanford Math phd等)金融物理组(3人,主要为北大、清华、人大物理phd)期权定价与波动率分析(5人,行业人士以及哥大金数等金工硕士项目的同学等)时间序列与参数估计(6人,包括CMO金牌,上财、西交的统计phd等)小波分析组(2人,电子科技大信号处理专业phd)高频策略组(7人,密歇根统计Master,上交/浙大 Math,巴黎九大金融phd等)ML/DL/RL/NLP组(13人,清华计算机系/姚班/NOI金牌,MIT/CMU CS phd,CMU ML Master,Penn State ML phd等)对本小组感兴趣同时具有相关专业背景和一定学术阅读能力的同学可以将简单的个人信息(姓名+学校+专业+年级)通过私信发送给我,也可以发到我的邮箱:期待与大家一起交流,进步!","updated":"T02:34:11.000Z","canComment":false,"commentPermission":"review","commentCount":12,"likeCount":67,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","titleImage":"/v2-ca3e455c0e864f9f99e1f3_r.jpg","links":{"comments":"/api/posts//comments"},"topics":[{"url":"/topic/","id":"","name":"量化交易"},{"url":"/topic/","id":"","name":"宽客 (Quant)"},{"url":"/topic/","id":"","name":"金融工程学"}],"adminClosedComment":false,"href":"/api/posts/","excerptTitle":"","sourceUrl":"","pageCommentsCount":12,"snapshotUrl":"","publishedTime":"T10:34:11+08:00","url":"/p/","summary":"","reviewingCommentsCount":0,"meta":{"previous":null,"next":null},"commentsCount":12,"likesCount":67},"":{"title":"【Alpha-Nebula】混合决策树神经模糊系统&利用Google数据与深度学习预测波动率","author":"wen-yi-yang-81","content":"欢迎大家关注本专栏:这周五我们刚结束第一次学术交流,从之前提交ppt的同学中最终挑选了8篇论文进行展示,其中4篇是关于ML/DL/RL的,2篇关于Alpha的,1篇关于时间序列的以及1篇是关于金融物理的。这篇文章主要放出两篇ML/DL/RL组的论文ppt供大家学习。【1】A Stock market trend prediction system using a hybrid decision tree-neuro-fuzzy system【2】Deep Learning Stock Volatility with Google Domestic Trends ","updated":"T01:29:50.000Z","canComment":false,"commentPermission":"review","commentCount":3,"likeCount":54,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T09:29:50+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-0985bab3ca1bba22e821e94a_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":3,"likesCount":54},"":{"title":"【Alpha-Nebula】利用RBF方法提取特征进行股票预测&高频交易中领先滞后关系的实证研究","author":"wen-yi-yang-81","content":"首先,欢迎大家关注本专栏:这篇文章紧接上一篇的两篇ML论文,分别介绍了由ML组和金融物理组展示的两篇paper【1】Feature Extraction Using Restricted Boltzmann Machine for Stock Price Prediction【2】High Frequency Lead/lag Relationships Empirical Facts","updated":"T00:01:51.000Z","canComment":false,"commentPermission":"review","commentCount":2,"likeCount":39,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T08:01:51+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-dac541b26f34_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":2,"likesCount":39},"":{"title":"【Alpha-Nebula】基于深度增强学习的量化交易","author":"wen-yi-yang-81","content":"Alpha-Nebula学术小组的第二次交流活动已经结束,大家又分享了许多有趣的paper,今天带给大家的是一篇目前比较火热的方法(深度增强学习)在量化方面的运用。欢迎大家持续关注本专栏:,也欢迎对学术小组感兴趣的同学持续加入我们的交流活动。","updated":"T00:08:32.000Z","canComment":false,"commentPermission":"review","commentCount":2,"likeCount":58,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T08:08:32+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-7f6da74af909aedb4f092_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":2,"likesCount":58},"":{"title":"【Alpha-Nebula】微博情绪能否预测中国股票市场?","author":"wen-yi-yang-81","content":"首先,欢迎大家关注我们的专栏:,这次讲述的paper是“Can Online Emotions Predict the Stock Market in China?”,在这篇文章里,作者探寻了微博情绪与股票市场的价格波动之间的关系。数据处理首先,由于作者观察到非交易日的微博数据明显减少,故而作者移除了非交易日的微博舆情数据。其次,作者之前在2012年发表过一篇paper:Zhao, J., Dong, L., Wu, J., Xu, K.: Moodlens: an emoticon-based sentiment analysissystem for chinese tweets. In: Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. . ACM (2012)。在这篇paper里讲述了如何使用Naive Bayes classifier将文本数据标记成5种情感:anger, sadness, joy, disgust and fear。而在本篇文献中,作者就是用同样的方法标记了微博数据,同时画出了这5种情感在一年间的占比波动情况:这幅图总的来说还是有一定意义的,比如我们可以看到,在2015年的七月,由于股市大跌悲观情绪到达了顶点。相关性分析之后,作者做了五种情绪与OHLCV(开盘价、最高价、最低价、收盘价、交易量)的相关性分析:格兰杰因果检验从上面的图里我们可以看出五种情绪的微博状态对OHLCV的影响。我们发现anger类的状态几无预测能力,Volume和情绪关系不大。此外,以一天为预测周期一天来看,fear类显著影响开盘价,sadness类主要影响最高最低价,而joy类影响开盘和最高价,disgust类影响收盘和最低价,都还算是make sense。当然,通常来说我们关注的都是收盘价Close的变动情况,所以disgust情绪的价值似乎是最大的。分类器与预测作者最后使用了几种分类器进行股票价格趋势的预测,结果如下图:其中Target(3)表示target有三类(-1,0,1),而Target(2)表示target有两类(-1,1)。这个结果大家作为参考即可,一般来说SVM的分类效果也是优于线性分类器的但是稳定性却差一些。参考文献Zhou Z, Zhao J, Xu K. Can Online Emotions Predict the Stock Market in China?[C]//International Conference on Web Information Systems Engineering. Springer International Publishing, 2.","updated":"T02:10:30.000Z","canComment":false,"commentPermission":"review","commentCount":11,"likeCount":27,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":true,"rating":"none","sourceUrl":"","publishedTime":"T10:10:30+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-0820852eab828fc0b5a8d034b34e2959_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":11,"likesCount":27},"":{"title":"【Alpha-Nebula】基于社交网络的股票预测研究","author":"wen-yi-yang-81","content":"欢迎大家持续关注我们的专栏Alpha-Nebula,我们会持续分享高质量的量化相关内容。这篇文章我们介绍的是一篇叫做“Study of Stock Prediction Based on Social Network”的Paper,作者针对市场,爬去了新浪微博和股吧的数据进行了一些有趣的研究。Social Behavior Graph作者爬完了这两个社交平台的数据之后,通过Hamming Distance和时间间隔来辨别不同帖子之间的similarity:即如果Hamming Distance小于2,同时两个贴的时间间隔小于1小时,那么就认为这两个贴是可以合并到一个主题的。最后,作者画出了一张social behavior graph:在这张图里,可以抽离的信息或者说特征有以下几种:Topics: 即关于一个股票话题的总数目Comments: 关于股票所有评论的数目Users: 参与这只股票讨论的用户数目Nodes: 总共的图节点,等于话题数+帖子数+用户数Edges: 图里所有的边数,代表了用户的活跃程度Degree_avg: 所有节点的平均degree,可以通过Edges/Nodes算出,也}

我要回帖

更多关于 所有牙齿都会换吗 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信