[亚马逊股票]如何用大数据炒股

安全系列新鲜出炉,回复“安全”看新鲜的泄密、黑客、攻防事例。

财新传媒授权转载

摘自:金融混业查询(caixinfinance),财新传媒出品金融混业大潮势不可挡,各类金融立异层出不穷,财新秉承新闻专业主义精神,供给客观及时的金融职业报导精粹,同享深度专业的谈论点睛。

记者:李小晓

咱们现在生活在一个数据爆破的国际里。百度每天呼应逾越60亿次的查找恳求,日处理数据逾越100PB,相当于6000多座我国国家图书馆的书本信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的城外,隐藏着很多大公司的信息存储中心,24小时废寝忘食地运转着。

克托?迈尔-舍恩伯格在《大数据年代》一书中以为,大数据的中心便是猜测,即只需数据丰盛到必定程度,就可猜测作业产生的可能性。例如,“从一个人乱穿马路时跋涉的轨道和速度来看他能及时穿过马路的可能性”,或许经过一个人穿过马路的速度,猜测车子何时应该减速然后让他及时穿过马路。

那么,如果把这种猜测才能使用在股票出资上,又会怎么?

现在,美国现已有许多对冲基金选用大数据技能进行出资,而且收成甚丰。我国的中证广发百度百发100指数基金(下称百发100),上线四个多月以来已上涨68%。

和传统量化出资相似,大数据出资也是依托模型,但模型里的数据变量几许倍地添加了,在原有的金融结构化数据根底上,添加了交际言辞、地理信息、卫星监测等非结构化数据,而且将这些非结构化数据进行量化,然后让模型能够吸收。

因为大数据模型对本钱要求极高,业界人士以为,大数据将成为同享渠道化的服务,数据和技能相当于食材和锅,基金司理和剖析师能够经过渠道制造自己的战略。

量化非结构数据

不要小看大数据的身手,正是这项刚刚鼓起的技能现已发明了很多“料事如神”的奇观。

2014年,百度用大数据技能猜测命中了全国18卷中12卷高考作文题目,被网友称为“神猜测”。百度公司人士表明,在这个大数据池中,包含互联网堆集的用户数据、历年的命题数据以及教育组织对命题方向作出的判别。

在2014年巴西国际杯竞赛中,Google亦经过大数据技能成功猜测了16强和8强名单。

从当年英格兰报社的信鸽、费城股票买卖所的信号灯到报纸电话,再到现在的互联网、云核算、大数据,前沿技能敏捷在出资范畴落地。在股票战略中,大数据日益锋芒毕露。

做股票出资战略,需求的大数据能够分为结构化数据和非结构化数据。结构化数据,简略说便是“一堆数字”,一般包含传统量化剖析中常用的CPI、PMI、市值、买卖量等专业信息;非结构化数据便是交际文字、地理位置、用户行为等“还没有进行量化的信息”。

量化非结构化便是用深度模型替代简略线性模型的进程,其间所触及的技能包含天然语言处理、语音辨认、图像辨认等。

金融大数据渠道-通联数据CEO王政表明,通联数据选用的非结构化数据能够分为三类:第一类和人相关,包含交际言辞、消费、去过的地址等;第二类与物相关,如经过正在行进的船舶和卡车判别物联网状况;第三类则是卫星监测的环境信息,包含汽车流、港口装载量、新的修建开工等状况。

卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收买了卫星公司Skybox,然后能够取得施行卫星监测信息。

结构化和非结构化数据也常常彼此转化。“结构化和非结构化数据能够形象了解成把一切数据装在一个篮子里,依据使用战略不同彼此转化。例如,在查找频率查询中,用户查找便是结构化数据;在金融战略剖析中,用户查找便对错结构化数据。”百度公司人士表明。

华尔街拿着丰盛薪水的剖析师们还不知道,自己的雇主现已将很多本钱投向了替代自己的机器。

2014年11月23日,高盛向Kensho公司出资1500万美元,以支撑该公司的大数据渠道建造。该渠道很像iPhone里的Siri,能够快速整合海量数据进行剖析,而且答复出资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块形成什么影响?”

在Kensho处理的信息中,有80%是“非结构化”数据,例如方针文件、天然事情、地理环境、科技立异等。这类信息一般是电脑和模型难以消化的。因而,Kensho的CEO Daniel Nadler以为,华尔街曩昔是依据20%的信息做出100%的决议方案。

已然提到高盛,趁便提一下,这家华尔街老牌投行现在对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前出资了8000万美元给小额融资渠道On Deck Capital。这家公司的中心竞赛力也是大数据,它使用大数据对中小企业进行剖析,然后选出值得出资的企业并以很快的速度为之供给短期贷款。

捕捉商场心境

上述许多非结构化数据,归根到底是为了取得一个信息:商场心境。

在采访中,2013年诺贝尔经济学奖得主罗伯特?席勒的观念被很多采访目标引述。能够说,大数据战略出资的创业者们无一不是席勒的信仰者。

席勒于上世纪80年代规划的出资模型至今仍被业界称道。在他的模型中,首要参阅三个变量:出资项目方案的现金流、公司本钱的预算本钱、股票商场对出资的反响(商场心境)。他以为,商场自身带有片面判别要素,出资者心境会影响出资行为,而出资行为直接影响财物价格。

可是,在大数据技能诞生之前,商场心境一直无法进行量化。

回忆人类股票出资开展史,其实便是将影响股价的因子不断量化的进程。

上世纪70年代曾经,股票出资是一种定性的剖析,没有数据使用,而是一门片面的艺术。跟着电脑的遍及,很多人开端研讨驱动股价改变的规则,把传统基本面研讨办法用模型替代,市盈率、市净率的概念诞生,量化出资由此鼓起。

量化出资技能的鼓起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球出资者(BGI)在上世纪70年代就以其逾越同行的电脑模型成为全球最大的基金办理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除办理费和出资收益分红等费用后仍高达34%,可谓其时最佳的对冲基金,之后十多年该基金财物亦非常安稳。

“从片面判别到量化出资,是从艺术转为科学的进程。”王政表明,上世纪70年代曾经一个基本面研讨员只能重视20只到50只股票,掩盖面很有限。有了量化模型就能够掩盖一切股票,这便是一个大的腾跃。此外,跟着核算机处理才能的开展,信息的用量也有一个腾跃改变。曩昔看三个目标就够了,现在看的目标越来越多,做出的猜测越来越精确。

跟着21世纪的到来,量化出资又遇到了新的瓶颈,便是同质化竞赛。各家组织的量化模型越来越趋同,导致出资作用同涨同跌。“能否在看到报表数据之前,用更大的数据寻觅规则?”这是大数据战略创业者们企图处理的问题。

所以,量化出资的多米诺骨牌总算触碰到了席勒理论的第三层变量——商场心境。

核算机经过剖析新闻、研讨报告、交际信息、查找行为等,凭借天然语言处理办法,提取有用的信息;而凭借机器学习智能剖析,曩昔量化出资只能掩盖几十个战略,大数据出资则能够掩盖不计其数个战略。

依据互联网查找数据和交际行为的经济猜测研讨,已逐步成为一个新的学术热门,并在经济、社会以及健康等范畴的研讨中取得了必定作用。在本钱商场使用上,研讨发现查找数据可有用猜测未来股市活跃度(以买卖量目标衡量)及股价走势的改变。

海外就有学术研讨指出,公司的称号或许相关关键词的查找量,与该公司的股票买卖量正相关。德国科学家Tobias Preis就进行了如此研讨:Tobias使用谷歌查找引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为查询区间,发现谷歌趋势数据的公司称号查找量和对应股票的买卖量,在每周一次的时间尺度上有高度关联性。也便是说,当某个公司称号在谷歌的查找量活动添加时,不管股票的价格是上涨或许跌落,股票成交量与查找量添加;反之亦然,查找量下降,股票成交量下降。以标普500指数的样本股为根底,依据上述战略构建的模仿出资组合在六年的时间内取得了高达329%的累计收益。

在美国商场上,还有多家私募对冲基金使用Twitter和Facebook的交际数据作为反映出资者心境和商场趋势的因子,构建对冲出资战略。使用互联网大数据进行出资战略和东西的开发现已成为国际金融出资范畴的新热门。

保罗?霍丁办理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规划约为4000万美元, 2013年出资收益高达23.77%。该基金的出资标的包含流动性较好的股票及股票指数产品。

通联数据董事长肖风在《出资革新》中写道,Derwent的出资战略是经过实时盯梢Twitter用户的心境,以此感知商场参与者的“贪婪与惊骇”,然后判别商场涨跌来获利。

在Derwent的网页上能够看到这样一句话:“用实时的交际媒体解码隐藏的买卖时机。”保罗?霍丁在基金宣传册中表明:“多年以来,出资者现已遍及承受一种观念,即惊骇和贪婪是金融商场的驱动力。可是曾经人们没有技能或数据来对人类情感进行量化。这是第四维。Derwent便是要经过即时重视Twitter中的大众心境,辅导出资。”

另一家坐落美国加州的对冲基金MarketPsych与汤普森?路透协作供给了散布在119个国家不低于18864项独立指数,比方每分钟更新的心境状况(包含达观、郁闷、高兴、惧怕、气愤,乃至还包含立异、诉讼及抵触状况等),而这些指数都是经过剖析Twitter的数据文本,作为股市出资的信号。

此类基金还在不断涌现。金融危机后,几个台湾年青人在波士顿组建了一家名为FlyBerry的对冲基金,标语是“Modeling the World(把国际建模)”。它的出资理念悉数依托大数据技能,经过监测商场言论和行为,对出资做出秒速判别。

关于交际媒体信息的量化使用,在股票出资之外的范畴也很常见:Twitter自己也非常重视信息的开发发掘,它与DataSift和Gnip两家公司达成了一项出售数据拜访权限的协议,出售人们的主意、心境和交流数据,然后作为顾客的反应定见汇总后对商业营销活动的作用进行判别。从事相似作业的公司还有DMetics,它经过对人们的购物行为进行剖析,寻觅影响顾客终究挑选的纤细原因。

回到股票国际,使用交际媒体信息做出资的公司还有StockTwits。翻开这家网站,首要映入眼帘的宣传语是“看看出资者和买卖员此时正怎么评论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,首要面向剖析师、媒体和出资者。它经过机器和人工相结合的手法,将关于股票和商场的信息收拾为140字以内的短消息供用户参阅。

此外,StockTwits还整合了交际功用,并作为插件能够嵌入Twitter、Facebook和LinkedIn等首要交际渠道,让人们能够容易同享出资信息。

另一家公司Market Prophit也很风趣。这家网站的宣传语是“从交际媒体噪音中提炼商场信号”。和StockTwits比较,Market Prophit愈加重视大数据的使用。它选用了先进的语义剖析法,能够将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的出资主张。网站还依据语义量化,每天发布前十名和后十名的股票热度榜单。网站还规划了“热度地图”功用,依据出资者心境和定见,依照不同板块,将板块内的个股依照色彩深浅进行标示,谁涨谁跌一望而知。
数据剖析, 数据发掘
发布于 2024-02-01 15:02:36
收藏
分享
海报
1
目录

    推荐阅读