科技
设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:科技 > 快讯 >

直播预告丨中高频多因子库存储最佳实践

直播预告丨中高频多因子库存储最佳实践
2022-11-30 09:23:59 来源:壹点网

因子挖掘是量化交易的基础。随着历史交易数据日益增多,交易市场量化竞赛的不断升级和进化,量化投研团队开始面对数据频率高、因子数量多的场景,以10分钟线10000个因子5000个股票为例,一年的因子数据约为2.3T左右,1分钟线的数据量达到23T,3秒线的数据量将达到460T。如此量级的数据就对因子存储方案提出了很高的要求。

那么,我们要如何解决中高频多因子数据的存储问题呢?目前行业有哪些核心挑战?

因子库存储有哪些挑战?

庞大的数据量

因子计算通常有3个维度,股票、因子和时间。我们做一个简单的计算,国内股票个数按5000来算;因子个数一般机构大约为1000起,多的甚至有10000;时间频率高的是每3秒生成一次数据,频率低的也有10分钟一次——也就是说,一只股票一个因子一天会生成24到4800个tick。面对如此庞大的数据量,如何保证高效数据写入是因子库存储的一大挑战。

动态变化的因子库

因子库经常会发生变化,往往需要新增因子、修改因子定义,或加入新的股票等。面对T级的因子数据,单个因子的新增、修改、删除耗时应该保证在秒级才能确保整体量化投研的效率。

最适合金融计算的输出方式

量化金融的多因子建模通常需要以面板数据进行截面因子分析。用户需要从海量的因子数据中尽可能高速并精准的读取数据,对齐多个因子后以面板的方式输出。这对数据库的能提出了极大的挑战。

直播预告

2022年12月1日晚7点半,DolphinDB 创始人周小华博士,和 DolphinDB 数据分析负责人毛忻玥,将与大家共聚直播间,围绕「高频多因子存储的最佳实践」与大家展开探讨。点击海报并长按,扫描二维码报名吧!

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:

责任编辑:kj005

文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com
关键词:

人物专访:一直为医美的“专业消费者”持续创造价值的医美IP吉娜

2022-11-24 16:23:38人物专访:一直为医美的“专业消费者”持续创造价值的医美IP吉娜

超大流量,球迷专享,中国广电最新专属卡产品即将限时上线

2022-11-16 10:44:35超大流量,球迷专享,中国广电最新专属卡产品即将限时上线

银河威尔创始人胡珩:三维交互打破虚实界限,让每个人都能体验全世界

2022-11-15 14:50:09银河威尔创始人胡珩:三维交互打破虚实界限,让每个人都能体验全世界

“192一见到就爱了”活动收官,中国广电联合多家企业帮助年轻人拒绝丧文化

2022-11-11 11:33:39“192一见到就爱了”活动收官,中国广电联合多家企业帮助年轻人拒绝丧文化

全球领跑!友道智途获全球首张智能网联汽车示范运营牌照

2022-11-10 16:13:01全球领跑!友道智途获全球首张智能网联汽车示范运营牌照

优学派智能AI学习机,AI精准学孩子定位薄弱知识点,助力摆脱盲目学习!

2022-11-10 10:52:23优学派智能AI学习机,AI精准学孩子定位薄弱知识点,助力摆脱盲目学习!

相关新闻

最新资讯