针对vnpy的不同期货品种行情数据清理

发布时间:2025-09-01 00:29:12 作者:益华网络 来源:undefined 浏览量(0) 点赞(0)
摘要:之前2月25日,上海期货交易所进行测试,在周六进行行情广播,我的datarecording一直在跑;然后就发现读了不少脏数据。 vnpy自带的行情清理功能较为简单,只是在清除非交易时段,没有考虑周六日

之前2月25日,上海期货交易所进行测试,在周六进行行情广播,我的datarecording一直在跑;然后就发现读了不少脏数据。

vnpy自带的行情清理功能较为简单,只是在清除非交易时段,没有考虑周六日;而且只是笼统给了一个最大时间交易范围,像股指期货没有夜盘,螺纹钢晚上11点就结束,但是默认只是结束在凌晨两点半这个最大交易时间。 所以写了一个方法,按照不同品种,更细致的清理。

可以直接把这个方法插入\DataRecording\runDataCleaning.py, 然后替代原来方法。也可以自己另外调用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
# ----------------------------------------------------------------------
def cleanDataAdv(dbName, collectionName, start):
"""清洗数据"""
#新的静态数据
# 这里以商品期货为例
MORNING_START = time(9, 0)
MORNING_REST = time(10, 15)
MORNING_RESTART = time(10, 30)
MORNING_END = time(11, 30)
AFTERNOON_START = time(13, 30)
AFTERNOON_END = time(15, 0)
NIGHT_START = time(21, 0)
NIGHT_END = time(2, 30)
#股指期货
STOCK_FUTURE = ["IC", "IF", "IH"]
MORNING_START_STOCK = time(9, 30)
AFTERNOON_START_STOCK = time(13,0)
AFTERNOON_END_STOCK = time(15, 0)
#晚上11点结束交易,不全,请自行维护
PM11CLOSE_FUTURE = [rb,ru,bu,hc,sp]
NIGHT_END_11 = time(23, 00)
#晚上11点半结束交易,不全,请自行维护,大连只有一位标志,所以带1
PM1130CLOSE_FUTURE = [FG,MA,SR,TA,RM,OI,CF,CY,ZC,i1,j1,m1,p1,y1]
NIGHT_END_1130 = time(23, 30)
#凌晨1点半结束交易,不全,请自行维护
AM1CLOSE_FUTURE = [cu,pd,al,zn]
NIGHT_END_AM1 = time(1, 00)
print(u\n清洗数据库:%s, 集合:%s, 起始日:%s % (dbName, collectionName, start))
mc = MongoClient(localhost, 27017)  # 创建MongoClient
cl = mc[dbName][collectionName]  # 获取数据集合
d = {datetime: {$gte: start}}  # 只过滤从start开始的数据
cx = cl.find(d)  # 获取数据指针
for data in cx:
# 获取时间戳对象
dt = data[datetime].time()
# 默认需要清洗
cleanRequired = True
####如果是股指期货,这没有上午休息和夜盘,9点半到11点半,下午1点到下午三点,周六日无行情
if collectionName[:2] in STOCK_FUTURE:
if data[datetime].weekday() is not (5 or 6):
if ((MORNING_START_STOCK <= dt < MORNING_END) or
(AFTERNOON_START_STOCK <= dt < AFTERNOON_END_STOCK)):
cleanRequired = False
####如果是11点结束,则周六日无行情
elif collectionName[:2] in PM11CLOSE_FUTURE:
if data[datetime].weekday() is not (5 or 6):
if ((MORNING_START <= dt < MORNING_REST) or
(MORNING_RESTART <= dt < MORNING_END) or
(AFTERNOON_START <= dt < AFTERNOON_END) or
( NIGHT_START <= dt <NIGHT_END_11)):
cleanRequired = False
####如果是11点半结束,则周六日无行情
elif collectionName[:2] in PM1130CLOSE_FUTURE:
if data[datetime].weekday() is not (5 or 6):
if ((MORNING_START <= dt < MORNING_REST) or
(MORNING_RESTART <= dt < MORNING_END) or
(AFTERNOON_START <= dt < AFTERNOON_END) or
(NIGHT_START <= dt < NIGHT_END_1130)):
cleanRequired = False
####如果是1点结束,
elif collectionName[:2] in AM1CLOSE_FUTURE:
# 如果在交易事件内,则为有效数据,无需清洗
if data[datetime].weekday() is not 6:
if ((MORNING_START <= dt < MORNING_REST) or
(MORNING_RESTART <= dt < MORNING_END) or
(AFTERNOON_START <= dt < AFTERNOON_END) or
(dt >= NIGHT_START) or
(dt < NIGHT_END_AM1)):
cleanRequired = False
else:
# 如果在交易事件内,则为有效数据,无需清洗
if data[datetime].weekday() is not 6:
if ((MORNING_START <= dt < MORNING_REST) or
(MORNING_RESTART <= dt < MORNING_END) or
(AFTERNOON_START <= dt < AFTERNOON_END) or
(dt >= NIGHT_START) or
(dt < NIGHT_END)):
cleanRequired = False
# 如果需要清洗
if cleanRequired:
print(u删除无效数据,时间戳:%s % data[datetime])
cl.delete_one(data)
print(u清洗完成,数据库:%s, 集合:%s % (dbName, collectionName))

二维码

扫一扫,关注我们

声明:本文由【益华网络】编辑上传发布,转载此文章须经作者同意,并请附上出处【益华网络】及本页链接。如内容、图片有任何版权问题,请联系我们进行处理。

感兴趣吗?

欢迎联系我们,我们愿意为您解答任何有关网站疑难问题!

您身边的【网站建设专家】

搜索千万次不如咨询1次

主营项目:网站建设,手机网站,响应式网站,SEO优化,小程序开发,公众号系统,软件开发等

立即咨询 15368564009
在线客服
嘿,我来帮您!