訂閱
糾錯(cuò)
加入自媒體

精準(zhǔn)預(yù)測(cè)市場(chǎng)?當(dāng)多方安全計(jì)算遇到量化投研

Avatar的開(kāi)幕式

“這個(gè)case不是為了證明第三方數(shù)據(jù)有多牛,是表演一下投研對(duì)數(shù)據(jù)的安全建模方案”。

研究標(biāo)的:2019年8月5日-2020年8月4日創(chuàng)業(yè)板中所有股票

研究目標(biāo):該策略目標(biāo)為利用歷史數(shù)據(jù),預(yù)測(cè)每只股票當(dāng)天是否漲幅超8%,即樣本集中日股票漲幅超8%,y值為1,否則y值為0。

研究變量

聯(lián)邦學(xué)習(xí)中節(jié)點(diǎn)A數(shù)據(jù):通過(guò)股票歷史數(shù)據(jù)(公開(kāi)數(shù)據(jù)),構(gòu)建了當(dāng)日星期、近三天平均收益率、近七天平均收益率、近三天絕對(duì)收益率、近七天絕對(duì)收益率、近三天標(biāo)準(zhǔn)差、近七天標(biāo)準(zhǔn)差、近三天平均換手率、近七天平均換手率、近三天平均成交量、近七天平均成交量、近三天上漲天數(shù)、近七天上漲天數(shù)、近三天漲幅大于5%次數(shù)、近七天漲幅大于5%次數(shù)、近三天跌幅大于5%次數(shù)、近七天跌幅大于5%次數(shù),共17個(gè)指標(biāo)。

聯(lián)邦學(xué)習(xí)中節(jié)點(diǎn)B數(shù)據(jù):通過(guò)百度搜索中關(guān)鍵詞為“創(chuàng)業(yè)板”的搜索次數(shù),構(gòu)建了當(dāng)日創(chuàng)業(yè)板搜索指數(shù)、近一天創(chuàng)業(yè)板搜索指數(shù)、近三天創(chuàng)業(yè)板搜索指數(shù)、近七天創(chuàng)業(yè)板搜索指數(shù)、近三天創(chuàng)業(yè)板指數(shù)上升天數(shù)、近七天創(chuàng)業(yè)板指數(shù)上升天數(shù)、創(chuàng)業(yè)板搜素指數(shù)漲幅,共7個(gè)指標(biāo),模擬外部非公開(kāi)的數(shù)據(jù)源。

綜上,該策略通過(guò)上述24個(gè)指標(biāo)的構(gòu)建,結(jié)合動(dòng)量策略和反轉(zhuǎn)策略原理,并通過(guò)百度搜索次數(shù)作為外部數(shù)據(jù),作為反應(yīng)市場(chǎng)情緒的變量,之后根據(jù)IV等指標(biāo)篩選入?yún)⒆兞,?gòu)建邏輯回歸模型,預(yù)測(cè)當(dāng)日股票是否上漲超過(guò)8%。為驗(yàn)證百度指數(shù)作用,策略制定了四個(gè)模型作為對(duì)照,具體如下:

樣本集為全部股票,未用到百度指數(shù)構(gòu)建模型

樣本集為全部股票,用到了百度指數(shù)構(gòu)建模型(其他入?yún)⒆兞颗c對(duì)照組1一致)

樣本集為華興源創(chuàng),未用到百度指數(shù)構(gòu)建模型

樣本集為華興源創(chuàng),用到百度指數(shù)構(gòu)建模型

(備注,因?yàn)榘俣人阉鲾?shù)據(jù)進(jìn)行了反爬蟲的保護(hù),無(wú)法爬取全部信息,故全量股票數(shù)據(jù)建模過(guò)程中,只用到了搜索“創(chuàng)業(yè)板”的搜索次數(shù),未用到每只股票對(duì)應(yīng)的股票名稱搜索次數(shù);僅在樣本集為華興源創(chuàng)的案例中,用到了華興源創(chuàng)作為關(guān)鍵詞的搜索次數(shù)。)

模型結(jié)論

1)通過(guò)IV值可推斷百度指數(shù)數(shù)據(jù)對(duì)于預(yù)測(cè)y值有較為重要的作用,其中創(chuàng)業(yè)板搜索漲跌幅和近三天創(chuàng)業(yè)板搜索平均值效果較為顯著,通過(guò)模型系數(shù)可知?jiǎng)?chuàng)業(yè)板搜索漲跌幅和近三天創(chuàng)業(yè)板搜索平均值和y值具有正相關(guān)關(guān)系,即數(shù)值越高,越容易漲幅超過(guò)8%。(具體信息見(jiàn)下圖)

2)樣本集為全部股票,用到百度指數(shù)構(gòu)建模型,AUC為0.76,未用到百度指數(shù)構(gòu)建模型(其他入?yún)⒆兞颗c對(duì)照組1一致),AUC為0.72,說(shuō)明百度指數(shù)對(duì)應(yīng)預(yù)測(cè)有明顯提升效果。(具體信息見(jiàn)下圖)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)