2af8142d2f583a63ab9566f12a4e6e7f.ppt
- Количество слайдов: 55
智慧型系統整合傳統投資技術法則 支援證券投資決策之實證研究 指導教授:許中川 教授 黃金生 教授 研究生:馬千慧
大綱 一、緒論 n 二、文獻探討 n 三、研究架構 n 四、實證結果與分析 n 五、結論與未來 作 n
一、緒論 n n n 1. 1 研究背景與動機 1. 2 研究目的 1. 3 研究範圍與限制 1. 4 研究流程 1. 5 研究架構
1. 1 研究背景與動機 n n 類神經網路,無法告知使用者整個系統的決策 過程 智慧型系統所萃取出的法則,與傳統技術分析 是否有謀合能力 傳統財務學家多傾向認為市場至少具備弱勢效 率 ,而在台灣股市技術分析廣為投資者使用, 且多有實證證明有獲利空間 相關研究著重於智慧型系統與經驗法則預測能 力
1. 2 研究目的 建立以知識為基礎之類神經網路股票預 測系統 n 資料庫知識結構的探勘,提升預測結果 的可理解性 n 與傳統技術分析法則進行比較 n 選定全樣本期間進行測試,對本實驗的 決策 具進行嚴謹的檢定分析。 n
1. 3 研究範圍與限制 n n n 89年 1月5日至 91年 2月27日之台灣股票加權指 數日資料作為研究範圍 將資料期間分割為五個區間 假設投資市場不具弱勢效率市場特性 僅選取目前在市面上廣為使用的計量型技術指 標作為輸入變數 技術指標之計算無法考量同步交易之誤差效果 不考慮交易成本與融資、融券之市場實況
1. 4 研究流程 尋 找 並 確 認 研 究 主 題 確 認 研 究 動 機 與 目 的 文 獻 探 討 資 料 收 集 與 整 理 程 式 撰 寫 實 證 結 果 與 分 析 評 估 技術分析之 實證分析 類神經網路之 實證分析 法則萃取之 實證分析 結 論 與 建 議
1. 5 研究架構 第一章 緒論 n 第二章 文獻探討 n 第三章 投資決策支援系統研究架構 n 第四章 實驗分析與結果 n 第五章 結論與未來研究方向 n
二、文獻探討 n n 2. 1 股市預測之技術分析相關理論 2. 2 類神經網路演算法 2. 3 法則萃取演算法 2. 4 智慧型系統在財務上的應用
2. 1 股市預測之技術分析相關研究 n n n 效率市場劃分成三種類型,技術分析法則無用 [Fama and Blume 1966, Jensen and Benington 1970] 理性交易者使用公開資訊下,技術分析仍有潛 在效率[Brown and Jennings, 1989] 由市場微結構的觀點認為技術分析可以獲利, 且使用交易量與價格資訊可以提高技術分析績 效 [Blume, Easlsy and O’Hara]
2. 1 股市預測之技術分析相關研究 (續) n n 26種技術分析交易法則在道瓊 業指數(18971986)年有顯著獲利能力 [BLL, 1992] 移動平均法與濾嘴法則等技術分析法則,在外 匯市場獲利之證據,並以bootstrap 模擬獲利的 顯著性 [Sweeney 1986, Levich and Thomas 1993]
2. 2 類神經網路演算法(1/2) n 2. 2. 1 類神經網路基本概念 n n 「類神經網路是一種計算系統,包括軟體與硬體, 它使用大量簡單的相連類神經元來模仿生物神經網 路的能力。類神經元是生物神經元的簡單模擬,它 從外界環境或者其它類神經元取得資訊,並加以非 常簡單的運算,並輸出其結果到外界環境或者其它 類神經元。」(葉怡成,民國89年)
2. 2 類神經網路演算法(續) n 2. 2. 2 類神經網路一般在使用上的架構藍圖 n 網路結構(Architecture): n n n 學習方式: n Learning rule n n n Topology used Number of layers : Learning rate η momentum α stopping criteriaδ number of learning patterns l number of holdout patterns h 轉換函數: n n n Transfer function Number of learning cycles/iterations L Initial weights I
2. 2 類神經網路演算法(續) n 類神經網路的優點 類神經網路在資料不完全或遺失的資料下, 仍然具有穩定性 n 輸入變數可為任何的資料型態 n 對於非線性與複雜的函數有強大的解決能力 n
2. 2 類神經網路演算法(續) n 類神經網路的缺點 網路的整個運作過程,不具有解釋的功能 n 輸入變數的選取不具有統一性 n 容易發生過渡學習的現象 n 網路架構與模型選擇沒有最適性 n
2. 3 法則萃取演算法 n n 從訓練完成的神經網路中,萃取出隱含的知識或法則, 使其內部的結構及推論的過程能夠被使用者瞭解[Gupta et al, 1999] 知識是來自於神經元間的交互作用,透過訓練可以去 觀察隱含在資料中的知識[Fu , Li. Min , 1999] 每個隱藏層節點都可視為一個類別(class)的資料, 而法則萃取就是在探討各類別間,可能觸發輸出的各 種權值的組合[Setiono & Liu , 1996 ] KBNN: [Towell, Shavlik, 1993]
2. 3 法則萃取演算法(續) n 2. 3. 2法則萃取的重要性 n n 提供使用者解釋的能力 發現輸入資料的關連與特性 提供平台的確認性與類神經網路的除錯功能 改進類神經網路的普遍性
2. 3 法則萃取演算法(續) n 2. 3. 3法則萃取演算法的分類 n n 依據 1. 法則萃取的解釋能力 2. 法則萃取技術的透明度,可將 知識的萃取區分成 1. Decomposition 2. Pedagogical [Andrews et al(1995)] Decomposition n n Subset(Towell & Shavlik , 1993)、KT method(Fu, 1998)、M-of-N method(Towell, 1994)、Neuro. Rule(Setiono & Liu, 1996)、Partial -RE(Taha & Ghosh, 1996)、Full-RE(Taha & Ghosh, 1996) Pedagogical n RULENEG (Andrews et al, 1995)、 VIA(Thrun. , 1994)、 BRAINNE(Sestito & Dillon, 1991)、BIO-RE(Taha & Ghosh, 1996)
2. 4 類神經網路在財務上應用之相關研究 n n 估計衍生性金融商品的價格公式,模擬B-S定價方式, 採用2年的選擇權價格作為訓練樣本,結果可以禰補B -S模式的缺失,還可以成功的進行避險。[ Hutchinson , 1994] 類神經網路與動態規劃類神經網路的動態規劃類神經 網路(DNN)預測模型,以開盤、收盤、最高、最低價 等資料作為預測系統的輸入變數,預測價格分布與線 型的配對 [Tanigawa & Kamijo, 1992]
2. 4 類神經網路在財務上應用之相關研究(續 ) n n n 運用隨機指標所做的買賣策略,以S&P 500每日收盤價 格指標為標的,輸入值為當日與次日的K、D值,及當 日相對於八天前的價格指數變動,輸出則為八天候價 格指數相對於當日的變動。 [Caldwell , 1995] 估計成長中與經營不彰公司的財務情形[Lacher et 1995] 比較類神經網路、Mahalanobis distance measure、兩者 整合在預測公司破產的績效 [Markham & Ragsdale, 1995]
三、研究架構 n n 3. 1 投資決策支援模型 3. 2 倒傳遞演算法 3. 3 Full-RE演算法 3. 4 本研究所採用的技術分析 n n n MAL KD MACD RSI 3. 5 統計檢定量
3. 1 投資決策支援模型 財金資料庫 專家 知識 前置處理 類神經網路 法則萃取 傳統技術分析 統 計 檢 定 評 估
3. 2 倒傳遞演算法 n 採用坡降法的觀念,表達網路實際輸出 與目標輸出之差異的誤差函數最小化, 透過加權值的調整,來達成網路訓練。
3. 3 Full-RE演算法 n 演算法有以下特徵: 1. 適用於前項式網路架構 2. 輸入的資料型態不受限制 3. 適用於具有單調 遞增特性的激發函數 4. 法則的語意較為一般大 眾所接受。法則表示法為: if X 1 op V 1 then consequent。[Taha & Ghosh, 1999]
3. 3 Full-RE演算法 n 1. 計算群聚範圍(Chi 2 演算法): n 1. 計算卡方值:每一個屬性節點在訓練期間所輸 入的資料,予以排序、分群,再計算每一個界線 的卡方χ2值。 n 2. 合併:進行深入範圍的確認
3. 3 Full-RE演算法(續) n 2. 萃取法則:權重與Chi 2演算法計算出的輸入值相乘, 在經過轉換函數的計算,進行組合排列 n 3. 計算法則相對準確度
3. 4 本研究所採用的技術分析 MAL(移動平均線) n KD(隨機指標) n MACD(指數平滑移動平均線) n RSI(相對強弱指標) n
3. 4. 1 移動平均線MAL n 移動平均代表了股價在一段時間內的平均價格,也顯 示了股價在這段時間內合理價格,同時也是多空雙方 的平衡點,因此可從移動平均線判斷股價走勢。 移動平均線計算公式如下(吳宗正, 民 88): n 短線超越長線移動平均線為買進時機,反之則賣出。 n
3. 4. 2 隨機指標 KD(2/4) n n 觀察股價上漲時,當日收盤價總向當日價格波動的最 高價接近;反之在股價下跌時,當日收盤價總向當日 波動的最低價接近 [George Lane , 1957] KD線計算公式如下: n 計算未成熟隨機值(RSV) n 計算KD值
3. 4. 2 隨機指標 KD n KD線的應用原則 n 50以上為多頭市場,50以下為空頭市場 n KD指標在 20以下,80以上為假背離
3. 4. 3 指數平滑移動平均線MACD n 顯示趨勢持續發展或反轉的一種指標。利用快 速與慢速兩條指數平滑異動平均線,以計算兩 者之間的差離值,再利用差離值與差離值平均 值的收斂與發散徵兆,用以研判股市行情買進 或賣出的時機。[Gerald Appel & W. Fredrick Hitschler, 1979 ]
3. 4. 2 指數平滑移動平均線MACD(續) n n MACD計算公式如下: 1. 計算需求指數(DI, Demand Index): n 2. 計算指數平滑移動平均線(EMA): n 3. 計算差離值DIF=12日EMA-26日EMA n 4. 計算差離值平均值DEM n n n
3. 4. 2 指數平滑移動平均線MACD(續) n MACD的應用原則 n 趨勢線向下,DIF由上往下跌破DEM時宜賣出;反 之宜補空。 n 長期移動平均線將跟上短期移動平均線,則正差離 值將縮小為賣出時機
3. 4. 4 相對強弱指標 RSI n n n 主要是以股價上漲或下跌的趨勢,判斷市場為超買或 超賣,以決定應買進或賣出股票。[J. Welles Wilder, 1978] 台灣股市所使用的技術分析方法,通常以 6日及12日的 股價來計算 ,RSI的計算公式如下 :
3. 4. 4 相對強弱指標 RSI(續) n RSI的應用原則 : n RSI很小時,表示市場賣超過旺,建議投資人買進; 反之則買超過剩,建議投資人出清。
3. 5 統計檢定量 n 買進與賣出之檢定統計量 n 買進-賣出之檢定統計量
四、實證結果與分析 4. 1 實驗環境與資料來源 n 4. 2 前置處理 n 4. 3 實驗流程 n 4. 4 實驗結果與分析 n MAL n KD n MACD n RSI n
4. 1 實驗環境與資料來源 n 硬體方面 n n n 軟體方面 n n n 處理器使用Intel PentiumⅢ 600 記憶體為 320 MB 開發 具採用Matlab 6. 1 開發平台為Microsoft windows 2000 Serve 資料來源 n 台灣經濟新報財金資料庫,近兩年(1999/01/052001/02/27) 股市交易日資料,含括了: 交易日期、開 盤價、最高價、最低價、收盤價 。
4. 2 前置處理與參數設定 n 前置處理 針對研究所需要的欄位資料進行技術指標與報酬率 之計算,透過正規化的方式 ,將資料區間分布於 [-1, 1] 。 n 輸入變數為傳統技術分析專家所建議之資料欄位, 輸出變數為漲、跌、持平。 n
4. 2 前置處理與參數設定(續) 類神經網路參數設定 參數名稱 設定值 參數名稱 設定值 輸入變數 3個 誤差平方和 0. 05 輸出變數 1個 轉換函數 Log sigmoid 4個月 學習速率 0. 01 測試期間 1個月 訓練次數 600 隱藏節點數 2 最小梯度 1 e-10 訓練期間
4. 2 前置處理與參數設定(續) n n 利用公式後定法,判斷類神經網路訓練後的輸出,0. 3 以下為跌,0. 7以上為漲,區間為持平。 類神經判斷的輸出門檻值亦為法則萃取的門檻值。 卡方演算法之顯著水準值,起始值為 0. 5,每次遞減 0. 05直至 0. 05。 技術分析法則之參數設定,選用研究上或者是目前市 面上常用的參數組合: n MAL [1 6 0] n KD [9 2] n MACD [ 12 26 9 2] n RSI [6 12 2]
4. 4 實驗結果與分析(期間四為例) – 卡方演算結果 n MAL卡方演算法運算結果 短線 區間 漲 跌 卡方 值 長線 區間 漲 跌 卡方 值 判斷 區間 8536 0 13 6. 749 8849. 9 17 29 9744. 9 6 9911. 4 漲 跌 卡方 值 7462. 2 9 24 5. 652 -602. 23 22 0 7. 0714 8. 552 9239 20 16 9 -139. 16 10 4 40. 879 0 9 9957. 7 0 9 5. 625 -42. 545 0 48 0 0 3 4 10031 3 3 0 9931. 9 1 0 5 9934. 6 0 4 7 10009 3 0 6 10064 0 2 8 10127 5 0 0
4. 4 實驗結果與分析(期間四為例)- 檢定統計表 決策 準則 N (Buy) N (Sell) Buyb Sellb Buy>0 Sell>0 Buy- Sell 大盤報酬 (%) 類神經網路 訓練期 34 50 1. 34 (0. 00) -0. 90 (0. 01) 82. 35% 34. 00% 2. 24 (0. 004) 0. 041 測試期 8 38 -0. 90 (0. 01) -0. 42 (0. 15) 87. 50% 31. 58% 1. 96 (0. 004) -0. 08 法則萃取 訓練期 38 46 0. 98 (0. 00) -0. 64 (0. 047) 71. 05% 39. 13% 0. 424 (0. 00) 0. 041 測試期 16 30 0. 75 (0. 04) -0. 5286 (0. 12) 68. 75% 26. 67% 1. 28 (0. 00) -0. 08 33. 33% 2. 11 (0. 00) 0. 041 20. 69% 0. 70 (0. 00) -0. 08 技術分析 訓練期 48 36 測試期 17 29 0. 97 (0. 01) 0. 93 (0. 01) -1. 14 (0. 01) -0. 77 (0. 03) 70. 83% 72. 22%
4. 4實驗結果與分析(期間四為例) 法則呈現 n MAL: n n n IF 短線>=9744. 9 and 長線>=9239 and 穿越區<-139. 16 THEN 明日股價漲,相對機率為 77. 10% IF 短線>=9711. 4 and 長線>=8462. 2 and 穿越區<-42. 545 THEN 明日股價漲,相對機率為 77. 11% IF 短線<9911. 4 and 長線<9957. 7 and 穿越區<-139. 16 THEN 明日股價漲,相對機率為 77. 11%
4. 4 實驗結果與分析(期間四為例) 法則呈現(續) n KD: IF K>=77. 708 and D>=86. 154 AND 穿越區>=-20. 516 THEN 明日股價漲,信賴準度為 62. 175% n IF K>=77. 708 and 86. 154>D>=45. 889 AND 穿越區>= 23. 378 THEN 明日股價漲,信賴準度為 63. 9% n IF K<13. 137 and D>=86. 154 AND 穿越區>=-39. 326 THEN 明日股價跌,信賴準度為 76. 5% n
4. 4實驗結果與分析(期間四為例) 法則呈現(續) n MACD n IF 55. 199>dif>=-619. 15 and dem>=276. 96 and -230. 63>macd>=-925. 41 THEN 明日股價漲,相對機率為 76. 10% n IF dif>=55. 199 and dem>=804. 54 and -230. 63>macd>=-925. 41 THEN 明日股價漲,相對機率為 72% n IF dif>=970 and 276. 96>dem>=-438. 76 and macd>=-925. 41 THEN 明日股價跌,相對機率為 74. 5% n IF-54. 8>dif>=-107. 14 and 276. 96>dem>=-438. 76 and macd>=-44. 798 THEN明日股價跌,相對機率為 63. 36% n IF 55. 199>dif>=-54. 8 and 276. 96>dem>=-438. 76 and macd>=-230. 63 THEN明日股價跌,相對機率為 64. 36%
4. 4實驗結果與分析(期間四為例) 法則呈現(續) n RSI n n n IF 63. 217>RSI 6>5. 8697 and RSI 2>=58. 889 and RS 6 -RSI 12>-25. 172 THEN 明日股價漲,相對機率為 83. 4% IF RSI 6>63. 217 and RSI 12>58. 889 and RS 6 -RSI 12>9. 6299 THEN 明日股價漲,相對機率為 76. 02% IF RSI 6>5. 8697 and RSI 2>=58. 889 and RS 6 -RSI 12>-63. 663 THEN 明日股價跌,相對機率為 76. 6%
4. 4 實驗結果與分析(期間四為例) n n n 全樣本期間,採用移動平均之買點之訓練期與類神 經之相關係數為 0. 72;測試期為 0. 60;賣點之訓練 期與類神經之相關係數為 0. 92;測試期為 0. 73 綜合四種技術分析法則,平均超額報酬為正,以類 神經表現最佳(75%),法則萃取次之(70%),類神經 最差(48%) 與傳統技術分析法則進行比較
4. 4實驗結果與分析(期間四為例) 趨勢圖 (1/4)
4. 4實驗結果與分析(期間四為例) 趨勢圖 (2/4)
4. 4實驗結果與分析(期間四為例) 趨勢圖 (3/4)
4. 4實驗結果與分析(期間四為例) 趨勢圖 (4/4)
五、結論 n n 藉由法則萃取所得的法則,與類神經網路所預測結果 有一定的正相關程度,投資人可藉由法則進行投資市 場的信號判斷 三種投資 具,僅有移動平均線可以顯著的擊敗大盤; 但綜合本研究之技術指標,平均超額報酬為正,類神 經網路表現最佳,Full-RE 次之,傳統技術分析較差 所萃取出之法則,與傳統之技術法則,並不完全具有 謀合之處 建議投資人可採用一種以上的決策 具搭配使用
六、未來研究方向 n n 類神經網路架構參數影響預測績效與法則萃取績效 技術分析之參數設定,並不具有一致的公認性。 卡方演算法之信賴水準值,難以界定。 建議擴大樣本期間與其它國家之股市資料進行驗證。
歡迎指教
2af8142d2f583a63ab9566f12a4e6e7f.ppt