題名: | 藉由LASSO演算法選擇迴歸變數 |
其他題名: | Regression variable selection using LASSO algorithm |
作者: | 李維倫 Li, Wei-Lun |
關鍵字: | LASSO big data linear regression machine learning variable selection 大數據 線性迴歸 機器學習 變數選取 |
系所/單位: | 統計學系, 商學院 |
摘要: | Abstract
This study considers using the LASSO (least absolute shrinkage and selection operator) method to select important independent variables in linear regression models. The LASSO method is a supervised learning algorithm. By constraining the properties of the residuals, an interpretable regression model is developed, and the constrained parameters are set to be zero. This report discusses how to appropriately select important variables via a simulation study when there are too many independent variables or even the number of independent variables greater than the number of sample size. We use simulated data in 500 replications to show how the LASSO method selects important variables of the regression model. Finally, the results of simulation data are provided, which show that almost all important variables and half of the correct combination of variables can be accurately selected. 摘要 在許多數據集中,包含的變量動輒上百甚至更多,這使得我們必須適當選取變量以及降維技術,使得我們可以在最大程度發揮模型的解釋能力。本研究考慮使用LASSO(最小絕對收縮和選擇算子)方法在線性回歸模型中選擇重要的迴歸變數。 LASSO模型是一種監督學習算法。通過約束殘差的屬性,提出可解釋的迴歸模型,並將約束參數設置為零。本報告討論了當自變量過多,甚至迴歸變量的數量大於樣本數量時,如何通過模擬研究適當選擇重要變量。我們重複500次中的模擬數據來顯示LASSO模型如何選擇迴歸模型的重要變量。最後,提供了模擬數據的結果,表明幾乎可以準確選擇所有重要變量和變量正確組合的一半。 |
日期: | 2020-11-18T07:34:34Z |
學年度: | 108學年度第二學期 |
開課老師: | 陳婉淑 |
課程名稱: | 統計計算 |
系所: | 統計學系, 商學院 |
分類: | 商108學年度 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
M0825429108224.pdf | 997.05 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。