完整後設資料紀錄
DC 欄位語言
dc.contributor.author陳瑞龍
dc.contributor.author廖烜唯
dc.contributor.author劉芸均
dc.contributor.author吳雅莉
dc.contributor.author陳軍翰
dc.contributor.author吳育成
dc.contributor.author曾譯賢
dc.date109學年度第一學期
dc.date.accessioned2021-04-23T04:15:17Z
dc.date.accessioned2021-08-06T09:21:12Z-
dc.date.available2021-04-23T04:15:17Z
dc.date.available2021-08-06T09:21:12Z-
dc.date.issued2021-04-23T04:15:17Z
dc.date.submitted2021-04-23
dc.identifier.otherD0680416、D0609466、D0609393、D0636167、D0680433、 D0680578、D0609483
dc.identifier.urihttp://dspace.fcu.edu.tw/handle/2377/32057-
dc.description.abstract本研究以近期台灣發展較為重點的城市進行房價的探討。本文納入不同面向的因子以建立房價預測模型,其中包括平均年所得、人口成長率、青年比、餘屋數和臨最近產業園區距離,資料年份採用2017年,研究最大亮點是使用臨最近產業園區距離這項因子,過去文獻甚少以產業園區對房價進行探討。本研究依據複迴歸分析進行房價的建模,並使用交叉驗證對不同因子組合的模型進行最佳模型的挑選,以及藉由懲罰迴歸模型進行最佳模型的佐證,後續再與羅吉斯迴歸跟決策樹得出的最佳模型進行比較與解析。研究結果顯示:1.複迴歸模型:挑選出以平均年所得、青年比及臨最近產業園區距離組成的模型表現最佳,調整後模型解釋能力約為0.65,此外從參數估計可以觀察出平均年所得、青年比和房價呈正向關係,而臨最近產業園區距離和房價呈負向關係,這方面與預期符合;2.羅吉斯迴歸中得出最佳的模型與複迴歸的結果不同,但在準確率上差異不大;3.決策樹中將房價分成三類其得出的最佳模型與複迴歸的結果不同,但準確率差距不到1%,且複迴歸的最佳模型在混淆矩陣中的重大錯誤皆較少。從三者結果得出以平均年所得、青年比及臨最近產業園區距離的模型組合來預測房價表現較為穩定。
dc.description.abstractA study is to discuss the housing price of topic cities in Taiwan. This article investigates several factors that are the per capita income, the population growth rate, youth ratio, number of remaining houses, and a distance of near the nearest industrial park to establish the housing price predicted model. The year of data uses in 2017, the research focuses on using a distance of near the nearest industrial park factor. In the past, there is limited literature discussed housing prices with a distance factor. This research utilizes multiple regression to build the housing price predicted model and cross-validation (CV) procedure (leave-one-out CV) to define the best prediction model as well as prove the best model through the penalty regression with SCAD penalty. Then, using logistic regression and decision tree to obtain the comparison and the analysis. The research results showed that: 1. The model contains per capita income, youth ratio, and a distance near the nearest industrial park factors is the best model through the multiple regression model, and the corresponding adjusted R-square is about 0.65. Also, we observe a positive relationship among the per capita income, youth ratio, and housing price, and a negative relationship between the distance near the nearest industrial park and housing price. 2. The best model selected is different from logistic regression and multiple regression models, but the difference in accuracy is not significant. 3. The best model through the decision tree based on dividing house prices into three categories is different from the result by the multiple regression model, but the difference of accuracy is lower than 1%. Moreover, the best model of multiple regression has fewer major errors in the confusion matrix. According to these results, the model that contains per capita income, youth ratio, and a distance near the nearest industrial park have a good performance on the prediction.
dc.description.tableofcontents目 次 第一章 緒論 7 第一節 研究動機與目的 7 第二節 文獻回顧 9 一、 年所得與房價的關聯 9 二、 青年比與房價的關聯 9 三、 產業園區與房價的關聯 10 四、 關於房價取對數的依據 10 第三節 研究流程 10 第二章 資料取得與處理 12 第一節 資料選用說明 12 一、 平均年所得: 12 二、 人口成長率: 12 三、 青年比: 12 四、 餘屋數: 12 五、 臨最近產業園區距離: 12 第二節 各項選用資料的處理程序 13 一、 房價(萬/坪): 13 二、 平均年所得(萬): 14 三、 人口成長率: 14 四、 青年比: 14 五、 餘屋數: 15 六、 臨最近產業園區距離(公里): 15 第三章 資料的敘述統計 21 第四章 迴歸分析 24 第一節 方法介紹 24 一、 迴歸分析與複迴歸分析: 24 二、 交叉驗證(cross-validation): 24 三、 變數選擇/懲罰回歸模型 (Penalized Regression Model): 24 第二節 評估準則 25 一、 MinMaxAccuracy 25 二、 Mean absolute percentage error (MAPE) 25 三、 AIC/BIC 25 第三節 分析 26 一、 原始模型(full model) 26 二、 資料轉換 26 三、 離群值 27 四、 模型比較與選取 27 第四節 殘差檢定 30 第五節 懲罰迴歸 31 第六節 預測曲線 32 第七節 總結 33 第五章 羅吉斯迴歸 34 第一節 方法介紹 34 一、 羅吉斯回歸: 34 二、 羅吉斯模型 34 第二節 評估準則 34 第三節 分析 35 一、 資料調整 35 二、 模型選取與比較 35 第四節 總結 37 第六章 決策樹 38 第一節 方法介紹 38 決策樹 38 第二節 資料轉換 38 第三節 分析 38 第四節 總結 41 第七章 結論與建議 42 第一節 研究結論 42 第二節 後續研究建議 43 參考文獻 44 附錄 46 附錄 一 產業園區選用清單(研究作業使用,非正式) 46 附錄 二 產業園區的Map 51 表目錄 表 1變數說明表 21 表 2各變數的敘述統計表 21 表 3各地區變數資料之中位數表 21 表 4在MAPE準則下的模型排序(由小到大) 28 表 5在MinMaxAccuracy準則下的模型排序(由大到小) 28 表 6加入null model 並以BIC為排序準則檢視其AIC與BIC 29 表 7參數估計表 33 表 8準確率下的模型排序 35 表 9加入AIC與BIC準則比較模型 36 表 10羅吉斯參數估計表 36 表 11不同模型的平均準確度排序表 39 表 12最佳模型-決策樹模型的混淆矩陣 40 表 13迴歸分析最佳模型-決策樹模型的混淆矩陣 41 圖目錄 圖 1研究流程圖 11 圖 2台灣工業區土地管理系統呈現圖 16 圖 3鄉鎮市區標的示意圖 16 圖 4產業園區標的示意圖 17 圖 5完成標定後的自訂地圖示意圖 17 圖 6工具列 18 圖 7直接新增標的示意圖 18 圖 8新增標記的工具 18 圖 9手動新增標的示意圖 18 圖 10此符號表示鄉鎮市區 18 圖 11此符號表示產業園區 18 圖 12測量距離和區域的工具 19 圖 13西屯區與中部科學園區台中園區的距離示意圖 19 圖 14西屯區與台中工業區的距離示意圖 20 圖 15西屯區與台中精密機械科技園區的距離示意圖 20 圖 16矩陣散佈圖 22 圖 17相關性矩陣圖 23 圖 18 對數房價與各變數的散佈圖 23 圖 19原始房價與對數房價標準化的機率密度圖 26 圖 20原始房價與對數房價的經驗CDF與標準常態分佈的CDF之間的相似性圖 26 圖 21極端值檢測(Cook’s distance & Residual vs Leverage) 27 圖 22 殘差檢定 30 圖 23懲罰函數 31 圖 24實際值&估計值交叉圖 32 圖 25羅吉斯函數轉換圖 37 圖 26房價劃分示意圖 38 圖 27最佳模型-決策樹模型的樹狀圖 39 圖 28迴歸分析最佳模型-決策樹模型的樹狀圖 40
dc.format.extent52p.
dc.language.isozh
dc.rightsopenbrowse
dc.subject房價預測
dc.subject迴歸分析
dc.subject交叉驗證
dc.subject決策樹
dc.subject懲罰迴歸
dc.subjecthousing price prediction
dc.subjectregression model
dc.subjectcross-validation
dc.subjectdecision tree
dc.subjectpenalized regression
dc.title台灣重點城市房屋價格之研究
dc.title.alternativeA Study of Housing Price of Topic Cities in Taiwan
dc.typeUndergracase
dc.description.course統計專題(一)
dc.contributor.department統計學系
dc.description.instructor王价輝
dc.description.programme統計學系
分類:商109學年度

文件中的檔案:
檔案 描述 大小格式 
D0680416109102.pdf3.59 MBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。