完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.author | 許芸華 | zh_TW |
| dc.date | 114學年度第一學期 | zh_TW |
| dc.date.accessioned | 2026-03-27T04:05:31Z | - |
| dc.date.available | 2026-03-27T04:05:31Z | - |
| dc.date.submitted | 2026-03-27 | - |
| dc.identifier.other | D1160661 | zh_TW |
| dc.identifier.uri | http://dspace.fcu.edu.tw/handle/2376/5161 | - |
| dc.description.abstract | 中文摘要 近年,隨著高雄市發展重心北移、台積電設廠及三鐵共構之交通優勢,左營區已成為北高雄商業與交通核心,房地產市場結構隨之發生改變。本研究旨在探討民國109年11月至114年11月間,高雄市左營區住宅大樓、華廈及公寓之房價波動與影響因素,研究透過Python網路爬蟲技術,自「內政部不動產交易實價查詢服務網」擷取共10,993筆有效交易數據,進行資料清洗、特徵工程與離群值處理,以確保數據品質。 本研究結合敘述性統計、地理空間分析與機器學習演算法,比較線性迴歸、決策樹、隨機森林及梯度提升樹四種模型對房價的預測能力。研究結果顯示,隨機森林模型表現最佳,其決定係數(R^2)達0.8409,均方根誤差(RMSE)為35,778元/坪,顯著優於傳統線性迴歸模型之決定係數結果0.53,說明房價影響因素間存在高度非線性關係。 特徵重要性分析指出,「屋齡」為影響左營區房價之關鍵因素,重要性佔35.85%,其次為「交易年份」之25.11%與「地理位置」,經緯度合計為16.59%。空間分析則說明以高鐵左營站為核心之同心圓價格梯度現象:核心區,如高鐵特區、蓮池潭首排之單價最高,平均落在35萬元/坪以上;巨蛋商圈及核心市區次之;外圍與老舊社區則價格相對較低。本研究透過數據,量化各項房屋屬性與外部環境對價格的影響,驗證新屋溢價與地段效應,並建立房價預測模型。 Abstract In recent years, driven by the northward shift of Kaohsiung City's development focus, the establishment of TSMC's manufacturing facilities, and the transportation advantages of the three-railway terminal, Zuoying District has emerged as the commercial and transportation hub of Northern Kaohsiung. Consequently, the structure of its real estate market has undergone significant transformation. This study aims to investigate housing price fluctuations and determinants for residential high-rises, mid-rise elevator buildings, and walk-up apartments in Zuoying District from November 2020 to November 2025. Utilizing Python web crawling techniques, 10,993 valid transaction records were extracted from the Ministry of the Interior's Real Estate Actual Transaction Price Query Service. Data cleaning, feature engineering, and outlier processing were performed to ensure data quality. Integrating descriptive statistics, geospatial analysis, and machine learning algorithms, this study compares the predictive capabilities of four models: Linear Regression, Decision Tree, Random Forest, and Gradient Boosting Trees. The results indicate that the Random Forest model achieved the best performance, yielding a coefficient of determination (R^2) of 0.8409 and a Root Mean Square Error (RMSE) of 35,778 TWD/ping. This significantly outperforms the traditional Linear Regression model (R^2 = 0.53), demonstrating the existence of highly non-linear relationships among housing price determinants. Feature importance analysis identifies "Building Age" as the most critical factor influencing housing prices in Zuoying District, accounting for 35.85% of importance, followed by "Transaction Year" (25.11%) and "Geographic Location" (Latitude and Longitude combined, totaling 16.59%). Spatial analysis reveals a concentric price gradient centered on the Zuoying High Speed Rail Station. The core zone, including the HSR special zone and the Lotus Pond waterfront, commands the highest unit prices, averaging over 350,000 TWD/ping. This is followed by the Kaohsiung Arena commercial district and the city center, while peripheral areas and older communities exhibit relatively lower prices. Through data analysis, this study quantifies the impact of various property attributes and external environmental factors on prices, verifying the new house premium and location effects, and establishes a robust housing price prediction model. | zh_TW |
| dc.description.tableofcontents | 目 次 圖目錄 4 表目錄 5 第一章 緒論 6 1.1研究背景與動機 6 1.2研究目的 6 1.3研究範圍與限制 7 1.4研究內容 8 1.5研究流程 8 第二章 文獻回顧 11 2.1影響房地產價格之因素 11 2.2機器學習應用於房價預測 12 第三章 資料預處理 13 3.1資料抓取 13 3.2資料清洗與預處理 16 3.3特徵工程與非結構化文字轉換 18 3.4類別變數處理與編碼 19 3.5地址資料清洗與空間特徵提取 19 3.6缺失值處理 20 第四章 資料分析 21 4.1地理空間分析 21 4.2機器學習預測 26 一、 機器學習方法介紹 26 二、 房價多變數迴歸分析 29 三、 房價預測模型比較 30 四、 模型性能比較 32 五、 影響房價關鍵因素 34 六、 左營區價格區分圖 35 第五章 結論與建議 37 5.1結論 37 5.2建議 38 參考文獻 39 圖目錄 圖1 主要區域範圍 7 圖2 研究流程 10 圖3 房屋總價分布情形 21 圖4 房屋單價分布情形 22 圖5 高單價房屋路段分佈 23 圖6 屋齡與單價散佈圖 24 圖7 相關係數矩陣分析 25 圖8 決策樹的運作模式 27 圖9 隨機森林的運作模式 28 圖10 梯度提升樹的運作模式 28 圖11 房價多變數迴歸分析 30 圖12 房價預測模型比較 31 圖13 模型性能指標比較 33 圖14 影響房價關鍵因素 34 圖15 左營區房地產價格分布圖 36 表目錄 表1 實價登錄資料欄位定義與說明表 14 表2 特徵篩選與保留欄位說明表 16 表3 資料預處理前後對照表 17 表4 欄位拆分 18 表5 線性與非線性回歸統整 26 | zh_TW |
| dc.format.extent | 39p. | zh_TW |
| dc.language.iso | zh | zh_TW |
| dc.rights | openbrowse | zh_TW |
| dc.subject | 房價預測 | zh_TW |
| dc.subject | 機器學習 | zh_TW |
| dc.subject | 隨機森林 | zh_TW |
| dc.subject | 實價登錄 | zh_TW |
| dc.subject | 左營區 | zh_TW |
| dc.subject | Housing Price Prediction | zh_TW |
| dc.subject | Machine Learning | zh_TW |
| dc.subject | Random Forest | zh_TW |
| dc.subject | Real Estate Actual Transaction Price | zh_TW |
| dc.subject | Zuoying District | zh_TW |
| dc.title | 房屋價格分析:以高雄市左營區為例 | zh_TW |
| dc.title.alternative | Analysis of Housing Prices: A Case Study of Zuoying District, Kaohsiung City | zh_TW |
| dc.type | UndergraReport | zh_TW |
| dc.description.course | Python入門與行銷資料科學 | zh_TW |
| dc.contributor.department | 運輸與物流學系,建設學院 | zh_TW |
| dc.description.instructor | 周, 進華 | - |
| dc.description.programme | 行銷學系, 商學院 | zh_TW |
| 分類: | 商113學年度 | |
文件中的檔案:
| 檔案 | 描述 | 大小 | 格式 | |
|---|---|---|---|---|
| 1141-09.pdf | 1.71 MB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。