
第三十屆專業實習競賽

研究背景
全球遊戲市場近年持續擴張,PC 平台依然佔有龐大玩家基數,其中以 Steam 為規模最大、資料透明度最高的數位遊戲平台。由於 Steam 公開遊戲評論、玩家人數、更新紀錄與遊玩時數等多項數據,使其成為研究玩家行為與遊戲營運策略的重要來源。
在 Steam 上,熱門遊戲通常呈現三種典型生命週期:快速成長、快速下滑與長期穩定。玩家是否願意持續回到遊戲,形成了「玩家黏著度(Retention)」這一關鍵指標。黏著度不僅代表玩家回流程度,更反映遊戲內容、營運節奏與社群性之綜合結果。
然而,過去的研究多倚賴個案分析或少量樣本,缺乏大量、跨類別、跨模式與跨地區的完整量化比較。Steam 的多源資料(Store、Steam Charts、SteamDB、SteamSpy)提供了建立大規模資料集的可能,使得檢驗市場常見假設成為可能。
因此,本研究使用 345 款 Steam 熱門遊戲資料,透過統計分析比較不同遊戲屬性、評價、聲量與更新資訊,探討哪些因素與玩家黏著度真正相關,並釐清過去常被視為理所當然但未曾被驗證的市場觀念。
全球遊戲市場近年持續擴張,PC 平台依然佔有龐大玩家基數,其中以 Steam 為規模最大、資料透明度最高的數位遊戲平台。由於 Steam 公開遊戲評論、玩家人數、更新紀錄與遊玩時數等多項數據,使其成為研究玩家行為與遊戲營運策略的重要來源。
在 Steam 上,熱門遊戲通常呈現三種典型生命週期:快速成長、快速下滑與長期穩定。玩家是否願意持續回到遊戲,形成了「玩家黏著度(Retention)」這一關鍵指標。黏著度不僅代表玩家回流程度,更反映遊戲內容、營運節奏與社群性之綜合結果。
然而,過去的研究多倚賴個案分析或少量樣本,缺乏大量、跨類別、跨模式與跨地區的完整量化比較。Steam 的多源資料(Store、Steam Charts、SteamDB、SteamSpy)提供了建立大規模資料集的可能,使得檢驗市場常見假設成為可能。
因此,本研究使用 345 款 Steam 熱門遊戲資料,透過統計分析比較不同遊戲屬性、評價、聲量與更新資訊,探討哪些因素與玩家黏著度真正相關,並釐清過去常被視為理所當然但未曾被驗證的市場觀念。
研究動機
玩家社群中流傳許多對遊戲黏著度的直覺判斷,例如:
-
多人遊戲通常較具黏著度
-
免費遊戲容易吸引大量玩家
-
RPG 玩家遊玩時數較長
-
東亞遊戲較耐玩
-
更新越頻繁,越能留住玩家
然而,這些觀念大多源自玩家經驗、平台觀察或個別案例,缺乏系統化的大型量化資料驗證。
基於此,本研究希望透過 Steam 上 345 款熱門遊戲的實證數據,釐清上述市場印象是否成立。更重要的是,Steam 平台擁有完整的玩家行為數據(玩家數、遊玩時數、留存率),能夠直接量化「玩家是否持續回流」。相比僅依靠評價或銷售等間接指標,Steam 的多源資料更能反映真實使用者行為,具有高度研究價值。
因此,本研究希望透過統計方法(ANOVA、相關分析、迴歸模型),判斷哪些變數真正影響黏著度,哪些實際上並無統計支持,以提供遊戲產業、研究者與開發者更客觀的分析依據。


研究問題
基於研究背景與動機,本研究提出以下四項研究問題:
RQ1:不同遊戲屬性(是否付費、是否多人、類型、開發地區)是否會造成黏著度差異?
RQ2:社群評價與聲量(評論數、好評率)是否與黏著度相關?
RQ3:更新次數與可下載內容(DLC)是否會影響玩家人數或行為?
RQ4:哪些變數能有效預測玩家數、遊玩時數與留存率?
這 四項研究問題涵蓋遊戲屬性、社群指標與營運策略三個面向,並以玩家行為(玩家數、時數、留存率)為主要分析核心。
研究目的
為回應上述研究問題,本研究設定以下研究目的:
-
分析不同遊戲屬性在黏著度指標上的差異
包含付費 / 免費、單人 / 多人、三大類型與地區。
-
探討社群評價、聲量、更新頻率與內容規模(DLC)是否與玩家黏著度相關
-
建構三種玩家黏著度的迴歸模型
(玩家數、遊玩時數、留存率)
-
提出基於數據的遊戲設計與營運建議
使開發者與營運團隊能以量化結果作為參考,而非依靠主觀經驗判斷。

研究方法
資料來源 :
本研究整合四個主要資料來源:Steam Store、Steam Charts、SteamDB 與 SteamSpy。這些平台皆基於 Steam 的公開數據,但各自提供不同面向的資訊,因此整合後能更全面地呈現遊戲表現。
研究期間與樣本描述 :
本研究的觀察期間為:
-
2025 年 5 月 1 日至 2025 年 8 月 31 日
本研究原始資料爬取共 419 筆遊戲,但由於:
-
有部分遊戲因資料缺失(如評論數缺乏、更新資訊缺漏)被刪除
-
部分 AppID 抓取失敗
-
少數遊戲資料不完整或無法比對
最終經資料清洗後的可用有效樣本為:
345 款 Steam 熱門遊戲(含欄位 346 行)
此樣本包含:
-
多人遊戲與單人遊戲
-
免費遊戲與付費遊戲
-
RPG、Action、Casual 三大類型
-
歐美、東亞、其他地區三大分類
-
各種評價聲量與更新頻率差異
資料前處理 :
資料前處理是本研究能順利進行統計建模前最關鍵的一環。本研究從四個平台抓取初始資料後,須進行格式清洗、欄位統一、異常值檢查、缺值處理、類別變數轉換等操作。
變數操作化 :
變數操作化的目的,是將蒐集到的資料轉換成可量化分析的研究變項。
本研究的變數分為:
-
依變數(Dependent Variables)
(一)平均遊玩人數(Average Players)
涵蓋四個月(2025/05–2025/08)的月平均值,反映一款遊戲在觀察期間的整體熱度。
此指標可視為「市佔指標」與「活躍度指標」。
(二)平均遊玩時數(Average Playtime)
來自 SteamSpy 的平均遊玩時數估計(單位:小時)。
此指標代表「玩家深度投入程度」,可補足玩家人數指標無法反映玩家「遊玩時長」的不足。
(三)留存率(Retention Rate)
採三段變化平均值,可衡量遊戲生命週期是否穩定。
留存率越高,代表:
-
玩家願意回到遊戲
-
遊戲具備長期吸引力
-
內容更新與遊戲設計足以維持熱度
此為本研究最重要的依變數之一。
-
自變數(Independent Variables)
(一) 商業模式
多人遊戲與單人遊戲
(二) 遊戲模式
免費遊戲與付費遊戲
(三) 類型
RPG、Action、Casual 三大類型
(四) 地區
歐美、東亞、其他地區三大分類
-
控制變數(Control Variables)
為避免自變數與黏著度之間的關係受到其他因素干擾,本研究加入下列控制變數:
-
好評率(Positive Rating)
-
評論總數(Review Count)
-
DLC 數量(DLC Count)
-
更新頻率(Update 30 / 90 / 120)
控制變數能有效提高迴歸模型的解釋力,讓分析反映「遊戲屬性」的真實影響。
統計方法 :
本研究採用了四大統計方法:
-
描述統計分析(Descriptive Statistics)
目的:
-
描述整體資料分布
-
理解不同類型變數的基本特徵
-
作為後續 ANOVA 與迴歸的基礎
將呈現:
-
平均值、標準差、中位數、最大/最小值
-
類別變數分布(免費/付費、單人/多人、類型、地區)
-
群組比較(Group Comparison)
用於比較不同類別之間的平均差異,例如:
-
付費 vs 免費
-
單人 vs 多人
-
RPG / Action / Casual
可作為初步觀察差異的方式,但不能判斷顯著性,因此後續需搭配 ANOVA。
-
單因子變異數分析(One-way ANOVA)
ANOVA 重點:
-
若 p-value < 0.05 → 差異顯著
-
若 p-value > 0.05 → 差異不顯著
本研究將針對以下模型進行 ANOVA:
-
商業模式對平均遊玩時數
-
商業模式對好評率
-
單人/多人對平均玩家數
-
類型對留存率
-
地區對玩家時數
-
相關分析(Correlation Analysis)
目的:
-
檢驗變數間的線性關係
-
確認是否存在過度相關(避免迴歸共線性)
-
找出黏著度的強相關變數
例如:
-
評論數 vs 玩家人數(預期相關高)
-
好評率 vs 留存率(預期不一定高)
-
更新頻率 vs 玩家數(極可能相關低)
-
多元線性迴歸分析(Multiple Regression)
本研究建立三個模型:
-
模型 A:預測平均玩家人數
-
模型 B:預測平均遊玩時數
-
模型 C:預測留存率
用途:
-
檢驗哪些變數能顯著解釋黏著度差異
-
比較 dummy variables 的相對影響力
-
檢測控制變數的影響是否顯著
-
計算模型解釋力(R²)
同時進行:
-
多重共線性檢查(VIF)
-
殘差分析
-
β 係數排序(影響力大小比較)
研究流程
步驟一:確定研究範圍與遊戲類型
-
聚焦於 Steam 平台的熱門遊戲。
-
限定資料期間為 2025 年 5 月至 2025 年 8 月。
-
建立研究對象:345 款熱門遊戲。
步驟二:資料收集(Python 爬蟲)
-
從 Steam Store、Steam Charts、SteamDB、SteamSpy 抓取資料。
-
收集遊戲屬性、評價資料、玩家數據、更新資訊等。
步驟三:資料前處理
-
整理欄位格式、刪除缺失嚴重資料。
-
將類別變數轉換為虛擬變數(Dummy Variables)。
-
將日期轉換為以 2025/08/31 為基準的時間差。
步驟四:變數操作化
-
定義依變數:平均玩家數、平均遊玩時數、近月留存率。
-
定義自變數三大構面:
-
遊戲屬性:付費 / 免費、單人 / 多人、類型、地區。
-
社群評價:評論數、好評率。
-
內容與營運:DLC 數量、更新頻率(30 / 90 / 120 天)。
-
步驟五:統計分析與結果整理
-
描述統計(Descriptive Statistics)
-
群組比較(Group Comparison)
-
單因子變異數分析(One-way ANOVA)
-
相關分析(Correlation Analysis)
-
多元線性迴歸分析(Multiple Regression)
在此研究流程下,所有資料收集與分析皆遵循統一架構,確保分析結果具備一致性與可解釋性。
研究架構
