數據集

出自維基百科，自由嘅百科全書

提示：呢篇文講嘅唔係數據庫。

數據集sou3 geoi3 zaap6（英文：data set，粵拼：dei1 taa1 set1）係指一拃因為某啲原因（例如係嚟自同一份研究）而畀人擺埋一齊睇（集）嘅數據。

睇埋[編輯]

收集數據（數據集）

操作化同層次連續同離散變數（離散化）共同方法變異（哈曼測試）時間同空間解像度靈敏度同特異度時間序列名次天花板同地板效應數數據刪失
信度效度	評分者間同評分者內信度重測試信度內部一致度卡隆巴系數建構效度效標效度分歧效度內容效度聚合效度表面效度

第啲方法

描述統計學

集中趨勢	平均 Mean（算術 · 幾何 · 調和） Median Mode
離散程度	方差同標準差全距百分位數（四分位距）變異系數離散指數協方差矩陣
分佈形狀	動差（偏度 · 峰度）標準誤差中央極限定理

相關概念

推論統計學

總體統計量獨立同分佈實證分佈函數重抽樣（自助抽樣法）損失函數效率統計距離特徵值同特徵向量頑健統計再現
概率分佈	離散定連續對稱概率質量函數同概率密度函數累計函數常態分佈（鐘形線）頻率分佈抽樣分佈（順序統計量 · 充分統計量）聯合分佈
學派詮釋	頻率學派推論貝葉斯推論貝葉斯概率（先驗 · 後驗）

學生 t 測試（獨立樣本 · 配對樣本） Z 測試 F 測試統計自由度多重比較問題（邦佛朗尼校正）等分散性同異分散性
ANOVA	單因子雙因子重複量數多變量協方差分析

控制、中介、調節、混淆同壓制變數參數單變量同多變量分析模型標明同選擇多組分析約束可解釋變異敏感度分析插值同外推混合物可詮釋度
適合度	適合度指標卡方檢定赤池資訊量準則貝葉斯資訊量準則 RMSEA SRMR CFI

迴歸分析同相關技術

基礎	殘差同誤差固定效應、隨機效應同混合模型多重迴歸模型（多重共線性）普通最小二乘法殘差平方和均方誤差標準誤差決定系數線性迴歸（簡單線性）
進階模型	非線性迴歸分析 Sigmoid 函數邏輯迴歸一般線性模型泊淞迴歸分析自迴歸模型逐步迴歸多變量適應性迴歸模型
相關技術	生還分析（函數 · 失效率 · K-M 估計量 · Log-rank 測試同比例危機）結構方程同通徑分析（量度同結構模型 · 修改指數 · 量度不變特性 · 交叉滯後）等級線性模型

第啲常用嘅分析技術

因素分析	可觀察變數同潛在變數（心理建構）潛在變數模型降維因素結構因素負荷量探索型同確定型主成份分析卡隆巴系數張量分解結構方程式模型
時間序列	平穩過程馬可夫鏈時域（自相關 · 交叉相關）頻域（傅利葉分析）格蘭傑因果關係
拉雜技術	探索分析高氏 kappa 獨立成份分析聚類分析統計分類線性判別分析點過程（點場）麥倫瑪測試非參數統計學（MWU 測試）事後分析元分析

應用（誤用）

自然科學	統計力學生物統計學（生物資訊科學 · 臨床試驗 · 傳染病學）
社會科學	社會統計學（精算學 · 經濟測量學 · 人口統計學 · 心理測量學）地圖學市場調查語言學
工程科技	工程統計學（可靠度工程）機械學習統計分類偏好學習擬亂數產生異常檢測推薦系統自然語言處理數據探勘

數學主題
統計學類

呢篇數據集係仲未搞掂嘅楔位文。歡迎幫維基百科擴寫佢。

由「https://zh-yue.wikipedia.org/w/index.php?title=數據集&oldid=1984581」收

數據

屬於2隱類：