ML基礎 | 一文詳解正態分布(附python實現)
正態分布簡介

你聽說過鐘形曲線嗎?它往往是全球人們討論最多的話題之一。很長一段時間以來,鐘形曲線決定了對員工的專業評估,可以是一個受人喜愛或令人恐懼的話題,而這取決于與誰交談!看看這張圖片:

你認為曲線的形狀意味著什么?作為一個數據科學家(或一個有抱負的科學家),你應該能夠馬上回答這個問題。在許多其他應用中,鐘形曲線背后的思想是正態分布。正態分布是統計學的核心概念,是數據科學的支柱。在進行探索性數據分析時,我們首先探索數據,而目的是找出其概率分布,對嗎?猜猜看,最常見的概率分布是什么?就是正態分布。看看這三個非常常見的正態分布示例:



你可以清楚地看到,出生體重、智商得分和股價回報率往往形成一個鐘形曲線。同樣,還有許多其他的社會和自然數據集遵循正態分布。正態分布對數據科學家來說變得至關重要的另一個原因是中心極限定理,這個定理解釋了數學的魔力,是假設檢驗的基礎。中心極限定理:https://www.analyticsvidhya.com/blog/2019/05/statistics-101-introduction-central-limit-theorem/?utm_source=blog&utm_medium=statistics-data-science-normal-distribution在本文中,我們將了解正態分布的意義和不同性質,以及如何使用這些性質來檢查數據的正態性。目錄正態分布的性質正態分布的經驗法則什么是標準正態分布?熟悉偏態分布左偏分布右偏分布如何檢驗分布的正態性直方圖KDE圖Q_Q圖偏度峰度實現和理解正態分布的Python代碼正態分布的性質


我們稱這條鐘形曲線為正態分布,卡爾·弗里德里希·高斯發現了它,所以有時我們也把它稱為高斯分布。我們只需使用兩個參數即可簡化正態分布的概率密度:平均值
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













