亚洲日韩成人av在线播放,二级黄片免费下载

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

常見的八個概率分布公式和可視化

“概率分布是一個數(shù)學函數(shù)，它給出了實驗中不同可能結(jié)果的發(fā)生概率?！?/p>

了解數(shù)據(jù)的分布有助于更好地模擬我們周圍的世界。它可以幫助我們確定各種結(jié)果的可能性，或估計事件的可變性。所有這些都使得了解不同的概率分布在數(shù)據(jù)科學和機器學習中非常有價值。

在本文中，我們將介紹一些常見的分布并通過Python 代碼進行可視化以直觀地顯示它們。

均勻分布

最直接的分布是均勻分布。均勻分布是一種概率分布，其中所有結(jié)果的可能性均等。例如，如果我們擲一個公平的骰子，落在任何數(shù)字上的概率是 1/6。這是一個離散的均勻分布。

但是并不是所有的均勻分布都是離散的——它們也可以是連續(xù)的。它們可以在指定范圍內(nèi)取任何實際值。 a 和 b 之間連續(xù)均勻分布的概率密度函數(shù) (PDF) 如下：

讓我們看看如何在 Python 中對它們進行編碼：

import numpy as np 
import matplotlib.pyplot as plt
from scipy import stats
# for continuous 
a = 0
b = 50
size = 5000
X_continuous = np.linspace(a, b, size)
continuous_uniform = stats.uniform(loc=a, scale=b)
continuous_uniform_pdf = continuous_uniform.pdf(X_continuous)
# for discrete
X_discrete = np.arange(1, 7)
discrete_uniform = stats.randint(1, 7)
discrete_uniform_pmf = discrete_uniform.pmf(X_discrete) 
# plot both tables
fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(15,5))
# discrete plot
ax[0].bar(X_discrete, discrete_uniform_pmf)
ax[0].set_xlabel("X")
ax[0].set_ylabel("Probability")
ax[0].set_title("Discrete Uniform Distribution")
# continuous plot
ax[1].plot(X_continuous, continuous_uniform_pdf)
ax[1].set_xlabel("X")
ax[1].set_ylabel("Probability")
ax[1].set_title("Continuous Uniform Distribution")
plt.show()

高斯分布

高斯分布可能是最常聽到也熟悉的分布。它有幾個名字：有人稱它為鐘形曲線，因為它的概率圖看起來像一個鐘形，有人稱它為高斯分布，因為首先描述它的德國數(shù)學家卡爾·高斯命名，還有一些人稱它為正態(tài)分布，因為早期的統(tǒng)計學家注意到它一遍又一遍地再次發(fā)生。

正態(tài)分布的概率密度函數(shù)如下：

σ 是標準偏差，μ 是分布的平均值。要注意的是，在正態(tài)分布中，均值、眾數(shù)和中位數(shù)都是相等的。

當我們繪制正態(tài)分布的隨機變量時，曲線圍繞均值對稱——一半的值在中心的左側(cè)，一半在中心的右側(cè)。并且，曲線下的總面積為 1。

mu = 0
variance = 1
sigma = np.sqrt(variance)
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100)
plt.subplots(figsize=(8, 5))
plt.plot(x, stats.norm.pdf(x, mu, sigma))
plt.title("Normal Distribution")
plt.show()

對于正態(tài)分布來說。經(jīng)驗規(guī)則告訴我們數(shù)據(jù)的百分比落在平均值的一定數(shù)量的標準偏差內(nèi)。這些百分比是：

68% 的數(shù)據(jù)落在平均值的一個標準差內(nèi)。
95% 的數(shù)據(jù)落在平均值的兩個標準差內(nèi)。
99.7% 的數(shù)據(jù)落在平均值的三個標準差范圍內(nèi)。

對數(shù)正態(tài)分布

對數(shù)正態(tài)分布是對數(shù)呈正態(tài)分布的隨機變量的連續(xù)概率分布。因此，如果隨機變量 X 是對數(shù)正態(tài)分布的，則 Y = ln(X) 具有正態(tài)分布。

這是對數(shù)正態(tài)分布的 PDF：

對數(shù)正態(tài)分布的隨機變量只取正實數(shù)值。因此，對數(shù)正態(tài)分布會創(chuàng)建右偏曲線。

讓我們在 Python 中繪制它：

X = np.linspace(0, 6, 500)
std = 1
mean = 0
lognorm_distribution = stats.lognorm([std], loc=mean)
lognorm_distribution_pdf = lognorm_distribution.pdf(X)
fig, ax = plt.subplots(figsize=(8, 5))
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=1")
ax.set_xticks(np.arange(min(X), max(X)))
std = 0.5
mean = 0
lognorm_distribution = stats.lognorm([std], loc=mean)
lognorm_distribution_pdf = lognorm_distribution.pdf(X)
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=0.5")
std = 1.5
mean = 1
lognorm_distribution = stats.lognorm([std], loc=mean)
lognorm_distribution_pdf = lognorm_distribution.pdf(X)
plt.plot(X, lognorm_distribution_pdf, label="μ=1, σ=1.5")
plt.title("Lognormal Distribution")
plt.legend()
plt.show()

泊松分布

泊松分布以法國數(shù)學家西蒙·丹尼斯·泊松的名字命名。這是一個離散的概率分布，這意味著它計算具有有限結(jié)果的事件——換句話說，它是一個計數(shù)分布。因此，泊松分布用于顯示事件在指定時期內(nèi)可能發(fā)生的次數(shù)。

如果一個事件在時間上以固定的速率發(fā)生，那么及時觀察到事件的數(shù)量(n)的概率可以用泊松分布來描述。例如，顧客可能以每分鐘 3 次的平均速度到達咖啡館。我們可以使用泊松分布來計算 9 個客戶在 2 分鐘內(nèi)到達的概率。

下面是概率質(zhì)量函數(shù)公式：

λ 是一個時間單位的事件率——在我們的例子中，它是 3。k 是出現(xiàn)的次數(shù)——在我們的例子中，它是 9。這里可以使用 Scipy 來完成概率的計算。

from scipy import stats
print(stats.poisson.pmf(k=9, mu=3))
"""
0.002700503931560479
"""

泊松分布的曲線類似于正態(tài)分布，λ 表示峰值。

X = stats.poisson.rvs(mu=3, size=500)
plt.subplots(figsize=(8, 5))
plt.hist(X, density=True, edgecolor="black")
plt.title("Poisson Distribution")
plt.show()

指數(shù)分布

指數(shù)分布是泊松點過程中事件之間時間的概率分布。指數(shù)分布的概率密度函數(shù)如下：

λ 是速率參數(shù)，x 是隨機變量。

X = np.linspace(0, 5, 5000)
exponetial_distribtuion = stats.expon.pdf(X, loc=0, scale=1)
plt.subplots(figsize=(8,5))
plt.plot(X, exponetial_distribtuion)
plt.title("Exponential Distribution")
plt.show()

二項分布

可以將二項分布視為實驗中成功或失敗的概率。有些人也可能將其描述為拋硬幣概率。

參數(shù)為 n 和 p 的二項式分布是在 n 個獨立實驗序列中成功次數(shù)的離散概率分布，每個實驗都問一個是 - 否問題，每個實驗都有自己的布爾值結(jié)果：成功或失敗。

本質(zhì)上，二項分布測量兩個事件的概率。一個事件發(fā)生的概率為 p，另一事件發(fā)生的概率為 1-p。

這是二項分布的公式：

可視化代碼如下：

X = np.random.binomial(n=1, p=0.5, size=1000)
plt.subplots(figsize=(8, 5))
plt.hist(X)
plt.title("Binomial Distribution")
plt.show()

學生 t 分布

學生 t 分布(或簡稱 t 分布)是在樣本量較小且總體標準差未知的情況下估計正態(tài)分布總體的均值時出現(xiàn)的連續(xù)概率分布族的任何成員。它是由英國統(tǒng)計學家威廉·西利·戈塞特(William Sealy Gosset)以筆名“student”開發(fā)的。

PDF如下：

n 是稱為“自由度”的參數(shù)，有時可以看到它被稱為“d.o.f.” 對于較高的 n 值，t 分布更接近正態(tài)分布。

import seaborn as sns
from scipy import stats
X1 = stats.t.rvs(df=1, size=4)
X2 = stats.t.rvs(df=3, size=4)
X3 = stats.t.rvs(df=9, size=4)
plt.subplots(figsize=(8,5))
sns.kdeplot(X1, label = "1 d.o.f")
sns.kdeplot(X2, label = "3 d.o.f")
sns.kdeplot(X3, label = "6 d.o.f")
plt.title("Student's t distribution")
plt.legend()
plt.show()

卡方分布

卡方分布是伽馬分布的一個特例; 對于 k 個自由度，卡方分布是一些獨立的標準正態(tài)隨機變量的 k 的平方和。

PDF如下：

這是一種流行的概率分布，常用于假設(shè)檢驗和置信區(qū)間的構(gòu)建。

讓我們在 Python 中繪制一些示例圖：

X = np.arange(0, 6, 0.25)
plt.subplots(figsize=(8, 5))
plt.plot(X, stats.chi2.pdf(X, df=1), label="1 d.o.f")
plt.plot(X, stats.chi2.pdf(X, df=2), label="2 d.o.f")
plt.plot(X, stats.chi2.pdf(X, df=3), label="3 d.o.f")
plt.title("Chi-squared Distribution")
plt.legend()
plt.show()

掌握統(tǒng)計學和概率對于數(shù)據(jù)科學至關(guān)重要。在本文展示了一些常見且常用的分布，希望對你有所幫助。

網(wǎng)頁題目：常見的八個概率分布公式和可視化
文章來源：http://m.5511xx.com/article/ccopjog.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区