*️ 个人主页: @AI_magician
主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。
景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!
*️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)
【深度学习 | 核心概念】那些深度学习路上必经的核心概念,确定不来看看? (一)
作者: 计算机魔术师
版本: 1.0 ( 2023.8.27 )
摘要: 本系列旨在普及那些深度学习路上必经的核心概念,文章内容都是博主用心学习收集所写,欢迎大家三联支持!本系列会一直更新,核心概念系列会一直更新!欢迎大家订阅
该文章收录专栏
[— 《深入解析机器学习:从原理到应用的全面指南》 —]
@toc
指数分布族
正态(高斯)分布
正态分布(Normal Distribution)是概率论和统计学中最重要和广泛应用的分布之一。下面我将详细介绍正态分布的发展历史、数学公式、应用场景以及一般在人工智能领域中与哪些模型结合使用。
-
发展历史:
正态分布最早由德国数学家Carl Friedrich Gauss在18世纪末提出,并因此被称为高斯分布。Gauss的研究对于统计学和概率论的发展有着深远的影响。他在研究天文观测误差时发现了正态分布的重要性,并系统地研究了正态分布的性质和特征。 -
数学公式推导:
正态分布的数学公式推导涉及较为复杂的数学推导和积分运算,这里我将给出其概率密度函数(PDF)的表达式。正态分布的概率密度函数为:
f ( x ∣ μ , σ 2 ) = 1 2 π σ 2 exp ( − ( x − μ ) 2 2 σ 2 ) f(x|\mu,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) f(x∣μ,σ2)=2πσ21exp(−2σ2(x−μ)2)其中, x x x 是随机变量的取值, μ \mu μ 是均值, σ 2 \sigma^2 σ2 是方差。
-
应用场景:
正态分布在自然界和社会现象中广泛应用,具有以下特点:- 许多现实世界的现象和测量误差可以近似地服从正态分布。
- 自然科学:正态分布被广泛应用于物理学、天文学、生态学等领域,用于描述测量误差、随机变量的分布等。
- 社会科学:正态分布在经济学、心理学、社会学等领域中常用于描述人类行为和心理特征,例如智力测试、身高分布等。
- 工程与质量控制:正态分布在工程领域中用于分析和控制生产过程中的变异性,例如制造业中的质量控制。
- 金融学:正态分布被广泛应用于金融市场的风险分析和资产定价模型中,例如股票收益率的分布。
- 生物统计学:正态分布在遗传学、流行病学等领域中用于建模和分析生物数据,例如身高、体重的分布。
-
人工智能领域中与正态分布结合的模型:
正态分布在人工智能领域中与许多模型结合使用,以下是一些常见的例子:- 高斯朴素贝叶斯分类器(Gaussian Naive Bayes):该分类器假设特征的条件概率服从正态分布,并基于此进行分类。
- 高斯混合模型(Gaussian Mixture Model,GMM):GMM是一种聚类算法,假设样本数据来自于多个正态分布混合而成。
- 自动编码器(Autoencoder):自动编码器在一些变体中利用正态分布的隐变量来建模数据的分布。
- 深度生成模型(Deep Generative Models):正态分布常用作深度生成模型(如变分自编码器)中的潜在空间变量的先验分布。
- 参数初始化:在神经网络中,通常使用正态分布初始化权重和偏置,以帮助模型学习数据的特征。
- 损失函数:某些机器学习模型使用正态分布作为损失函数的一部分,例如最大似然估计中的负对数似然损失函数。
- 异常检测:正态分布可以用于检测异常值。如果数据的分布明显偏离正态分布,可能表示存在异常情况。
- 数据合成:生成对抗网络(Generative Adversarial Networks,GANs)等模型可以使用正态分布来生成符合特定分布的合成数据。
正态分布的发展历史和广泛应用使得它成为概率论和统计学的重要基础。在人工智能领域中,特别是深度学习和机器学习领域,正态分布与多个模型的结合应用可以帮助解决各种问题,包括分类、聚类、降维、生成模型等。
泊松分布
泊松分布(Poisson Distribution)是概率论和统计学中常用的离散概率分布,用于描述在一定时间或空间范围内随机事件发生的次数。下面我将详细回答你的问题。
-
发展历史:
泊松分布得名于法国数学家西蒙·丹尼·泊松(Siméon Denis Poisson),他于1837年首次引入了这个分布,用于描述极少事件的概率。泊松分布的发展历史可以追溯到18世纪,而泊松在其著作中详细研究了事件发生的随机性和事件发生次数的分布。 -
数学公式推导:
泊松分布的概率质量函数(Probability Mass Function,PMF)可以用以下公式表示:
P ( x ; λ ) = e − λ ⋅ λ x x ! P(x; \lambda) = \frac{
{e^{-\lambda} \cdot \lambda^x}}{
{x!}} P(x;λ)=x!e−λ⋅λx
其中, x x x 是随机变量的取值, λ \lambda λ 是平均发生率(即单位时间或单位空间范围内事件的平均发生次数)。这个公式描述了在给定时间或空间范围内,发生 x x x 次事件的概率。这个式子看起来有点抽象我们以一个例子表示
请考虑以下生活案例:假设你住在一个繁华的城市中的公寓楼,你想了解每天晚上进入你楼层电梯的人数分布情况。你观察了30个晚上,并记录了每个晚上进入电梯的人数。
现在,我们将使用泊松分布来描述这个案例。假设平均每天晚上进入电梯的人数为5人。
数学公式推导:
泊松分布的概率质量函数(PMF)可以用以下公式表示:P ( x ; λ ) = e − λ ⋅ λ x x ! P(x; \lambda) = \frac{
{e^{-\lambda} \cdot \lambda^x}}{
{x!}} P(x;λ)=x!e−λ⋅λx其中, x x x 是随机变量的取值,表示每个晚上进入电梯的人数; λ \lambda λ 是平均发生率,即平均每天晚上进入电梯的人数。
对于这个案例,我们有 λ = 5 \lambda = 5 λ=5。
现在,我们可以使用泊松分布的公式来计算每个人数值的概率。假设我们想知道恰好有3个人进入电梯的概率,即 x = 3 x = 3 x=3。
将这些值代入公式,我们得到:
P ( 3 ; 5 ) = e − 5 ⋅ 5 3 3 ! P(3; 5) = \frac{
{e^{-5} \cdot 5^3}}{
{3!}} P(3;5)=3!e−5⋅53计算后,可以得到 P ( 3 ; 5 ) ≈ 0.140 P(3; 5) \approx 0.140 P(3;5)≈0.140
这意味着在这个案例中,每个晚上恰好有3个人进入电梯的概率大约为0.140,即14.0%。
通过类似的方式,可以计算其他进入电梯人数的概率,例如恰好有0人、1人、2人等。
这个例子展示了泊松分布在描述每个晚上进入电梯的人数分布中的应用。泊松分布可以帮助我们理解和预测随机事件发生的次数。通过计算概率,我们可以得到不同人数值的事件发生次数的相对可能性。
- 应用场景:
泊松分布在许多领域中都有广泛的应用。以下是一些泊松分布的应用场景:
- 电话呼叫中心:泊松分布可以用于建模电话呼叫中心中呼叫的到达率和服务员工的处理能力,以评估等待时间和服务质量。
- 网络流量分析:泊松分布可以用于描述网络流量中数据包到达的分布,从而帮助网络管理和流量控制。
- 金融风险管理:泊松分布可以用于模型化金融市场中的事件发生次数,例如交易执行时间、违约事件等。
- 生物统计学:泊松分布可以用于建模和分析遗传学、生态学和流行病学等领域中的事件发生次数,例如疾病发病率、物种出现次数等。
- 与深度学习和机器学习领域模型结合场景:
尽管泊松分布在深度学习和机器学习中的应用相对较少,但仍有一些场景可以结合使用。以下是一些例子:
- 稀疏建模:泊松分布可以用于建模稀疏数据,例如自然图像中的像素值、文本数据中的单词频率等。在深度学习中,稀疏建模可用于特征选择和降维。
- 异常检测:泊松分布可以用于检测异常事件,例如检测网络入侵、异常交易等。在深度学习中,可以结合泊松分布和自编码器等模型进行异常检测。
- 事件计数:在某些任务中,需要对事件发生的次数进行建模和预测,例如社交媒体上的评论数、电商网站上的点击次数等。泊松分布可以用于对这些事件计数数据进行建模。
总结:泊松分布是概率论和统计学中常用的离散概率分布,用于**描述随机事件在一定时间或空间范围内发生的次数。**它由法国数学家泊松首次引入,并以他的名字命名。泊松分布的数学公式描述了每个事件发生次数的概率,应用广泛,包括电话呼叫中心、网络流量分析、金融风险管理和生物统计学等领域。在深度学习和机器学习中,泊松分布可以用于稀疏建模、异常检测和事件计数等场景中。
Beta分布
到这里,如果还有什么疑问
欢迎私信博主问题哦,博主会尽自己能力为你解答疑惑的!
🥳如果对你有帮助,你的赞是对博主最大的支持!!🥳
文章评论