概率
简单地说,机器学习就是做出预测。
第一个例子:根据照片区分猫和狗
首先,问题的难度可能取决于图像的分辨率。
虽然人类很容易以160×160像素的分辨率识别猫和狗, 但它在40×40像素上变得具有挑战性,而且在10×10像素下几乎是不可能的。
换句话说,我们在很远的距离(从而降低分辨率)区分猫和狗的能力可能会变为猜测。
如果完全肯定图像是一只猫,我们说标签𝑦是"猫"的概率,表示为𝑃(𝑦=“猫”)等于1。
第二个例子:给出一些天气监测数据,预测明天北京下雨的概率。 如果是夏天,下雨的概率是0.5。
在这两种情况下,我们都不确定结果,但这两种情况之间有一个关键区别。
-
在第一种情况中,图像实际上是狗或猫二选一。
-
在第二种情况下,结果实际上是一个随机的事件。
因此,概率是一种灵活的语言,用于说明我们的确定程度
基本概率论
大数定律(law of large numbers): 随着投掷次数的增加,这个估计值会越来越接近真实的潜在概率
首先,导入必要的软件包。
%matplotlib inline
import torch
from torch.distributions import multinomial
from d2l import torch as d2l
在统计学中,把从概率分布中抽取样本的过程称为抽样(sampling)。
可以把分布(distribution)看作是对事件的概率分配
将概率分配给一些离散选择的分布称为多项分布(multinomial distribution)。
为了抽取一个样本,即掷骰子,我们只需传入一个概率向量。
输出是另一个相同长度的向量:它在索引𝑖处的值是采样结果中𝑖出现的次数。
fair_probs = t
文章评论