Matemática

Função de densidade de probabilidade: definição, fórmula e exemplos

Antecedentes em Modelos de Probabilidade

Modelos de probabilidade, que quantificam as chances de ocorrência de um evento aleatório, são comuns na vida cotidiana. Veja, por exemplo, jogar uma moeda justa. Acreditamos que, se uma moeda justa for lançada, ela terá chances iguais de dar cara ou coroa. O que isso significa na prática é que, se jogarmos a moeda um grande número de vezes, metade das vezes a moeda mostrará cara e a outra metade mostrará coroa. Portanto, atribuímos probabilidade ½ às caras e ½ às caudas dos resultados. Este é um exemplo de modelo de probabilidade .

No entanto, a atribuição de probabilidades a certos eventos nem sempre funciona. Um exemplo é um jogo de dardos. Qual é a diferença entre lançar moedas e dardos? Em particular, um jogo de dardos é uma situação em que o resultado (a posição final do dardo) pode assumir uma gama contínua de valores.

Mais especificamente, suponha que você esteja jogando dardos em um alvo de dardos e queira determinar a probabilidade de acertar um ponto que está exatamente no eixo vertical, cinco centímetros acima do centro. Como no exemplo do cara ou coroa que examinamos no início, a probabilidade que atribuiríamos a esse resultado é a fração de dardos que atingiu esse ponto preciso depois de lançar um grande número de dardos.

No entanto, é improvável que qualquer dardo atinja aquele ponto exato e, portanto, mesmo no limite de um número infinito de lançamentos, a probabilidade de acertar um único ponto é extremamente pequena. Embora esse problema pareça complicar a construção de um modelo de probabilidade, não tem consequências para o jogo de dardos na prática, porque a determinação da pontuação depende de encontrar o dardo em certas regiões finitas do tabuleiro. Então, como podemos relacionar a probabilidade quase zero de acertar qualquer ponto em particular com a probabilidade de um dardo acertar uma determinada região de pontuação do tabuleiro? Uma função de densidade de probabilidade resolve esse problema.

Funções de densidade de probabilidade

Para fazer um modelo de probabilidade para um cenário onde os resultados de eventos aleatórios são numericamente avaliados em uma faixa contínua, como no exemplo do alvo de dardos, uma função de densidade de probabilidade f (x) deve ser fornecida. Esta função fornece uma maneira de atribuir probabilidades não a resultados individuais, mas a intervalos de resultados – como regiões de pontuação de um alvo de dardos. Cientistas e engenheiros costumam adivinhar a forma exata dessa função. A variável independente x disso, a função de densidade de probabilidade, assume valores dentro da faixa contínua de resultados possíveis de um processo aleatório. Consequentemente, x é chamado de variável aleatória contínua. A localização de um dardo lançado em um alvo de dardos é uma variável aleatória contínua porque entre quaisquer dois locais possíveis, você pode encontrar outro resultado possível.

Se tivéssemos uma função de densidade de probabilidade f (x) para dardos atingirem um alvo de dardos, ou qualquer outro processo aleatório envolvendo uma variável aleatória contínua, como calcularíamos a probabilidade de um evento, como acertar o alvo em um alvo de dardos? De acordo com a teoria da probabilidade, a probabilidade de medir um resultado dentro de um intervalo finito pode ser calculada integrando a função de densidade de probabilidade ao longo do intervalo de interesse:

probabilidade

Pr [A≤ x ≤B] significa a probabilidade de um resultado dentro do intervalo de A para B . Por exemplo, o tamanho do pé em centímetros é uma variável aleatória contínua. Se você deseja saber a probabilidade de escolher alguém com comprimento de pé entre 21 e 22 centímetros de uma amostra aleatória e acredita que a função de densidade de probabilidade que descreve a distribuição de comprimentos de pé em centímetros é f (x) , então você integraria f (x) de x = 21 cm a x = 22 cm.

Propriedades Gerais Importantes

Esta prescrição para obter probabilidades de funções de densidade implica em duas propriedades importantes que uma função de densidade de probabilidade deve ter para modelar um resultado real de um processo aleatório. Primeiro, uma função de densidade de probabilidade deve ser não negativa (ou seja, f (x)> 0 para todos os valores x ). Em segundo lugar, uma função de densidade de probabilidade que deve obedecer a uma regra é chamada de condição de normalização. A condição de normalização diz:

normalização

O intervalo de integração ‘todos x’ significa sobre todos os resultados possíveis (mesmo os resultados mais improváveis) da medição. No exemplo do alvo de dardos, ‘todos os x’ significaria sobre o tabuleiro inteiro, a parede próxima e o chão, já que alguns lançadores de dardo inexperientes erram totalmente o tabuleiro. Traduzida para a linguagem cotidiana, a condição de normalização significa que esperamos que todos os resultados possíveis caiam em algum lugar dentro da faixa de valores possíveis, embora improváveis.

Alguns exemplos

Quando as funções de densidade de probabilidade são usadas para descrever cenários do mundo real, os cientistas muitas vezes precisam fazer suposições fundamentadas sobre a forma matemática da função de densidade de probabilidade. Nesta seção, apresentamos as duas funções de densidade de probabilidade mais comuns.

O primeiro é a densidade de probabilidade uniforme . É uma função constante: f (x) = C onde C é uma constante. Essa densidade de probabilidade significa que todos os resultados possíveis são igualmente prováveis ​​dentro da faixa de resultados possíveis. Quando isso pode ser um bom palpite? Se considerarmos os dardos novamente, alguém que nunca jogou dardos antes e que foi vendado em uma posição de frente para o tabuleiro produziria uma distribuição de dardos que é provavelmente uniforme sobre o alvo, a parede e o chão próximo. Todos os pontos na parede, no chão e no tabuleiro têm a mesma probabilidade de serem atingidos por jogadores de dardos inexperientes.

Na prática, como sabemos a que a constante é igual? É aqui que a condição de normalização é útil: a constante é igual a tudo o que produz uma função de densidade de probabilidade normalizada. Especificamente, se o intervalo de resultados possíveis é de x = X 1 a x = X 2 , então a função de densidade de probabilidade uniforme é

pdf uniforme

porque a integração dessa constante no intervalo de X 1 a X 2 é igual a 1.

Outra função de densidade de probabilidade é a densidade de probabilidade normal , às vezes chamada de distribuição normal . Essa densidade de probabilidade é útil quando resultados aleatórios são agrupados em torno de um ponto central. Usando o exemplo dos dardos novamente, alguém com experiência em jogar dardos produz uma distribuição de dardos descrita por uma densidade normal, centrada no centro do alvo.

Resumo da lição

As funções de densidade de probabilidade são usadas para descrever cenários em que um resultado aleatório pode assumir uma faixa contínua de valores, e essa faixa contínua de resultados torna sempre uma chance zero de prever um resultado exato. A integração de uma função de densidade de probabilidade permite calcular uma probabilidade de medir um valor dentro de um determinado intervalo de resultados possíveis.

Discutimos duas propriedades das funções de densidade de probabilidade: não negatividade e a condição de normalização , o que significa que esperamos que todos os resultados possíveis caiam em algum lugar dentro da faixa de valores possíveis, se improváveis. Duas funções de densidade de probabilidade comuns são a densidade de probabilidade uniforme , o que significa que todos os resultados possíveis são igualmente prováveis ​​dentro da faixa de resultados possíveis (como entre 0 e 1), e a densidade de probabilidade normal , também conhecida como distribuição normal, e é útil quando resultados aleatórios são agrupados em torno de um ponto central.