Biología

Aplicando Distribuições Geométricas às Estatísticas

Uma experiência de lançamento de moedas

Suponha que estejamos jogando uma moeda de dois lados. Além disso, digamos que a probabilidade de uma cabeça aparecer em qualquer lance é de 0,3, e que os lances são feitos independentemente. Seja X o número de lançamentos necessários antes de vermos o lado da cabeça pela primeira vez. Com esta informação, podemos derivar a distribuição de X . Por exemplo, a chance de que X = 4 seria

nulo

Isso porque para que X = 4 ocorra, é necessário que tenhamos três caudas consecutivas seguidas de uma cabeça no quarto lançamento. Em outras palavras, X = 4 e o resultado TTTH são equivalentes. Da mesma forma, podemos argumentar que para qualquer dado a = 1, 2, 3, 4, …..

nulo

Assim, a distribuição de X é a fórmula

nulo

De modo mais geral, se a probabilidade de ver a cabeça for p , então a distribuição de X é

nulo

(1) é conhecida como distribuição geométrica com probabilidade de sucesso p . Nas próximas seções, estudaremos algumas das propriedades notáveis ​​da distribuição geométrica. Em seguida, continuamos com várias aplicações práticas.

Expectativa de uma variável aleatória geométrica

Aqui está uma pergunta que podemos fazer em relação ao experimento de lançamento da moeda: Em média, quantos lançamentos serão necessários antes que nossa primeira cara apareça? Com base em nossa intuição, isso deve depender da probabilidade de sucesso p . Se a chance de uma cara for pequena, então deve haver muitos lançamentos de moeda antes que a primeira cara apareça. Por outro lado, se a chance de uma cabeça for grande, poderemos ver a primeira cabeça nos primeiros arremessos.

Para confirmar nossa intuição, derivamos a expectativa de X usando uma fórmula para a expectativa de variável aleatória discreta junto com uma série geométrica . Os dois teoremas de que precisamos estão listados abaixo.

Primeiro, definimos a expectativa de uma variável aleatória discreta.

Definição: expectativa de X

Seja X uma variável aleatória discreta. Em seguida, definimos a expectativa de X como

nulo

onde S é o conjunto de todos os valores para X .

Às vezes, é mais conveniente usar o seguinte teorema para calcular a expectativa. Como veremos para este caso particular de distribuição, o teorema a seguir economiza muito trabalho.

Teorema: Fórmula de probabilidade de cauda para a expectativa

Suponha que X seja uma variável aleatória discreta não negativa. Então

nulo

onde novamente, S é o conjunto de todos os valores que X pode assumir.

O segundo resultado de que precisamos é estudado em cálculo e é conhecido como Teorema das Séries Geométricas :

Teorema: Teorema das Séries Geométricas

nulo

nulo

Para começar a base para nossa derivação, considere o evento

nulo

onde a = 1, 2, 3, 4, ….

Se não vemos o nosso primeiro cabeça até que lance uma ou mais tarde, em seguida, o primeiro um – 1 tosses tinha que ser caudas. Por outro lado, se os primeiros lançamentos a – 1 fossem coroa, então a primeira cara não ocorreria antes do lançamento a . Em outras palavras, os dois conjuntos são iguais.

nulo

Portanto, para a = 1, 2, 3, 4, ….,

nulo

Agora, aplicando (3) e (4), chegamos à fórmula para a expectativa de X :

nulo

Portanto, se p = 1/4, então, em média, seriam necessários quatro lançamentos antes de vermos cara. Se p = 1/2, em média seriam necessários dois e assim por diante. A expectativa está inversamente relacionada à probabilidade de sucesso, e isso concorda com nossa intuição.

A distribuição geométrica tem outra propriedade interessante conhecida como propriedade sem memória. Continuaremos na próxima seção para examinar isso mais de perto.

Propriedade sem memória de uma variável aleatória geométrica

Suponha que já tenhamos jogado a moeda mais de n vezes sem ver a cara. Em seguida, perguntamos qual é a probabilidade condicional de ter que jogar a moeda mais m vezes (além de n lances) sem ver uma cara. Ou seja, procuramos calcular a seguinte probabilidade condicional.

nulo

Para relembrar, a probabilidade condicional de que o evento B ocorra dado que o evento A ocorreu é definida como

nulo

De acordo com (5), temos que

nulo

para m = 1, 2, 3, 4, …., e n = 1, 2, 3, 4, ….

Agora, lembrando de nosso trabalho anterior sobre expectativa, sabemos que para qualquer a = 1, 2, 3, 4, ….

nulo

Ao aplicar (7) a (6), chegamos a

nulo

ou

nulo

para m = 1, 2, 3, 4, …., e n = 1, 2, 3, 4, ….

(8) é conhecida como propriedade sem memória . Ele recebe esse nome pelo fato de que a distribuição geométrica não tem memória do passado. n lançamentos aconteceram, e nenhuma cabeça foi vista. Agora o experimento continua começando com o lançamento n + 1, mas no sentido de (8), é como se estivéssemos começando do lançamento um.

Agora continuamos nossa discussão sobre a distribuição geométrica com dois exemplos práticos que são relevantes para as três seções anteriores mostradas nesta lição.

Exemplos de distribuição geométrica

Exemplo 1

Suponha que tiremos uma sequência de cartas de um baralho de 52 cartas padrão. Cada vez que um card é comprado, nós o colocamos de volta no baralho, então cada vez que sacamos, estamos comprando do baralho completo. Continuaremos a tirar uma carta do baralho até observarmos uma carta que não seja de espadas. Suponha que cada uma das cartas tenha a mesma probabilidade de ser sacada.

uma. Qual é a probabilidade de precisarmos de pelo menos três draw antes de vermos uma carta com um naipe que não seja de espadas?

b. Seja X o número de cartas compradas até que vejamos um naipe que não seja de espadas. Qual é a expectativa de X ?

Solução

uma. Existem quatro naipes: copas, trevos, ouros e espadas. Supondo que as cartas tenham a mesma probabilidade de serem selecionadas, a proporção de cartas que não são de espadas é 3/4. A afirmação equivalente de obter pelo menos três empates aqui é ver uma espada nos dois primeiros empates. Portanto,

nulo

b. Reconheça que a probabilidade de sucesso é p = 3/4, o que significa que a distribuição de X é

nulo

A expectativa de X é

nulo

Exemplo 2

Um medicamento é 99% eficaz em qualquer paciente. Os pacientes tomam os medicamentos independentemente uns dos outros. Quando o medicamento não consegue curar um paciente pela primeira vez, o medicamento deve ser recolocado em recall. Suponha que a cada dia, dois pacientes experimentem a droga.

uma. Derive a distribuição de X , o número de pacientes que tomaram o medicamento antes de entrar em recall.

b. Usando (a), calcule a probabilidade de que pelo menos 100 pacientes tenham tomado a droga antes de ela entrar em recall.

c. Suponha que mais de 50 pacientes tenham tomado o medicamento e ele ainda não foi colocado em recall. Qual é a probabilidade de que pelo menos 100 pacientes tenham tomado o medicamento antes que ele vá para o recall?

d. Seja Y o número de dias antes de o medicamento entrar em recall. Calcular a expectativa de Y .

Solução

uma. O sucesso é quando o medicamento não consegue curar um paciente, e isso acontece com probabilidade 0,01. Portanto, a distribuição de X é

nulo

b. De (a), este é

nulo

c. Usando a fórmula de probabilidade condicional, isso é

nulo

d. Como a cada dia dois pacientes experimentam a droga, há o dobro de pacientes do que dias. Isto é, X = 2, Y . Pela linearidade da expectativa,

nulo

Portanto, em média, leva 50 dias para que esse medicamento seja retirado.

Resumo

A distribuição geométrica surge de tentativas repetidas com dois resultados. As tentativas são repetidas até que ocorra o sucesso desejado, e o número de tentativas necessárias para que o sucesso ocorra tem a distribuição geométrica.

A probabilidade de sucesso está inversamente relacionada ao número esperado de tentativas até o sucesso. Se a chance de sucesso for pequena, esperaríamos muitas tentativas antes de ver o sucesso, e se a chance de sucesso for grande, esperaríamos poucas tentativas antes de ocorrer um sucesso.

A distribuição geométrica é uma distribuição discreta com a propriedade de menos memória . Essencialmente, o experimento recomeça e não tem memória do passado. Dado que jogamos uma moeda pelo menos n + 1 vezes, a probabilidade de precisarmos jogar pelo menos n + m vezes é a mesma que seria para jogar pelo menos m vezes começando do zero.