O que é uma matriz de payoff?
Um dos jogos mais populares para crianças (e adultos indecisos) é Pedra, Papel, Tesoura. As regras são simples: conte até 3 e mostre ao seu oponente se você escolheu pedra, papel ou tesoura. O rock é representado por um punho fechado; o papel é representado por uma mão aberta; e a tesoura é representada pela extensão do dedo indicador e do dedo médio. A pedra vence a tesoura; a tesoura bate o papel; e o papel vence o rock. Rock, Paper, Scissors é um dos jogos de estratégia mais básicos que existem. É considerado um jogo de estratégia porque cada jogador escolhe sua estratégia (pedra, papel ou tesoura) com base no que pensa que seu oponente escolherá.
Embora as regras para Pedra, Papel e Tesoura sejam relativamente fáceis de lembrar, você pode resumi-las ainda melhor usando uma matriz de recompensa. Uma matriz de recompensa _ é definida como uma representação visual de todos os resultados possíveis que podem ocorrer quando duas pessoas ou grupos precisam tomar uma decisão estratégica. A decisão é chamada de decisão estratégica porque cada tomador de decisão deve levar em consideração como sua escolha afetará a escolha de seu oponente e como a escolha de seu oponente afetará sua própria escolha. A matriz de recompensa ilustra cada estratégia possível que um lado pode escolher, bem como cada combinação de resultados possíveis com base na escolha de cada oponente.
Como é uma matriz de payoffs
Agora, antes de correr para jogar Pedra, Papel e Tesoura com a pessoa mais próxima que puder encontrar (para fins educacionais!), Você ainda precisa ver como é a matriz de recompensa. Aqui está um exemplo da matriz de recompensa Pedra, Papel, Tesoura:
![]() |
A matriz de recompensa tem três partes básicas:
Oponentes: neste caso, são o Jogador 1 e o Jogador 2.
Estratégias: são pedra, papel e tesoura. As estratégias do Jogador 1 estão ao longo do lado vertical da matriz e as estratégias do Jogador 2 estão ao longo do lado horizontal da matriz.
Resultados: Os resultados possíveis para este jogo são: ganhar, perder, empatar. Uma ‘vitória’ é representada por 1, uma ‘derrota’ é representada por -1 e um ‘empate’ é representado por 0.
Para determinar o resultado de um jogo, você escolherá a linha da estratégia escolhida pelo Jogador 1 e a coluna da estratégia escolhida pelo Jogador 2. A caixa correspondente tem 2 números; o primeiro número (em vermelho) é o resultado para o Jogador 1, e o segundo número (em azul) é o resultado para o Jogador 2. Portanto, se o Jogador 1 escolher Pedra e o Jogador 2 escolher papel, o resultado será -1,1 porque O jogador 2 vencerá.
Análise de resultados
Um método eficaz para analisar todos os resultados possíveis é determinar o resultado agregado de cada estratégia possível. O resultado agregado é determinado adicionando os dois resultados em uma única caixa. Se você fizer isso para o jogo Pedra, Papel, Tesoura, notará que todos os resultados agregados são iguais a 0. Um resultado agregado de 0 significa que as únicas possibilidades são que um jogador vença e o outro perca, ou que ambos os jogadores empatem . Este não é o caso em todas as tomadas de decisão. Na maioria das decisões da vida real, haverá resultados agregados variados. Isso pode ajudar a determinar a estratégia que um oponente pode escolher. Por exemplo, pegue esta matriz de recompensa:
![]() |
Isso representa uma situação hipotética na qual você provavelmente nunca se encontrará. Nesta situação, você e outra pessoa são presos por um crime. A polícia separa você durante o interrogatório e diz que se você confessar o crime e seu parceiro confessar o crime, cada um de vocês receberá 1 ano de prisão. Se você confessar e seu parceiro negar, você receberá 3 anos de prisão e seu parceiro será libertado. Se ambos negarem, cada um de vocês pegará 2 anos de prisão.
Ao determinar os resultados agregados, você verá que as possibilidades são 4, 3 e 2. Assumiremos que você deseja que o tempo total que você e seu parceiro passam na prisão seja o menor tempo possível; ambos escolheriam a opção que nos dá o resultado de 2, que é que ambos confessam o crime. Obviamente, não é assim que funciona o mundo real, mas é uma excelente representação de como aplicar resultados agregados à sua tomada de decisão.
Resumo da lição
Uma matriz de payoff é uma ferramenta usada para simplificar todos os resultados possíveis de uma decisão estratégica. É uma representação visual de todas as estratégias possíveis e todos os resultados possíveis. Sua tomada de decisão pode ser ajudada pela análise de todos os resultados possíveis por meio do cálculo do resultado agregado e fazendo uma previsão sobre qual estratégia seu oponente pode escolher.
Por que usar uma matriz de payoff?
![]() |
- Uma matriz de recompensa é uma representação visual dos resultados possíveis de uma decisão estratégica.
- Uma matriz de recompensa inclui dados para oponentes, estratégias e resultados.
- Uma matriz de payoff pode ser usada para calcular o resultado agregado e prever uma estratégia.
Resultados de Aprendizagem
O processo de aprendizado de vários aspectos da matriz de recompensa pode prepará-lo para:
- Definir e reconhecer uma matriz de recompensa
- Descreva suas três partes básicas
- Implementar um método para analisar todos os resultados possíveis