Home » Consultoria » Reciprocidade e “soma não zero”: a simulação

Reciprocidade e “soma não zero”: a simulação

Em 1980, um cientista chamado Robert Axelrod resolveu modelar conflitos de interesse dos tipos que vimos em posts anteriores.

Ele imaginou encontros em que dois indivíduos poderiam adotar atitudes “soma zero” ou “não zero”, escolhendo entre cooperar ou tentar explorar o outro de alguma forma. Axelrod notou que os grandes conflitos “interesse individual X interesse coletivo” da vida em sociedade (mesmo os que envolvem grupos grandes de pessoas), poderiam ser simulados por meio de encontros entre dois indivíduos. Nesses encontros três situações seriam possíveis:
Nenhuma tenta se “dar bem” às custas da outra (ambas “cooperam”);
Ambas tentam “se dar bem” às custas uma da outra – elas traem uma à outra (“defect”, em inglês).
Uma coopera e a outra trai.

Ele atribuiu pontos a cada forma de agir e convidou vários pesquisadores a apresentarem programas com estratégias que seriam usadas em encontros com os programas dos demais participantes. Os pontos foram atribuídos assim:

– Se eu traio e você coopera, eu ganho $500 e você é multado em $100;

– Se eu coopero e você trai, você ganha $500 e eu sou multado em $100;

– Se ambos cooperamos, nós dois ganhamos $300 cada;

– Se ambos traímos ambos somos multados em $10.

Note que há um apelo extra à ambição – a cada encontro, o ganho por trair é maior que o ganho por cooperar; a tentação para trapacear é grande.

Cada encontro de programas era análogo a um lance de jogo de xadrez em que cada jogador faz um movimento considerando o que o oponente fizera antes. Venceria o programa que acumulasse mais pontos depois de se confrontar duzentas vezes seguidas com cada outro programa presente no torneio.

Qualquer tipo de estratégia poderia ser representada na competição; por exemplo, uma estratégia “generosa” que sempre perdoasse as traições do outro. Uma “cínica” que perdoasse traições até certo encontro (até o centésimo encontro, digamos) fingindo ser boazinha e, depois, traísse sistematicamente até o último encontro. Uma que sempre traísse. Uma que só cooperasse, independentemente do que o outro fizesse. Uma que traísse e cooperasse alternadamente na sequência dos vários encontros. Enfim, as possibilidades eram infinitas.

Qual estratégia acumulou mais pontos? Qual o comportamento “vencedor”?

De todos os programas inscritos alguns representavam estratégias muito complexas, mas o vencedor, para surpresa geral, foi um que adotava um comportamento muito simples chamado de TFT  “Tit for Tat”- em tradução livre, “olho por olho”.

“Tit for Tat” foi implementada por um software de apenas quatro linhas. Ela sempre começa cooperando e depois faz exatamente o que o oponente tiver feito no encontro anterior: trai se tiver sido traída, coopera caso tenha obtido cooperação.

Depois que apareceu como vencedora TFT foi desafiada e venceu mesmo em torneios em que os demais competidores apresentaram programas desenhados especificamente para batê-la. A regra vencedora que emergiu significa simplesmente: “eu dou na medida do que recebo”- faço com você o que você tiver feito comigo.

Repare que TFT vence sem derrotar ninguém, ela apenas retribui na mesma moeda, portanto, o máximo que consegue é empatar cada lance com o lance anterior do oponente. Ela ganha o torneio porque acumula mais pontos em sequencias de encontros. TFT é a estratégia que se dá melhor ao longo do tempo contra todas as demais possíveis estratégias e ganha o campeonato sem vencer nenhum jogo, só empatando.

Isso não é possível no mundo do futebol, volley, xadrez ou tênis, porque esses jogos são soma zero por definição. Mas as interações sociais não tem que ser “soma zero”, ao contrário. No jogo da convivência social, a melhor estratégia é a que nunca tenta levar vantagem, o empate é bom sempre.

A simulação experimental de Axelrod é considerada até hoje um dos trabalhos científicos mais profundos do século XX. A vitória de TFT foi uma enorme surpresa, e motivou uma infinidade de novos estudos e pesquisas. O próprio Axelrod mostrou que TFT é robusta mesmo quando os agentes envolvidos não são conscientes (bichos), e que é extremamente difícil que um traidor (um tipo “soma zero”) que entre num grupo em que todos pratiquem TFT consiga se dar bem. Ou seja, um grupo que pratique TFT expulsa os metidos a malandros que buscam se dar bem traindo o grupo.

Reciprocidade é a chave para um ambiente em que todos ganham! Sem reciprocidade, mesmo as melhores iniciativas se corrompem. Quando existe, a reciprocidade enquadra egoísmos individuais e a organização/empresa/país pode prosperar. Ideias que dão certo só podem surgir e se entranhar em ambientes em que a reciprocidade seja a norma!

Fonte: Inovatrix – Inovação na prática