Vivemos em um mundo tridimensional, mas cada um de nossos olhos só é capaz de capturar uma imagem bidimensional. Levante-se por um segundo, mova-se; vê como você sabe quando evitar uma cadeira ou a borda de uma mesa? Isso porque você pode dizer a que distância os objetos estão de você. Isso é extremamente importante de muitas maneiras. Não passamos nossas vidas machucados por bater nos móveis. Somos capazes de dirigir, julgando onde os outros carros estão na estrada e sabendo o quão rápido podemos ir. Pense em quando você julgou mal o degrau final de um lance de escada – você presumiu que era mais alto ou mais baixo do que realmente era. Imagine se isso acontecesse o tempo todo; esse é um mundo sem percepção de profundidade.
A percepção de profundidade é tão importante que pode estar embutida em nossos cérebros. No mínimo, é algo que aprendemos muito cedo. No famoso experimento visual do penhasco de Gibson e Walk , bebês de apenas seis meses perceberam um declive coberto de acrílico e se aproximaram dele nervosamente. A maioria se recusou a atravessar. Gibson e Walk concluíram que esses bebês podiam realmente perceber que a queda estava lá e sabiam que poderia ser perigoso para eles.
Mas como transformamos imagens planas em 3-D? Existem dois tipos principais de dicas de profundidade: binoculares e monoculares . Essas palavras realmente significam ‘dois olhos’ e ‘um olho’; você pode se lembrar disso porque olha pelos binóculos com os dois olhos, mas um verdadeiro cavalheiro inglês mostra o monóculo em apenas um dos olhos. Basicamente, existem algumas pistas de profundidade que podemos perceber com apenas um olho e outras que precisamos de ambos os olhos.
Vamos começar com um exemplo simples. Dê uma olhada em sua mesa; digamos que você tenha um grampeador e algumas canecas antigas. Se você puder ver que o grampeador se sobrepõe na frente de uma das canecas, pode adivinhar – com precisão – que o grampeador está mais perto de você do que a caneca. Esta é uma sugestão de profundidade monocular chamada interposição .
Você já aprendeu sobre perspectiva em uma aula de arte? Se você tentar desenhar uma estrada que desapareça na distância, as linhas convergirão conforme alcançam o horizonte. Da próxima vez que você estiver em um longo trecho da estrada, dê uma olhada: a estrada realmente parece convergir para um ponto à medida que se afasta. Essa sugestão de profundidade monocular é chamada de perspectiva linear ; em uma imagem 2-D plana, as coisas que estão mais distantes parecem se aproximar. Eles também aparecem fisicamente mais acima; esta é a dica de posição . Um carro que está mais adiante na estrada parecerá menor do que o carro do mesmo tamanho próximo; isso é conhecido como tamanho relativo .
![]() |
Se você começar a dirigir por essa estrada, poderá notar que as coisas perto do seu carro parecem se mover muito mais rápido do que as coisas à distância. Isso é chamado de paralaxe de movimento e, mesmo com um olho fechado, daria uma pista da distância que as coisas estão. Alguns animais confiam mais na paralaxe de movimento do que os humanos – você já viu um pássaro balançando a cabeça enquanto olha para frente? O pássaro está tentando realizar sua própria paralaxe de movimento para saber a que distância os vários objetos estão.
Um celeiro distante provavelmente também parece mais confuso e menos distinto do que um galpão próximo. Esta é outra sugestão de profundidade monocular usada por pintores para sugerir que alguns objetos estão mais distantes do que outros e é chamada de gradiente de textura . Você pode ver isso realmente claramente em imagens como um campo de grama, onde as lâminas mais próximas do observador são distintas, mas desbotam para uma lavagem de verde à distância. Uma ideia relacionada é a perspectiva aérea , na qual as coisas à distância parecem mais nebulosas do que as próximas.
Enquanto os sinais de profundidade monocular nos ajudam a aprender coisas sobre o mundo 3-D a partir de uma imagem plana, os sinais de profundidade binoculares estão envolvidos em ajudar nosso cérebro a produzir imagens 3D reais a partir de dados sensoriais planos. Há uma razão para termos dois olhos em vez de um olho gigante de Ciclope – dois olhos um pouco separados um do outro geram duas imagens ligeiramente diferentes para enviar ao cérebro. Isso é conhecido como disparidade retiniana. O cérebro funde essas duas imagens ligeiramente diferentes para criar uma que parece tridimensional. Os filmes 3-D usam esse princípio para obter seu efeito. Você sabe que se você tirar os óculos 3-D o filme parece um pouco confuso? Isso ocorre porque, na verdade, existem duas imagens ligeiramente diferentes na tela ao mesmo tempo, e os óculos filtram a entrada de modo que um olho obtenha uma imagem e o outro, a outra. Em seguida, seu cérebro faz o resto do trabalho, juntando tudo em 3-D completo.
Em distâncias mais curtas, seu cérebro pode dizer a que distância as coisas estão com base nos sinais que recebe dos músculos dos olhos. Para um objeto a menos de 15 metros de distância, seu cérebro pode dizer o quanto seus olhos precisam convergir para vê-lo. Levante o dedo na frente do rosto e olhe para ele; agora traga para mais perto. À medida que fica realmente perto, você definitivamente vai sentir seus olhos se cruzarem mais e mais; pode até ficar desconfortável. Isso está acontecendo de uma maneira menos extrema o tempo todo, e seu cérebro pode calcular o ângulo de convergência entre os olhos e usá-lo para descobrir a que distância algo está. O cérebro também pode tirar proveito da capacidade das lentes dos seus olhos de alterar sua curvatura ao focar em objetos específicos; ele sabe o quanto eles mudaram e pode usar isso para avaliar a profundidade em pequenas distâncias próximas.
Então, para resumir as coisas, nossos cérebros têm todos os tipos de maneiras interessantes de fazer imagens 3-D a partir de entradas 2-D. Essa habilidade é importante, e talvez até mesmo embutida em nós, porque nos ajuda a funcionar em nosso mundo 3-D. O cérebro pode usar pistas monoculares de profundidade, como perspectiva ou paralaxe de movimento , que dependem da entrada de um olho ou do outro. Ele também pode usar dicas de profundidade binocular , que dependem das imagens ligeiramente diferentes que nossos olhos posicionados de maneira diferente trazem para o cérebro e também de como eles precisam se mover para focalizar objetos a distâncias diferentes.