Pare um segundo e repare: provavelmente você está lendo isto numa tela. E, ao longo de hoje, vai olhar para uma dessas centenas de vezes — o celular no café da manhã, o computador no trabalho, a TV à noite, o celular de novo antes de dormir. A tela virou o centro da nossa vida digital há quase duas décadas. Agora, um grupo poderoso de empresas do Vale do Silício decidiu que esse reinado precisa acabar. E a arma que escolheram para destroná-lo é a mais antiga de todas: a voz.
A ideia pode soar estranha à primeira vista, mas o movimento é real, coordenado e está sendo bancado com bilhões de dólares. A aposta é que a próxima grande forma de conversar com a inteligência artificial não será tocando num vidro iluminado — será simplesmente falando, e ouvindo de volta. Vamos entender por que isso está acontecendo agora, quem está liderando e o que muda para você.
O sinal mais claro: a aposta da OpenAI em áudio
A pista mais reveladora dessa virada veio da OpenAI. Segundo reportagem do site The Information, a empresa dona do ChatGPT reorganizou, ao longo de meses, várias equipes de engenharia, produto e pesquisa com um único objetivo: reconstruir do zero seus modelos de áudio.
E não é para deixar o ChatGPT “com a voz mais bonita”. O novo modelo de áudio, segundo o relato, deve soar muito mais natural, lidar com interrupções como um interlocutor de verdade e — o detalhe mais curioso — conseguir falar enquanto você ainda está falando, algo que os assistentes de hoje simplesmente não fazem. Quem já tentou conversar com a Siri ou a Alexa e teve que esperar a frase inteira terminar antes de poder reagir sabe exatamente a barreira que isso derruba.
Tudo isso é preparação para uma ambição maior: um dispositivo pessoal centrado em áudio, sem tela, que a OpenAI vem desenvolvendo. A leitura interna da empresa, segundo as fontes ouvidas pelo The Information, é que uma experiência realmente boa por voz exige controle direto sobre o aparelho — e não dá para depender só do celular dos outros.
O nome por trás do projeto: Jony Ive, o homem que desenhou o iPhone
Aqui a história ganha um personagem de peso. O dispositivo da OpenAI está sendo desenhado por Jony Ive — sim, o lendário designer britânico responsável pela aparência do iPhone, do iPad, do iMac e de praticamente todos os produtos icônicos da Apple por quase três décadas.
A OpenAI comprou a startup de hardware de Ive, a io, por cerca de US$ 6,5 bilhões em maio de 2025. E há uma ironia deliciosa nessa história: o homem que ajudou a criar o objeto que mais prende nossos olhos hoje — o smartphone — agora quer construir o oposto. Em entrevistas, Ive deixou claro que enxerga o design centrado em áudio como uma chance de “corrigir os erros” dos aparelhos que vieram antes, justamente os que nos deixaram viciados em telas.
Sam Altman, CEO da OpenAI, descreveu a ambição de forma quase poética ao anunciar a parceria. Segundo ele, o significado de usar tecnologia pode mudar profundamente, e a esperança é resgatar um pouco do encantamento que ele sentiu ao usar um computador da Apple pela primeira vez, há 30 anos. Ele chama o aparelho de um possível “terceiro dispositivo central”, ao lado do computador e do celular.
O que se sabe até agora, a partir de relatos de veículos como Financial Times e Axios: seria um aparelho de bolso, do tamanho de um smartphone mas sem tela, capaz de captar áudio e até imagem por sensores, funcionando mais como um companheiro discreto do que como uma ferramenta. O diretor de assuntos globais da OpenAI, Chris Lehane, chegou a confirmar em Davos que o primeiro produto deve aparecer na segunda metade de 2026 — embora relatos mais recentes apontem que o cronograma pode escorregar para 2027.
Não é só a OpenAI: todo mundo está apostando o mesmo
O que torna esse movimento mais do que um capricho de uma empresa é que, ao olhar em volta, todos os grandes nomes estão fazendo a mesma aposta — cada um do seu jeito.
A Meta lançou um recurso para seus óculos inteligentes Ray-Ban que usa um conjunto de cinco microfones para ajudar a ouvir conversas em ambientes barulhentos — transformando, na prática, o seu rosto num aparelho direcional de escuta. O Google começou a testar os “Audio Overviews”, que transformam resultados de busca em resumos conversados, como se um locutor lesse a resposta para você. A Tesla integrou o Grok, o chatbot da xAI de Elon Musk, aos seus carros, criando um assistente de voz que cuida de tudo, da navegação ao ar-condicionado, por diálogo natural. E os assistentes de voz, vale lembrar, já estão presentes em mais de um terço dos lares americanos por meio das caixinhas inteligentes.
Os formatos variam — óculos, carro, caixa de som, aparelho de bolso —, mas a tese é uma só: o áudio é a interface do futuro. Cada espaço da sua vida — a casa, o carro, até o seu rosto — está virando uma superfície de controle por voz.
O cemitério de quem tentou antes
Antes de comprar a ideia de que o futuro sem tela é garantido, vale uma dose de realismo — e a história recente oferece de sobra.
O caminho dos dispositivos de IA sem tela está cheio de fracassos retumbantes. O caso mais famoso é o do Humane AI Pin, um broche vestível que prometia substituir o celular: a empresa queimou centenas de milhões de dólares antes do produto virar um símbolo de como não fazer. O colar Friend AI, que promete gravar sua vida e oferecer companhia, dividiu opiniões entre fascínio e pânico sobre privacidade. E novas tentativas continuam surgindo — startups apostam em anéis inteligentes com IA para 2026, daqueles em que você literalmente fala com a mão.
Há também um obstáculo que parece pequeno, mas que pode ser o mais difícil de todos: ensinar a máquina a ficar quieta. Segundo o Financial Times, um dos maiores desafios técnicos do dispositivo da OpenAI é justamente fazê-lo entender quando se manifestar e, principalmente, quando calar a boca. Um aparelho que está sempre ouvindo, para ser útil, precisa ter o bom senso social de não virar um palpiteiro eletrônico irritante. Como resumiu uma análise sobre o projeto, a grande dificuldade não é fazer a IA falar — é ensiná-la o valor do silêncio.
Por que isso importa para você
Pode parecer um debate distante, de gigantes da tecnologia brigando por uma nova moda. Mas as implicações são bem concretas para qualquer pessoa.
A forma como trabalhamos pode mudar. Se a interação por voz amadurecer de verdade, ditar um e-mail, pedir um resumo de reunião ou consultar uma informação enquanto você dirige ou cozinha pode se tornar tão natural quanto digitar é hoje. Para quem trabalha com as mãos ocupadas, ou em movimento, isso é potencialmente libertador.
A relação com a tecnologia pode ficar mais saudável — ou nem tanto. O argumento de quem defende o “sem tela” é nobre: reduzir o vício em telas, tirar nossos olhos do vidro, devolver presença ao mundo real. Mas há o outro lado. Um aparelho que está sempre ouvindo levanta questões sérias de privacidade — quem mais escuta? Onde vão parar esses dados? E trocar o vício na tela por uma dependência de um “companheiro” que fala no seu ouvido o dia todo não é, necessariamente, mais saudável.
O timing ainda é incerto. Apesar de toda a empolgação e dos bilhões investidos, esses produtos enfrentam desafios reais de engenharia, privacidade e aceitação. O próprio dispositivo da OpenAI já viu seu cronograma escorregar. Vale acompanhar com interesse, mas sem comprar a promessa de que a tela morre amanhã.
Conclusão
A “guerra contra as telas” é uma das apostas mais ambiciosas e fascinantes da tecnologia neste momento. De um lado, a promessa sedutora de uma IA que conversa com você de forma natural, presente quando útil e silenciosa quando não, libertando seus olhos do celular. De outro, um histórico de fracassos, desafios técnicos espinhosos e preocupações legítimas sobre privacidade e dependência.
O mais provável não é que as telas desapareçam, mas que a voz ganhe espaço ao lado delas — mais uma forma de conversar com a tecnologia, não a única. E, como em toda mudança grande, quem entender o movimento antes que ele chegue sai na frente.
Se há uma lição que atravessa essa história, é esta: a tecnologia mais avançada do mundo está, ironicamente, tentando aprender algo profundamente humano — a hora de falar e a hora de ouvir. Talvez o futuro da inteligência artificial dependa menos de quão inteligente ela é, e mais de quão bem ela entende o momento certo de simplesmente ficar quieta.
