Em uma era onde a tecnologia confunde as fronteiras entre realidade e ilusão, os deepfakes emergem como ferramentas poderosas que oferecem possibilidades criativas para o entretenimento e a criação de conteúdo. No entanto, também desempenham um papel preocupante na disseminação de desinformação online. No último ano, o FBI relatou impressionantes US$ 12,5 bilhões em golpes online, com 39% das vítimas caindo em vídeos deepfake gerados por IA que manipulavam ou deturpavam ações e palavras de indivíduos. A questão ganhou destaque em setembro, quando o ex-presidente Trump postou uma imagem deepfake de Taylor Swift no Truth Social. A imagem falsamente retratava a superstar vestida como o Tio Sam, sugerindo que ela apoiava sua campanha presidencial republicana. Isso causou alvoroço, levando Swift a endossar publicamente a vice-presidente Kamala Harris no Instagram, em parte para refutar o deepfake gerado por IA.
Conforme a tecnologia deepfake continua a avançar, ela está remodelando nossa percepção da verdade na era digital. Esses meios sintéticos altamente convincentes têm o poder de obscurecer as fronteiras entre realidade e ilusão, com implicações profundas para a criação de conteúdo, confiança e a própria natureza da realidade. Neste artigo, exploraremos o que são deepfakes, como funcionam e o impacto profundo que estão tendo na criação de conteúdo, confiança e na própria natureza da realidade.
O que é Deepfake
Deepfakes são criações digitais que utilizam inteligência artificial para alterar vídeos, imagens ou áudio, fazendo parecer que alguém está fazendo ou dizendo algo que nunca fez. O termo “deepfake” originou-se de um usuário do Reddit chamado “deepfakes”, que, em dezembro de 2017, compartilhou vídeos que trocavam os rostos de celebridades como Scarlett Johansson por atores de filmes adultos, demonstrando o potencial dessa tecnologia para criar conteúdo enganoso.
Tecnologia por trás dos Deepfakes
A tecnologia central por trás dos deepfakes envolve técnicas avançadas de IA, como Redes Adversariais Generativas (GANs) e Redes Neurais Convolucionais (CNNs). Esses algoritmos aprendem a mapear o rosto de uma pessoa-alvo no corpo de outra pessoa em um vídeo. As GANs consistem em duas redes neurais: um gerador que cria imagens falsas e um discriminador que avalia sua autenticidade. Através desse processo, o gerador aprimora sua capacidade de criar conteúdo realista. As CNNs são frequentemente usadas para analisar e replicar as características únicas do rosto de uma pessoa. Como um vídeo é essencialmente uma sequência de imagens, a IA substitui o rosto em cada quadro pelo rosto-alvo, resultando em um novo vídeo onde parece que a pessoa-alvo está realizando as ações.
Mas a tecnologia deepfake vai além da manipulação visual. Também fez avanços impressionantes no campo da clonagem de voz. Esses sistemas de clonagem de voz usam inteligência artificial para estudar e analisar de perto gravações de áudio. Eles conseguem captar os padrões distintos, tons e outras qualidades únicas que tornam a voz de uma pessoa distinta. Com esse entendimento detalhado de uma voz-alvo, a IA pode então recriar uma versão sintética dessa voz. Essa voz sintética pode ser usada para fazer a pessoa “dizer” qualquer coisa que os criadores do deepfake desejarem, mesmo que a pessoa nunca tenha realmente falado essas palavras na realidade.
Essa “abordagem de duas frentes” de combinar manipulação visual e de áudio aumenta significativamente a capacidade dos deepfakes de criar falsificações convincentes que são mais difíceis de detectar.
Como Criar um Deepfake
Criar deepfakes convincentes não requer mais equipamentos caros ou habilidades especializadas. Avanços em IA e hardware poderoso disponível tornaram o processo mais acessível. Mesmo dispositivos de nível consumidor podem agora executar os modelos de aprendizado de máquina necessários, e softwares de deepfake amigáveis ao usuário tornam a geração de vídeos/imagens/áudios falsos realistas tão fácil quanto alguns cliques. Abaixo está um guia típico para criar seu próprio vídeo deepfake.
Passo 1. Coletar os Dados
Reúna material visual de alta qualidade. Isso inclui vídeos e imagens tanto do rosto-alvo (o rosto a ser inserido na filmagem) quanto do rosto-fonte (a pessoa cujo rosto você deseja substituir na filmagem original).
Passo 2. Processar os Dados
Pré-processe as imagens e vídeos realizando reconhecimento facial, alinhamento e normalização para garantir consistência. Isso inclui ajustes de iluminação, balanço de cores e resolução de imagem/vídeo. Opcionalmente, aplique técnicas como remoção de fundo, estabilização de vídeo e processamento de áudio para melhorar ainda mais a qualidade e consistência dos dados de entrada.
Passo 3: Treinar o Modelo
Use técnicas de aprendizado de máquina, como autoencoders, Redes Adversariais Generativas (GANs), Redes Neurais Convolucionais (CNNs) ou Redes Neurais Recorrentes (RNNs) para treinar um modelo que possa aprender a codificar o rosto-fonte e decodificá-lo no rosto-alvo.
Passo 4: Trocar o Sujeito
Aplique o modelo treinado à imagem ou vídeo-alvo, mapeando as expressões, ângulos e características do rosto-fonte nas estruturas faciais do alvo.
Passo 5: Trocar a Voz
Se a manipulação de áudio for necessária, use um sintetizador vocal para gerar uma voz baseada em IA que imite o tom, a altura e o volume do alvo, e sincronize-a com o áudio-alvo.
Passo 6: Pós-Processamento
Refine o resultado final ajustando iluminação e textura para criar um deepfake convincente. Incorpore técnicas como mesclagem de vídeo, interpolação de quadros e sincronização de áudio para melhorar ainda mais o realismo e a qualidade do conteúdo deepfake.
Deepfake Open Source Freeware
Uma variedade de projetos de código aberto surgiu, democratizando a criação de deepfakes e expandindo os limites do que é possível.
DeepFaceLab
É para criar vídeos deepfake.
Com a capacidade de substituir rostos, rejuvenescer indivíduos, trocar cabeças e até manipular os lábios de políticos, o DeepFaceLab é uma ferramenta líder para criar vídeos deepfake – mais de 95% dos vídeos deepfake são feitos usando o DeepFaceLab. Canais populares do TikTok, como @deeptomcruise, @1facerussia e @arnoldschwarzneggar, junto com canais do YouTube como @FXChris Ume e @Sham00k, criam seus vídeos usando o DeepFaceLab. Embora o GitHub tenha banido o repositório do DeepFaceLab devido às suas políticas contra mídia sintética usada para imagens íntimas não consensuais ou desinformação, os usuários ainda podem acessá-lo através do Wayback Machine ou links compartilhados pela comunidade no Reddit. Para passos detalhados sobre como criar um vídeo deepfake com o Deep