I Built the Ultimate Army of Media Agents in n8n (free template)
Apresentação do Agente de Mídia
Funcionalidades do Agente
- O agente de mídia possui funções de assistente pessoal, como acesso a e-mail, Google Drive e calendário, além de capacidades criativas para criar e editar imagens e vídeos.
- O agente registra todas as suas ações, incluindo erros, proporcionando total visibilidade sobre suas atividades.
Interação com o Agente
- A comunicação com o agente é feita via Telegram; ao enviar uma imagem, ele processa no ambiente do Google Drive.
- O agente solicita um nome para o arquivo enviado, permitindo que o usuário mantenha um banco de dados organizado.
Edição da Imagem
- Após renomear a imagem enviada para "speaker", o usuário pede ao agente para editá-la em um estilo vibrante que destaque a experiência musical.
- O agente utiliza GPT5 Mini para determinar quais ferramentas usar na edição da imagem e acessa seu "agente criativo" para realizar a tarefa.
Resultados da Edição
- O agente cria três versões diferentes da imagem editada e solicita confirmação antes de renderizar os arquivos finais em alta resolução.
- O usuário revisa as edições e escolhe sua favorita para transformá-la em vídeo.
Criação do Vídeo
- O usuário instrui o agente a transformar a imagem escolhida em um vídeo publicitário com efeitos visuais sincronizados à música.
- O processo envolve o uso de GPT1 para geração de imagens e V3 rápido para vídeos; o agente tem autonomia total nas ferramentas utilizadas.
Impressões Finais
- Os resultados são impressionantes: dois vídeos gerados, um baseado na imagem editada e outro apenas texto. Ambos demonstram potencial criativo significativo.
Compartilhamento de Arquivos e E-mails
Processo de Compartilhamento
- O sistema está buscando o e-mail de Dexter Morgan para enviar um arquivo, considerando duas opções: compartilhar com um e-mail específico ou tornar o arquivo acessível a todos como visualizador.
- O compartilhamento do arquivo foi concluído, e o sistema enviou um e-mail informando que encontrou as informações de contato e configurou o vídeo para ser acessível a qualquer pessoa com o link.
Detalhes do E-mail
- O e-mail contém um link para um rascunho do anúncio VFX da JBL, embora não tenha exatamente 15 segundos conforme mencionado.
- Ao baixar o vídeo, é possível ver que ele sincroniza bem com os batimentos da música, destacando uma estética visual atraente.
Pesquisa em Mídias Sociais
Solicitação de Vídeos
- Um comando foi dado ao agente social para encontrar dois vídeos de alto desempenho sobre NAND nas plataformas TikTok, Instagram e YouTube.
- A pesquisa está sendo realizada simultaneamente nas três plataformas através do Ampify.
Resultados da Pesquisa
- O agente retornou quatro vídeos no TikTok relacionados a fluxos de edição; cada vídeo inclui estatísticas relevantes.
- Para YouTube, foram encontrados vídeos sobre configuração local por Network Chuck, incluindo URLs correspondentes.
Compilação em Google Docs
Criação do Documento
- Após coletar os dados dos vídeos, foi solicitado que as informações fossem organizadas em um Google Doc.
- O documento intitulado "niten high performing videos" foi criado na pasta "media analysis", contendo insights resumidos sobre os vídeos pesquisados.
Postagem no TikTok
Publicação do Anúncio
- Um comando foi dado para postar o vídeo VFX da JBL no TikTok com a legenda "music to my ears".
Processo de Entrada e Saída do Agente AI
Mecanismo de Entrada
- O sistema realiza uma verificação rápida para identificar o tipo de entrada, seja uma foto ou uma mensagem de texto. Se houver uma foto, ela é baixada e armazenada no Google Drive; caso contrário, a mensagem de texto é enviada diretamente ao agente AI.
Registro e Rastreamento
- Após processar a entrada, o agente limpa os passos intermediários e registra as informações em uma planilha de rastreamento que inclui timestamp, fluxo de trabalho, entrada, saída e ações realizadas.
Análise dos Resultados
- A planilha permite visualizar as ações tomadas pelo agente em resposta a comandos específicos. Isso inclui detalhes sobre tokens utilizados durante o processamento das entradas.
Configurações do Agente
- O usuário pode ativar a opção para retornar passos intermediários nas configurações do agente. Isso fornece um array detalhado das ações executadas pelo agente.
Estrutura de Sucesso e Erro
- O sistema possui ramificações separadas para sucesso e erro. Caso ocorra um erro, o fluxo não é interrompido completamente; isso garante que logs ou notificações sejam gerados mesmo em falhas.
Função do Agente Principal
Descrição da Função
- O agente principal atua como um gerente que delega tarefas aos ferramentas corretas sem realizar atividades como escrever emails ou criar resumos.
Ferramentas Disponíveis
- O agente possui várias ferramentas à disposição: Google Drive, email, calendário, redes sociais entre outras. Cada ferramenta tem descrições gerais que são complementadas por instruções mais específicas nos sub-agentes.
Diretrizes Operacionais do Agente
Notas Chave para Operação
- Diretrizes incluem: solicitar nome para fotos enviadas pelo usuário; verificar informações de contato antes de certas ações; usar a ferramenta "Think" antes de perguntas adicionais; garantir compartilhamento adequado no Google Drive antes da postagem; sempre responder ao usuário após qualquer ação realizada.
Modelos Utilizados pelo Agente
Modelos Principais e Alternativos
- O modelo principal utilizado é o GPT5 Mini através da Open Router com um modelo alternativo também baseado no GPT5 Mini via OpenAI. Há considerações sobre possíveis falhas se ambos os serviços ficarem indisponíveis.
Ferramentas Personalizadas Criadas
Funcionalidades das Ferramentas Customizadas
- As ferramentas personalizadas incluem edição e criação de imagens, conversão de imagem para vídeo e criação de documentos. Essas ferramentas são projetadas para lidar com dados binários eficientemente durante os fluxos operacionais.
Configuração de Fluxos para Criação de Imagens e Vídeos
Ferramenta de Criação de Imagens
- A ferramenta "create image" é acionada quando executada por outro fluxo, exigindo entradas específicas como nome da imagem, prompt da imagem e ID do chat.
- O nome da imagem é utilizado para salvá-la no Google Drive, enquanto o prompt é enviado ao OpenAI para gerar a imagem. O URL gerado é convertido em um arquivo binário.
- As variáveis são extraídas do nó de gatilho do Telegram, permitindo que o ID do chat original seja referenciado corretamente.
Edição de Imagens
- Para a ferramenta "edit image", as entradas incluem nome da imagem, solicitação de edição, ID do chat e ID da imagem original que deve ser editada.
- É necessário baixar o arquivo original antes de enviá-lo ao modelo gerador de imagens da OpenAI. Após a edição, a nova imagem é enviada pelo Telegram e armazenada no Google Drive.
Criação e Edição de Vídeos
- Na criação de vídeos, os parâmetros enviados incluem prompt do vídeo, ID do chat, título do vídeo e proporção. Um fluxo contínuo verifica se o vídeo está pronto.
- A ferramenta "image to video" funciona similarmente à criação de vídeos; requer o ID do arquivo original para gerar um novo vídeo baseado na imagem fornecida.
Estrutura dos Fluxos
- Os fluxos não são complicados; eles envolvem passar pequenas variáveis entre diferentes ferramentas. A configuração permite que um agente decida qual ferramenta usar autonomamente.
- Apesar das aparências intimidantes, a estrutura dos fluxos é simples. Compreender como as variáveis são passadas facilita a implementação.
Geração Automática de Prompts
- Um exemplo prático mostra um agente criativo transformando uma imagem em um anúncio em vídeo sem passos adicionais envolvendo IA.
- O agente criativo recebe instruções detalhadas sobre como criar prompts eficazes para imagens e vídeos com base nas solicitações recebidas.
Considerações Finais sobre Prompts
Autonomia do Agente de Mídia
Evolução do Uso do Agente
- O apresentador começou a implementar um agente com autonomia limitada, mas percebeu que os resultados não eram consistentes e específicos para um único caso de uso.
- Ao dar mais liberdade ao agente, ele ficou satisfeito com os resultados obtidos, sugerindo que a flexibilidade é crucial para o sucesso da aplicação.
Estrutura dos Fluxos de Postagem
- Os fluxos de postagem são semelhantes entre plataformas como X, TikTok e Instagram; a única diferença é a plataforma selecionada em cada nó.
- O processo envolve capturar o ID do arquivo e o texto (legenda), seguido pelo upload do arquivo no Google Drive e sua postagem na plataforma escolhida.
Criação de Documentos
- A criação de documentos é feita em duas etapas: primeiro, captura-se o título e conteúdo; depois, utiliza-se o ID do documento gerado para atualizá-lo.
- Um link clicável é gerado automaticamente após a criação do documento, facilitando o acesso ao mesmo.
Integração com Apify
Solicitações ao Apify
- O apresentador configurou três solicitações diferentes ao Apify para realizar scraping em plataformas como YouTube.
- Cada solicitação inclui parâmetros como termos de busca e número desejado de resultados; as diferenças estão nas especificidades dos "atores" utilizados.
Flexibilidade nos Scrapers
- É possível trocar scrapers conforme necessário, permitindo personalização na utilização do agente social.
- A demonstração enfatiza a facilidade na construção de sistemas autônomos utilizando agentes adaptáveis às necessidades específicas dos usuários.
Custos Associados à Implementação
Estrutura de Custos
- O custo inicial está relacionado ao uso dos modelos de chat e tokens. O apresentador utilizou uma combinação do modelo GPT5 Mini por ser mais econômico em entradas.
Estrutura de Preços para Geração de Imagens e Vídeos
Preços para Geração de Imagens
- A geração de imagens utiliza o modelo GPT-image 1, com foco nos tokens de entrada dos prompts. O preço por imagem é uma preocupação maior do que a tecnologia utilizada.
- Os preços são os seguintes: imagens de baixa qualidade custam cerca de 1 centavo, imagens médias custam aproximadamente 4 centavos e imagens de alta qualidade custam em torno de 17 centavos.
Preços para Geração de Vídeos
- Para vídeos gerados a partir de texto, o custo é de 25 centavos por segundo; se incluir áudio, o custo sobe para 40 centavos por segundo.
- No caso da conversão de imagem para vídeo, o preço permanece igual ao do texto para vídeo quando há áudio. Sem áudio, o custo aumenta.
Assinaturas Recomendadas
- Para replicar a configuração apresentada, recomenda-se a assinatura Blotato com um plano inicial a partir de $29/mês e um desconto adicional usando o código Nate30.
- Outra opção é usar Apify com diferentes níveis de preços e também aplicar um desconto utilizando o código Nate30 nas primeiras três mensalidades.
Instruções para Configuração
Download e Importação dos Workflows
- A configuração não é simples; será necessário baixar um arquivo zip contendo nove workflows diferentes após acessar a comunidade gratuita.
- Os workflows incluem ferramentas como edição e criação de imagens, conversão de imagem em vídeo e postagem em redes sociais (TikTok e Instagram).
Integração das Ferramentas
- Após baixar os arquivos, é crucial nomeá-los corretamente no sistema NADN e vinculá-los às respectivas ferramentas. Isso garante que cada ferramenta funcione adequadamente ao ser acionada.
Configuração do Ambiente Google
- É necessário criar uma pasta chamada "media" no Google Drive onde todos os vídeos e imagens serão armazenados pelo agente criativo.
- Além disso, deve-se configurar outra pasta chamada "media analysis" onde os documentos gerados pelo agente serão salvos.
Finalização da Configuração
Conclusão da Integração
- Após configurar as pastas no Google Drive, será preciso ajustar dois nós do Google Sheets que se conectam ao logger do agente midiático. Um template será fornecido para facilitar essa etapa.
Comunidade Plus
Como Construir Automação e Ser Pago por Isso?
Conclusão do Vídeo
- O apresentador encerra o vídeo convidando os espectadores a se juntarem à comunidade, destacando a possibilidade de serem pagos por construir automações interessantes.
- Ele expressa gratidão aos espectadores que assistiram até o final, mesmo com interrupções causadas por aviões passando.
- O apresentador pede aos espectadores que curtam o vídeo se aprenderam algo novo, enfatizando como isso ajuda seu canal.