Olá, comunidade n8n! ![]()
Trouxe um tutorial completo e prático para vocês sobre como criar uma automação que transcreve automaticamente áudios do WhatsApp usando n8n, IA (Whisper)Groq API.
Este é um projeto super útil para quem recebe muitos áudios durante o dia e precisa de praticidade para ler ao invés de ouvir — seja em reuniões, no transporte público, ou simplesmente para ter um arquivo de texto pesquisável das conversas.
O que a automação faz:
Recebe uma mensagem de áudio no WhatsApp (sua própria conversa)
Processa e baixa o arquivo de áudio automaticamente
Transcreve usando Whisper AI (via Groq API)
Retorna a transcrição direto no chat do WhatsApp
Stack Tecnológica:
n8n: Orquestração do workflow
Docker Desktop: Containerização da API WhatsApp
Wuzapi: API não oficial do WhatsApp
Groq API: IA Whisper para transcrição (8 horas gratuitas/dia)
HTTP Request: Integração entre serviços
Webhooks: Receber eventos do WhatsApp
Pré-requisitos:
Docker Desktop instalado
Conta WhatsApp
Conta Groq (gratuita)
n8n rodando (localhost ou cloud)
Importante: Este tutorial usa uma API não oficial do WhatsApp (Wuzapi API). Use com responsabilidade e preferencialmente para fins pessoais/testes.
Arquitetura do Workflow:
WhatsApp Message (Audio)
↓
Webhook (recebe evento POST)
↓
Edit Fields (extrai dados necessários)
↓
Filter (filtra apenas suas mensagens)
↓
HTTP Request (download da mídia)
↓
Convert Node (converte base64 para arquivo)
↓
HTTP Request (Groq API - Whisper)
↓
HTTP Request (retorna transcrição no WhatsApp)
Principais aprendizados do tutorial:
- Configuração da Wuzapi API
Como instalar via Docker Compose
Conectar instância do WhatsApp (QR Code)
Configurar webhooks e eventos
Definir tokens de segurança
- Manipulação de Webhooks no n8n
Configuração de métodos POST
Como fixar execuções para desenvolvimento
- Download e Processamento de Mídia
Extrair URL de áudio do payload
HTTP Request para download
Conversão de base64 para arquivo utilizável
Tratamento de dados JSON
- Integração com Groq API (Whisper)
Como obter API key gratuita
Configurar requisição
Enviar arquivo de áudio para transcrição
Limite de 8 horas diárias gratuitas
- Retorno Automatizado
Formatar resposta para WhatsApp
Enviar mensagem de volta na mesma conversa
Manter contexto da conversa
Material Disponível:
O tutorial inclui:
Arquivos Docker Compose prontos
Códigos HTTP Request configurados
Explicação passo a passo em vídeo
Casos de Uso:
Esta automação pode ser adaptada para:
Transcrever áudios de grupos (com filtros específicos)
Criar backup textual de conversas importantes
Acessibilidade para pessoas com deficiência auditiva
Análise de sentimento em feedbacks recebidos
Documentação automática de reuniões via WhatsApp
Integração com CRM (registrar transcrições)