🎙️Como Transcrever Áudios do WhatsApp Automaticamente com n8n + IA

Olá, comunidade n8n! :waving_hand:

Trouxe um tutorial completo e prático para vocês sobre como criar uma automação que transcreve automaticamente áudios do WhatsApp usando n8n, IA (Whisper)Groq API.

Este é um projeto super útil para quem recebe muitos áudios durante o dia e precisa de praticidade para ler ao invés de ouvir — seja em reuniões, no transporte público, ou simplesmente para ter um arquivo de texto pesquisável das conversas.

:bullseye: O que a automação faz:

Recebe uma mensagem de áudio no WhatsApp (sua própria conversa)
Processa e baixa o arquivo de áudio automaticamente
Transcreve usando Whisper AI (via Groq API)
Retorna a transcrição direto no chat do WhatsApp

:hammer_and_wrench: Stack Tecnológica:

n8n: Orquestração do workflow
Docker Desktop: Containerização da API WhatsApp
Wuzapi: API não oficial do WhatsApp
Groq API: IA Whisper para transcrição (8 horas gratuitas/dia)
HTTP Request: Integração entre serviços
Webhooks: Receber eventos do WhatsApp

:clipboard: Pré-requisitos:
:white_check_mark: Docker Desktop instalado
:white_check_mark: Conta WhatsApp
:white_check_mark: Conta Groq (gratuita)
:white_check_mark: n8n rodando (localhost ou cloud)
:warning: Importante: Este tutorial usa uma API não oficial do WhatsApp (Wuzapi API). Use com responsabilidade e preferencialmente para fins pessoais/testes.

:wrench: Arquitetura do Workflow:
WhatsApp Message (Audio)

Webhook (recebe evento POST)

Edit Fields (extrai dados necessários)

Filter (filtra apenas suas mensagens)

HTTP Request (download da mídia)

Convert Node (converte base64 para arquivo)

HTTP Request (Groq API - Whisper)

HTTP Request (retorna transcrição no WhatsApp)

:light_bulb: Principais aprendizados do tutorial:

  1. Configuração da Wuzapi API

Como instalar via Docker Compose
Conectar instância do WhatsApp (QR Code)
Configurar webhooks e eventos
Definir tokens de segurança

  1. Manipulação de Webhooks no n8n

Configuração de métodos POST
Como fixar execuções para desenvolvimento

  1. Download e Processamento de Mídia

Extrair URL de áudio do payload
HTTP Request para download
Conversão de base64 para arquivo utilizável
Tratamento de dados JSON

  1. Integração com Groq API (Whisper)

Como obter API key gratuita
Configurar requisição
Enviar arquivo de áudio para transcrição
Limite de 8 horas diárias gratuitas

  1. Retorno Automatizado

Formatar resposta para WhatsApp
Enviar mensagem de volta na mesma conversa
Manter contexto da conversa

:wrapped_gift: Material Disponível:
O tutorial inclui:

Arquivos Docker Compose prontos
Códigos HTTP Request configurados
Explicação passo a passo em vídeo

:rocket: Casos de Uso:
Esta automação pode ser adaptada para:
:check_mark: Transcrever áudios de grupos (com filtros específicos)
:check_mark: Criar backup textual de conversas importantes
:check_mark: Acessibilidade para pessoas com deficiência auditiva
:check_mark: Análise de sentimento em feedbacks recebidos
:check_mark: Documentação automática de reuniões via WhatsApp
:check_mark: Integração com CRM (registrar transcrições)

1 Like