A engenharia da Agent Factory.
10 agentes especializados, 4 cérebros de domínio, pipeline de 7 etapas, arquitetura 6-level e um quality gate que executa de verdade e bloqueia. A metodologia que transforma briefing em squad funcional, validado e pronto pra produção — de marketing a engenharia.
Os 4 frameworks aplicados
Cada decisão de design da fábrica é ancorada em pesquisa documentada. Sem invenção — só síntese de boas práticas comprovadas.
ReAct (Shunyu Yao, ICLR 2023)
Reason + Act interleaved. Agente alterna entre raciocinar (gerar pensamento sobre o estado atual) e agir (executar ferramenta/tool call). Reduz alucinação em 40% comparado a chain-of-thought puro.
Aplicado em: estrutura do nível 4 (Behavior) de todo agente fabricado.
Agentic Design Patterns (Andrew Ng)
4 padrões compostáveis: Reflection (auto-crítica), Tool Use (ferramentas externas), Planning (decompor objetivo em sub-tarefas), Multi-agent (coordenação entre agentes).
Aplicado em: create-squad usa Multi-agent Pattern; todo agente tem Reflection no nível 5.
Building Effective Agents (Anthropic)
Composable patterns oficiais. Prompt chaining, routing, parallelization, orchestrator-workers, evaluator-optimizer. Documentação oficial da Anthropic, base do Claude Code.
Aplicado em: pipeline da fábrica usa Orchestrator-Workers (factory-chief = orchestrator, demais = workers).
Agentic Engineering (Simon Willison)
Práticas pragmáticas. Prompt simples vence prompt complexo. Tools sempre testáveis. Eval scenarios obrigatórios. Quando em dúvida, leia o prompt de volta como se fosse o agente.
Aplicado em: regras do @qa-sentinel e checklists de validação.
Os 4 cérebros de domínio (Domain Brains)
A grande evolução da nova versão. Além dos frameworks gerais, a fábrica injeta conhecimento de domínio específico conforme a necessidade de cada squad. É o que permite criar com a mesma profundidade um squad de marketing e um squad técnico de engenharia.
mind-extractor
Clonagem de mentes e extração de DNA. Clona a mente de um expert a partir dos materiais dele e transforma em agente de IA, extraindo o DNA de voz (jeito de falar) e o DNA de raciocínio (jeito de pensar).
Injetado em: persona e voice DNA, quando o squad precisa soar como um especialista real.
process-designer
Processos, automação e veto conditions. Desenha o método que o squad segue: fluxos, automações e as condições de veto que travam o agente quando algo sai do esperado.
Injetado em: workflows, constraints e regras de comportamento.
growth-strategist
Estratégia de negócio, funil, ROI e go-to-market. Faz o squad pensar em resultado, não só em execução. Inteligência comercial aplicada ao desenho do time.
Injetado em: squads de marketing, vendas e qualquer time com visão comercial.
staff-engineer
Engenharia de software real. Backend, API, banco de dados, testes e deploy — ancorado em frameworks consagrados como 12-Factor, OWASP, REST e test pyramid. É o cérebro que destrava os squads técnicos premium.
Injetado em: squads de engenharia. O motivo de a fábrica criar agora times técnicos, não só de marketing e conteúdo.
A arquitetura 6-level
Todo agente fabricado sai com 6 níveis preenchidos. É a estrutura que diferencia agente "prompt num .md" de agente funcional. Baseada na Hybrid Loader Architecture do Squad Creator Pro.
NÍVEL 01 · LOADER
Como o agente é carregado
Frontmatter Anthropic (name, description, model, tools), trigger conditions (when to use), keywords de ativação, slash command associado. É a "porta de entrada" — sem isso, o Claude Code não sabe quando invocar o agente.
NÍVEL 02 · IDENTITY
Quem o agente É
Persona (background, valores, expertise), voice DNA (jeito de falar, vocabulário, gatilhos), pronouns, exemplos de tom. Agente sem identidade clara = agente que muda de personalidade no meio da conversa.
NÍVEL 03 · CAPABILITIES
O que o agente FAZ
Skills disponíveis, tools/MCPs integrados, slash commands acionáveis, fluxos de trabalho documentados. Cada capacidade tem trigger, input esperado, output garantido.
NÍVEL 04 · BEHAVIOR
Como o agente RACIOCINA
Padrões ReAct (reason → act → observe → reason), Reflection loop (auto-crítica antes de entregar), planning (decompor objetivos), tool use sequence. É aqui que o agente vira "pensante", não só "respondedor".
NÍVEL 05 · CONSTRAINTS
O que o agente NÃO faz
Vetos absolutos, palavras proibidas, situações de escalation, edge cases conhecidos, kill switches. Agente sem constraints = agente que vai inventar quando não souber.
NÍVEL 06 · EXAMPLES + VALIDATION
Como saber se o agente FUNCIONA
3-5 exemplos canônicos de input/output esperado, edge cases documentados, smoke tests rodáveis, eval scenarios mensuráveis. Agente sem examples = agente que ninguém consegue auditar.
O pipeline de 7 etapas
O fluxo end-to-end da fábrica. Cada etapa tem responsável, output e gate de qualidade. Pular etapa = entregar lixo.
| # | Etapa | Responsável | Output | Gate |
|---|---|---|---|---|
| 1 | Briefing | @factory-chief | Spec inicial (3 perguntas) | Briefing completo? Não → reperguntar |
| 2 | Research | @factory-chief | Notas dos frameworks aplicáveis | Research feito? Não → web search |
| 3 | Architecture | @architect | 6-level structure preenchida | 6 níveis OK? Não → completar |
| 4 | Persona | @promptsmith | Voice DNA + tom + exemplos | Voice consistente? Não → reescrever |
| 5 | Skill | @skillforger | SKILL.md + commands + tasks | Frontmatter OK? Não → ajustar |
| 6 | Quality gate | @qa-sentinel | Gate executável (naming, deps, segurança, qualidade, acentuação) + score | Fora do padrão? → BLOQUEADO |
| 7 | Delivery | @factory-chief | Pacote final + instalação | QA aprovado? Sim → entregar |
Regras absolutas
🚫 Sem briefing, sem fabricação
Pedido vago ("cria um agente legal", "faz um bot") é AUTOMATICAMENTE devolvido pra completar briefing. Não existe agente bom com briefing ruim.
🚫 Sem passar no quality gate, sem entrega
O @qa-sentinel roda um gate que executa de verdade — não é checklist no papel. Reprovou em naming, dependências, segurança, qualidade, acentuação PT ou score = pacote NÃO sai. Volta pra @architect ou @promptsmith ajustar até passar. Zero exceção.
🚫 Sem invenção de frameworks
Os 4 frameworks aplicados são documentados (papers, blogs oficiais, livros). Se a fábrica precisa aplicar um framework novo, ela faz research primeiro — nunca chuta.
✅ Sempre 6-level
Todo agente sai com os 6 níveis preenchidos. Nunca 4. Nunca 5. Nunca "preencho depois". Nível incompleto = agente reprovado no QA.
✅ Sempre 3+ examples
Mínimo 3 exemplos canônicos input/output em todo agente. Sem examples não dá pra auditar — e tudo que não dá pra auditar a fábrica não entrega.
O que esta fábrica NÃO é
❌ Não é gerador de prompt
Você não digita "quero um prompt sobre X" e ela cospe um parágrafo. Ela fabrica AGENTE — que é estrutura, comportamento, validação, integração. Prompt é nível 1 de 6.
❌ Não é wrapper de ChatGPT
Os agentes fabricados rodam dentro do Claude Code, com tools nativos (Bash, Read, Edit, MCPs). Não tem dependência de API externa. Roda local.
❌ Não inventa frameworks
Tudo que a fábrica aplica é documentado (Anthropic, Andrew Ng, Shunyu Yao, Simon Willison). Se um framework novo chega, ela faz research antes de aplicar.
❌ Não pula o quality gate
Não importa quão urgente é o pedido — todo agente e squad passa pelo gate executável do @qa-sentinel. Fora do padrão = bloqueado, volta pra reescrita. Sem exceção. Prova: um squad de engenharia de exemplo (api-forge) gerado pela própria fábrica passou no gate com score A+ (9,43/10).