Metodologia · Nova versão

A engenharia da Agent Factory.

10 agentes especializados, 4 cérebros de domínio, pipeline de 7 etapas, arquitetura 6-level e um quality gate que executa de verdade e bloqueia. A metodologia que transforma briefing em squad funcional, validado e pronto pra produção — de marketing a engenharia.

Os 4 frameworks aplicados

Cada decisão de design da fábrica é ancorada em pesquisa documentada. Sem invenção — só síntese de boas práticas comprovadas.

FRAMEWORK 01

ReAct (Shunyu Yao, ICLR 2023)

Reason + Act interleaved. Agente alterna entre raciocinar (gerar pensamento sobre o estado atual) e agir (executar ferramenta/tool call). Reduz alucinação em 40% comparado a chain-of-thought puro.

Aplicado em: estrutura do nível 4 (Behavior) de todo agente fabricado.

FRAMEWORK 02

Agentic Design Patterns (Andrew Ng)

4 padrões compostáveis: Reflection (auto-crítica), Tool Use (ferramentas externas), Planning (decompor objetivo em sub-tarefas), Multi-agent (coordenação entre agentes).

Aplicado em: create-squad usa Multi-agent Pattern; todo agente tem Reflection no nível 5.

FRAMEWORK 03

Building Effective Agents (Anthropic)

Composable patterns oficiais. Prompt chaining, routing, parallelization, orchestrator-workers, evaluator-optimizer. Documentação oficial da Anthropic, base do Claude Code.

Aplicado em: pipeline da fábrica usa Orchestrator-Workers (factory-chief = orchestrator, demais = workers).

FRAMEWORK 04

Agentic Engineering (Simon Willison)

Práticas pragmáticas. Prompt simples vence prompt complexo. Tools sempre testáveis. Eval scenarios obrigatórios. Quando em dúvida, leia o prompt de volta como se fosse o agente.

Aplicado em: regras do @qa-sentinel e checklists de validação.

Os 4 cérebros de domínio (Domain Brains)

A grande evolução da nova versão. Além dos frameworks gerais, a fábrica injeta conhecimento de domínio específico conforme a necessidade de cada squad. É o que permite criar com a mesma profundidade um squad de marketing e um squad técnico de engenharia.

CÉREBRO 01

mind-extractor

Clonagem de mentes e extração de DNA. Clona a mente de um expert a partir dos materiais dele e transforma em agente de IA, extraindo o DNA de voz (jeito de falar) e o DNA de raciocínio (jeito de pensar).

Injetado em: persona e voice DNA, quando o squad precisa soar como um especialista real.

CÉREBRO 02

process-designer

Processos, automação e veto conditions. Desenha o método que o squad segue: fluxos, automações e as condições de veto que travam o agente quando algo sai do esperado.

Injetado em: workflows, constraints e regras de comportamento.

CÉREBRO 03

growth-strategist

Estratégia de negócio, funil, ROI e go-to-market. Faz o squad pensar em resultado, não só em execução. Inteligência comercial aplicada ao desenho do time.

Injetado em: squads de marketing, vendas e qualquer time com visão comercial.

CÉREBRO 04 · NOVO

staff-engineer

Engenharia de software real. Backend, API, banco de dados, testes e deploy — ancorado em frameworks consagrados como 12-Factor, OWASP, REST e test pyramid. É o cérebro que destrava os squads técnicos premium.

Injetado em: squads de engenharia. O motivo de a fábrica criar agora times técnicos, não só de marketing e conteúdo.

A arquitetura 6-level

Todo agente fabricado sai com 6 níveis preenchidos. É a estrutura que diferencia agente "prompt num .md" de agente funcional. Baseada na Hybrid Loader Architecture do Squad Creator Pro.

NÍVEL 01 · LOADER

Como o agente é carregado

Frontmatter Anthropic (name, description, model, tools), trigger conditions (when to use), keywords de ativação, slash command associado. É a "porta de entrada" — sem isso, o Claude Code não sabe quando invocar o agente.

NÍVEL 02 · IDENTITY

Quem o agente É

Persona (background, valores, expertise), voice DNA (jeito de falar, vocabulário, gatilhos), pronouns, exemplos de tom. Agente sem identidade clara = agente que muda de personalidade no meio da conversa.

NÍVEL 03 · CAPABILITIES

O que o agente FAZ

Skills disponíveis, tools/MCPs integrados, slash commands acionáveis, fluxos de trabalho documentados. Cada capacidade tem trigger, input esperado, output garantido.

NÍVEL 04 · BEHAVIOR

Como o agente RACIOCINA

Padrões ReAct (reason → act → observe → reason), Reflection loop (auto-crítica antes de entregar), planning (decompor objetivos), tool use sequence. É aqui que o agente vira "pensante", não só "respondedor".

NÍVEL 05 · CONSTRAINTS

O que o agente NÃO faz

Vetos absolutos, palavras proibidas, situações de escalation, edge cases conhecidos, kill switches. Agente sem constraints = agente que vai inventar quando não souber.

NÍVEL 06 · EXAMPLES + VALIDATION

Como saber se o agente FUNCIONA

3-5 exemplos canônicos de input/output esperado, edge cases documentados, smoke tests rodáveis, eval scenarios mensuráveis. Agente sem examples = agente que ninguém consegue auditar.

O pipeline de 7 etapas

O fluxo end-to-end da fábrica. Cada etapa tem responsável, output e gate de qualidade. Pular etapa = entregar lixo.

#	Etapa	Responsável	Output	Gate
1	Briefing	@factory-chief	Spec inicial (3 perguntas)	Briefing completo? Não → reperguntar
2	Research	@factory-chief	Notas dos frameworks aplicáveis	Research feito? Não → web search
3	Architecture	@architect	6-level structure preenchida	6 níveis OK? Não → completar
4	Persona	@promptsmith	Voice DNA + tom + exemplos	Voice consistente? Não → reescrever
5	Skill	@skillforger	SKILL.md + commands + tasks	Frontmatter OK? Não → ajustar
6	Quality gate	@qa-sentinel	Gate executável (naming, deps, segurança, qualidade, acentuação) + score	Fora do padrão? → BLOQUEADO
7	Delivery	@factory-chief	Pacote final + instalação	QA aprovado? Sim → entregar

Regras absolutas

🚫 Sem briefing, sem fabricação

Pedido vago ("cria um agente legal", "faz um bot") é AUTOMATICAMENTE devolvido pra completar briefing. Não existe agente bom com briefing ruim.

🚫 Sem passar no quality gate, sem entrega

O @qa-sentinel roda um gate que executa de verdade — não é checklist no papel. Reprovou em naming, dependências, segurança, qualidade, acentuação PT ou score = pacote NÃO sai. Volta pra @architect ou @promptsmith ajustar até passar. Zero exceção.

🚫 Sem invenção de frameworks

Os 4 frameworks aplicados são documentados (papers, blogs oficiais, livros). Se a fábrica precisa aplicar um framework novo, ela faz research primeiro — nunca chuta.

✅ Sempre 6-level

Todo agente sai com os 6 níveis preenchidos. Nunca 4. Nunca 5. Nunca "preencho depois". Nível incompleto = agente reprovado no QA.

✅ Sempre 3+ examples

Mínimo 3 exemplos canônicos input/output em todo agente. Sem examples não dá pra auditar — e tudo que não dá pra auditar a fábrica não entrega.

O que esta fábrica NÃO é

❌ Não é gerador de prompt

Você não digita "quero um prompt sobre X" e ela cospe um parágrafo. Ela fabrica AGENTE — que é estrutura, comportamento, validação, integração. Prompt é nível 1 de 6.

❌ Não é wrapper de ChatGPT

Os agentes fabricados rodam dentro do Claude Code, com tools nativos (Bash, Read, Edit, MCPs). Não tem dependência de API externa. Roda local.

❌ Não inventa frameworks

Tudo que a fábrica aplica é documentado (Anthropic, Andrew Ng, Shunyu Yao, Simon Willison). Se um framework novo chega, ela faz research antes de aplicar.

❌ Não pula o quality gate

Não importa quão urgente é o pedido — todo agente e squad passa pelo gate executável do @qa-sentinel. Fora do padrão = bloqueado, volta pra reescrita. Sem exceção. Prova: um squad de engenharia de exemplo (api-forge) gerado pela própria fábrica passou no gate com score A+ (9,43/10).