Arquiteturas de Referencia GenAI
8 diagramas de arquitetura de referencia para sistemas GenAI. Cada padrao inclui diagrama visual, componentes, casos de uso e metricas.
Selecione uma Arquitetura
RAG Basico
Pipeline simples de Retrieval-Augmented Generation para projetos iniciais.
Complexidade: BaixaFAQ / ChatbotBusca semântica
Renderizando diagrama...
Componentes
- -Embedding Model (text-embedding-3-small)
- -Vector Store (pgvector, Chroma)
- -LLM (GPT-4o-mini, Claude Haiku)
- -Prompt Template
Quando Usar
- FAQ e base de conhecimento simples
- Documentação até 10K docs
- Queries diretas sem ambiguidade
- MVP e prototipagem rápida
Limitacoes
- Perde keywords exatos (nomes, códigos)
- Sem refinamento de relevancia
- Chunks isolados perdem contexto
- Não escala bem para milhoes de docs
Metricas Tipicas
Latência: ~500ms - 1.5s
Precision@5: 70-80%
Custo: ~$0.001/query
Setup: 1-2 dias
Tech Stack
LangChainOpenAIpgvectorFastAPI
Codigo Mermaid
graph TD
subgraph "Input"
U[Usuário] -->|Query| E[Embedding Model]
end
subgraph "Retrieval"
E -->|Vector| VDB[(Vector DB)]
VDB -->|Top-K Docs| R[Reranker]
end
subgraph "Generation"
R -->|Context| P[Prompt Builder]
P -->|Prompt| LLM[LLM]
LLM -->|Response| U
end