Arquiteturas de Referencia GenAI

    8 diagramas de arquitetura de referencia para sistemas GenAI. Cada padrao inclui diagrama visual, componentes, casos de uso e metricas.

    Selecione uma Arquitetura

    RAG Basico

    Pipeline simples de Retrieval-Augmented Generation para projetos iniciais.

    Complexidade: BaixaFAQ / ChatbotBusca semântica
    Renderizando diagrama...

    Componentes

    • -Embedding Model (text-embedding-3-small)
    • -Vector Store (pgvector, Chroma)
    • -LLM (GPT-4o-mini, Claude Haiku)
    • -Prompt Template

    Quando Usar

    • FAQ e base de conhecimento simples
    • Documentação até 10K docs
    • Queries diretas sem ambiguidade
    • MVP e prototipagem rápida

    Limitacoes

    • Perde keywords exatos (nomes, códigos)
    • Sem refinamento de relevancia
    • Chunks isolados perdem contexto
    • Não escala bem para milhoes de docs

    Metricas Tipicas

    Latência: ~500ms - 1.5s
    Precision@5: 70-80%
    Custo: ~$0.001/query
    Setup: 1-2 dias

    Tech Stack

    LangChainOpenAIpgvectorFastAPI

    Codigo Mermaid

    graph TD
        subgraph "Input"
            U[Usuário] -->|Query| E[Embedding Model]
        end
    
        subgraph "Retrieval"
            E -->|Vector| VDB[(Vector DB)]
            VDB -->|Top-K Docs| R[Reranker]
        end
    
        subgraph "Generation"
            R -->|Context| P[Prompt Builder]
            P -->|Prompt| LLM[LLM]
            LLM -->|Response| U
        end

    GenAI Documentação

    Alexsander Valente - 2025