Chatbot RAG em Tempo Real Específico para Domínio

Um chatbot em tempo real que usa a Pesquisa Google restrita ao seu próprio domínio, recupera conteúdo web relevante e utiliza o LLM da OpenAI para responder às perguntas dos usuários com informações atualizadas. Ideal para fornecer respostas precisas e específicas do domínio em portais de atendimento ao cliente ou de informações.

Como o Fluxo de IA funciona - Chatbot RAG em Tempo Real Específico para Domínio

Como o Fluxo de IA funciona

Entrada da Pergunta do Usuário

Captura as perguntas do usuário via entrada do chat ou botões pré-definidos.

Expansão da Consulta

Parafraseia e expande a consulta do usuário para melhorar a precisão da recuperação.

Pesquisa Google Específica para Domínio

Realiza uma Pesquisa Google limitada ao domínio especificado usando as consultas expandidas.

Recuperação de Conteúdo Web

Busca o conteúdo das URLs mais relevantes retornadas pela pesquisa.

Geração de Resposta pelo LLM

Utiliza o LLM da OpenAI para gerar uma resposta final enriquecida com contexto, exibida ao usuário.

Prompts usados neste fluxo

Abaixo está uma lista completa de todos os prompts usados neste fluxo para alcançar sua funcionalidade. Os prompts são as instruções dadas ao modelo de IA para gerar respostas ou executar ações. Eles orientam a IA na compreensão da intenção do usuário e na geração de saídas relevantes.

Componentes usados neste fluxo

Abaixo está uma lista completa de todos os componentes usados neste fluxo para alcançar sua funcionalidade. Os componentes são os blocos de construção de cada Fluxo de IA. Eles permitem criar interações complexas e automatizar tarefas conectando várias funcionalidades. Cada componente serve a um propósito específico, como lidar com a entrada do usuário, processar dados ou integrar com serviços externos.

Descrição do fluxo

Objetivo e benefícios

Visão Geral

Este fluxo de trabalho implementa um chatbot simples de Geração Aumentada por Recuperação (RAG) que utiliza a Pesquisa Google em tempo real para obter informações atualizadas da internet—especificamente, ele pode ser personalizado para restringir todas as buscas a um determinado domínio. O objetivo principal é criar um chatbot capaz de responder às perguntas dos usuários utilizando o conteúdo mais relevante e recente encontrado online, tornando-o altamente valioso para cenários onde bases de conhecimento estáticas são insuficientes.

Componentes-Chave e Fluxo

O fluxo de trabalho é composto por vários blocos modulares, cada um representando uma capacidade específica. Abaixo está uma divisão da estrutura e funcionalidade do fluxo:

ComponenteFunção
Entrada do ChatRecebe as perguntas e mensagens do usuário.
Histórico do ChatMantém o histórico da conversa para respostas contextualizadas.
Expansão da ConsultaParafraseia a entrada do usuário em várias consultas alternativas para melhorar a cobertura da busca.
Pesquisa GoogleExecuta buscas no Google, restritas por um prefixo de domínio personalizável.
Recuperador de URLExtrai conteúdo das URLs retornadas pela Pesquisa Google.
Modelo de PromptEstrutura contexto, entrada do usuário e histórico para o modelo de linguagem.
OpenAI LLMGera respostas usando um modelo de linguagem (por exemplo, GPT-3/4).
GeradorAciona o LLM com o prompt e contexto para produzir a resposta.
Saída do ChatExibe as respostas do chatbot ao usuário.
Botões de ExemploFornece consultas de exemplo para o usuário testar com um clique.
Gatilho de Abertura do ChatInicializa a conversa e popula os botões de início rápido.

Como o Fluxo de Trabalho Opera

Quando um usuário abre o chat, o Gatilho de Abertura do Chat é ativado. Isso inicializa a interface do chat e apresenta vários Botões de Exemplo com consultas de exemplo (por exemplo, “qual dinossauro tem 500 dentes?”). Quando o usuário clica em um botão ou digita uma mensagem personalizada através da Entrada do Chat, o fluxo prossegue da seguinte forma:

  1. Expansão da Consulta: A entrada do usuário é parafraseada em várias versões para maximizar a chance de obter resultados relevantes na busca.

  2. Pesquisa Google: As consultas expandidas são enviadas para a Pesquisa Google. Por padrão, a busca é limitada a um domínio específico (definido pelo campo query_prefix, ex: site: www.SEUDOMINIO.com), permitindo focar o conhecimento do chatbot no seu próprio site ou em qualquer fonte confiável.

  3. Recuperador de URL: O fluxo recupera o conteúdo dos principais resultados de busca (URLs) como documentos completos.

  4. Montagem do Prompt: O conteúdo recuperado, a entrada do usuário e o histórico do chat são combinados usando o componente Modelo de Prompt para fornecer contexto rico à resposta.

  5. Geração pelo Modelo de Linguagem: O prompt é enviado ao OpenAI LLM, que gera uma resposta coerente e contextualizada.

  6. Saída da Resposta: A resposta gerada é exibida ao usuário através da Saída do Chat.

Exemplo de Fluxo de Caso de Uso

  • Usuário abre o chat: Mensagem de boas-vindas e três botões de perguntas de exemplo aparecem.
  • Usuário clica em “quando é o dia das mães 2024?”: A pergunta é exibida imediatamente na saída do chat (para feedback instantâneo).
  • O fluxo executa a consulta através da expansão, busca, recuperação, montagem do prompt e geração pelo LLM, em seguida exibe a resposta.

Por Que Este Fluxo é Útil

  • Conhecimento em Tempo Real: O chatbot pode responder perguntas usando as informações mais recentes disponíveis na internet ou no domínio escolhido.
  • Restrição por Domínio: Personalizando o query_prefix, você garante que o chatbot obtenha informações somente do seu site de confiança ou base de conhecimento, aumentando a confiabilidade das respostas.
  • Consciência de Contexto: Incluindo o histórico do chat e o conteúdo recuperado no prompt, as respostas podem ser ajustadas e contextualizadas para conversas de múltiplas interações.
  • Escalabilidade e Automação: O design modular permite que o fluxo seja facilmente expandido ou adaptado para vários domínios, suportando implantação em larga escala em diferentes tópicos ou sites.
  • Experiência do Usuário: Botões de início rápido e feedback imediato tornam o chatbot acessível para os usuários finais.

Tabela Resumida do Fluxo de Trabalho

EtapaDescrição
Entrada do UsuárioUsuário digita uma pergunta ou clica em um botão de início rápido
Expansão da ConsultaA entrada é parafraseada para ampliar a cobertura da busca
Pesquisa GooglePesquisas são realizadas no Google, restritas a um domínio específico
Recuperação de Conteúdo da URLConteúdos dos principais resultados de busca são recuperados
Construção do PromptEntrada do usuário, resultados da busca e histórico do chat são compilados em um prompt
Geração pelo LLMOpenAI LLM gera uma resposta usando todo o contexto
SaídaResposta é exibida ao usuário

Personalização

  • Para focar o chatbot em seu próprio domínio, modifique o campo query_prefix no componente Pesquisa Google (ex: site: www.SEUDOMINIO.com).
  • Adicione ou altere perguntas de exemplo usando os componentes Botão de Exemplo para uma experiência do usuário mais personalizada.

Casos de Uso Ideais

  • Bots de atendimento ao cliente que sempre fornecem respostas baseadas na sua documentação ou conteúdo web atualizado.
  • Assistentes de conhecimento internos limitados ao intranet ou portal de suporte da sua empresa.
  • Qualquer chatbot que precise sempre citar ou depender de fontes externas e confiáveis (ex: para conformidade ou precisão).

Ao automatizar o processo de busca, recuperação e geração de respostas, este fluxo de trabalho economiza tempo de pesquisa manual e garante que os usuários sempre recebam as informações mais atuais e relevantes disponíveis.

Let us build your own AI Team

We help companies like yours to develop smart chatbots, MCP Servers, AI tools or other types of AI automation to replace human in repetitive tasks in your organization.

Saiba mais