Chatbot RAG in tempo reale specifico per dominio

Un chatbot in tempo reale che utilizza la Ricerca Google limitata al tuo dominio, recupera contenuti web rilevanti e sfrutta l’LLM di OpenAI per rispondere alle domande degli utenti con informazioni aggiornate. Ideale per fornire risposte accurate e specifiche per il dominio in portali informativi o di supporto clienti.

Come funziona il Flusso AI - Chatbot RAG in tempo reale specifico per dominio

Come funziona il Flusso AI

Input della domanda utente

Cattura le domande degli utenti tramite input chat o pulsanti predefiniti.

Espansione della richiesta

Parafrasa ed espande la domanda dell'utente per migliorare la precisione del recupero.

Ricerca Google specifica per dominio

Esegue una ricerca Google limitata al dominio specificato utilizzando le query espanse.

Recupero contenuti web

Recupera i contenuti dagli URL più rilevanti restituiti dalla ricerca.

Generazione risposta LLM

Utilizza l'LLM di OpenAI per generare una risposta finale arricchita dal contesto e mostrarla all'utente.

Prompt utilizzati in questo flusso

Di seguito è riportato un elenco completo di tutti i prompt utilizzati in questo flusso per raggiungere la sua funzionalità. I prompt sono le istruzioni fornite al modello AI per generare risposte o eseguire azioni. Guidano l'AI nella comprensione dell'intento dell'utente e nella generazione di output pertinenti.

Componenti utilizzati in questo flusso

Di seguito è riportato un elenco completo di tutti i componenti utilizzati in questo flusso per raggiungere la sua funzionalità. I componenti sono gli elementi costitutivi di ogni Flusso AI. Ti permettono di creare interazioni complesse e automatizzare attività collegando varie funzionalità. Ogni componente serve a uno scopo specifico, come la gestione dell'input dell'utente, l'elaborazione dei dati o l'integrazione con servizi esterni.

Descrizione del flusso

Scopo e benefici

Panoramica

Questo workflow implementa un semplice chatbot RAG (Retrieval-Augmented Generation) che sfrutta la Ricerca Google in tempo reale per recuperare informazioni aggiornate da internet—può essere personalizzato per limitare tutte le ricerche a un dominio specifico. L’obiettivo principale è creare un chatbot capace di rispondere alle domande degli utenti utilizzando i contenuti più rilevanti e recenti trovati online, risultando molto utile in scenari dove le basi di conoscenza statiche non sono sufficienti.

Componenti chiave e flusso

Il workflow è composto da diversi blocchi modulari, ciascuno rappresentante una specifica funzionalità. Di seguito una panoramica della struttura e delle funzionalità del workflow:

ComponenteRuolo
Chat InputRiceve le domande e i messaggi degli utenti.
Chat HistoryMantiene lo storico della conversazione per risposte contestualizzate.
Query ExpansionParafrasa l’input dell’utente in più query alternative per migliorare la copertura della ricerca.
Google SearchEsegue ricerche su Google, limitate da un prefisso di dominio personalizzabile.
URL RetrieverEstrae i contenuti dagli URL restituiti dalla Ricerca Google.
Prompt TemplateStruttura il contesto, l’input utente e la storia per il modello linguistico.
OpenAI LLMGenera risposte utilizzando un modello linguistico (ad es. GPT-3/4).
GeneratorAttiva l’LLM con il prompt e il contesto per produrre la risposta.
Chat OutputMostra le risposte del chatbot all’utente.
Button WidgetsFornisce esempi di domande rapide che l’utente può provare con un solo click.
Chat Opened TriggerInizializza la conversazione e popola i pulsanti di avvio rapido.

Come funziona il workflow

Quando un utente apre la chat, viene attivato il Chat Opened Trigger. Questo inizializza l’interfaccia chat e presenta diversi Button Widgets con domande di esempio (ad esempio, “quale dinosauro ha 500 denti?”). Quando un utente clicca su un pulsante o inserisce un messaggio personalizzato tramite Chat Input, il workflow procede come segue:

  1. Espansione della richiesta: L’input dell’utente viene parafrasato in diverse versioni per massimizzare la probabilità di recuperare risultati di ricerca rilevanti.

  2. Ricerca Google: Le query espanse vengono inviate alla Ricerca Google. Di default, la ricerca è limitata a un dominio specifico (impostato tramite il campo query_prefix, ad esempio site: www.TUODOMINIO.com), permettendo di focalizzare la conoscenza del chatbot sul tuo sito web o su una fonte affidabile.

  3. URL Retriever: Il workflow recupera i contenuti dei primi risultati di ricerca (URL) come documenti completi.

  4. Assemblaggio del prompt: I contenuti recuperati, l’input dell’utente e la storia della chat vengono combinati tramite il componente Prompt Template per fornire un contesto ricco alla risposta.

  5. Generazione con modello linguistico: Il prompt viene inviato all’OpenAI LLM, che genera una risposta coerente e contestualmente rilevante.

  6. Visualizzazione della risposta: La risposta generata viene mostrata all’utente tramite Chat Output.

Esempio di flusso d’uso

  • L’utente apre la chat: appare un messaggio di benvenuto e tre pulsanti con domande di esempio.
  • L’utente clicca su “quando è la festa della mamma 2024?”: la domanda viene subito mostrata nell’output della chat (per un feedback immediato).
  • Il workflow esegue la domanda attraverso espansione, ricerca, recupero, assemblaggio del prompt e generazione LLM, quindi mostra la risposta.

Perché questo workflow è utile

  • Conoscenza in tempo reale: Il chatbot può rispondere utilizzando le informazioni più aggiornate disponibili su internet o sul dominio scelto.
  • Restrizione al dominio: Personalizzando il query_prefix, puoi fare in modo che il chatbot utilizzi solo informazioni dal tuo sito web o base di conoscenza affidabile, migliorando l’affidabilità delle risposte.
  • Consapevolezza del contesto: Includendo la storia della chat e i contenuti recuperati nel prompt, le risposte possono essere personalizzate e contestuali anche per conversazioni multi-turno.
  • Scalabilità e automazione: Il design modulare permette di estendere o adattare facilmente il workflow per vari domini, supportando la distribuzione su larga scala su diversi siti o argomenti.
  • Esperienza utente: I pulsanti di avvio rapido e il feedback immediato rendono il chatbot facilmente accessibile agli utenti finali.

Tabella riassuntiva del workflow

StepDescrizione
User InputL’utente scrive una domanda o clicca su un pulsante di avvio rapido
Query ExpansionL’input viene parafrasato per ampliare la copertura della ricerca
Google SearchLe ricerche vengono effettuate su Google, limitate a un dominio specifico
URL Content RetrievalI contenuti dei risultati principali vengono recuperati
Prompt ConstructionInput utente, risultati di ricerca e storia chat sono compilati in un prompt
LLM GenerationL’LLM di OpenAI genera una risposta utilizzando tutto il contesto
OutputLa risposta viene mostrata all’utente

Personalizzazione

  • Per focalizzare il chatbot sul tuo dominio, modifica il campo query_prefix nel componente Google Search (ad esempio, site: www.TUODOMINIO.com).
  • Aggiungi o modifica le domande di esempio tramite i componenti Button Widget per un’esperienza più personalizzata.

Casi d’uso ideali

  • Bot di supporto clienti che rispondono sempre basandosi sulla tua documentazione o contenuti web aggiornati.
  • Assistenti di knowledge interni limitati all’intranet aziendale o al portale di supporto.
  • Qualsiasi chatbot che deve sempre citare o basarsi su fonti esterne e autorevoli (ad esempio, per conformità o accuratezza).

Automatizzando il processo di ricerca, recupero e generazione delle risposte, questo workflow consente di risparmiare tempo rispetto alla ricerca manuale e assicura che gli utenti ricevano sempre le informazioni più aggiornate e rilevanti disponibili.

Costruiamo il tuo team AI

Aiutiamo aziende come la tua a sviluppare chatbot intelligenti, server MCP, strumenti AI o altri tipi di automazione AI per sostituire l'uomo in compiti ripetitivi nella tua organizzazione.

Scopri di più