Punteggio BLEU
Il punteggio BLEU, ovvero Bilingual Evaluation Understudy, è una metrica fondamentale per valutare la qualità dei testi prodotti dai sistemi di traduzione automatica. Sviluppata da IBM nel 2001, è stata una metrica pionieristica che ha mostrato una forte correlazione con le valutazioni umane della qualità della traduzione. Il punteggio BLEU rimane una pietra miliare nel campo dell'elaborazione del linguaggio naturale (NLP) ed è ampiamente utilizzato per valutare i sistemi di traduzione automatica.