BLEU-score
De BLEU-score, of Bilingual Evaluation Understudy, is een cruciale maatstaf voor het evalueren van de kwaliteit van tekst die door machinevertalingssystemen wordt geproduceerd. Ontwikkeld door IBM in 2001, was het een baanbrekende maatstaf die een sterke correlatie toonde met menselijke beoordelingen van vertaalde kwaliteit. De BLEU-score blijft een hoeksteen binnen het domein van natuurlijke taalverwerking (NLP) en wordt uitgebreid gebruikt om machinevertalingssystemen te beoordelen.