Benchmarks AI

Test standardizzati utilizzati per valutare e confrontare le prestazioni dei modelli di intelligenza artificiale in vari compiti, come il ragionamento, la comprensione del testo, e la percezione visiva e uditiva.