Według stanu na czerwiec 2024 r. ranking najskuteczniejszych modeli językowych (LLM) oparty na wynikach ELO, powszechnie stosowanej miary w testach porównawczych sztucznej inteligencji służącej do oceny względnej siły modeli sztucznej inteligencji, przedstawia się następująco:
- GPT-4o : 1,287 punktów ELO
- GPT-4o jest obecnie najlepiej ocenianym modelem języka, co odzwierciedla jego wyższą wydajność w wielu zadaniach. Wysoki wynik ELO wskazuje na jego solidne możliwości w zakresie rozumienia języka naturalnego, generowania i ogólnej wszechstronności.
- Gemini Zaawansowane : 1,267 wyniku Elo
- Gemini Advanced to wiodący model z serii Gemini, który został doceniony za swoje zaawansowane możliwości rozumowania i generowania języka. Jego wynik ELO zbliżony do GPT-4o pokazuje, że jest to groźny konkurent w przestrzeni AI.
- Gemini 1.5 Pro 0514 : 1264 punktów Elo
- Ta wersja serii modeli Gemini nadal poszerza granice dzięki udoskonaleniom w zakresie przetwarzania złożonych zapytań i generowania bardziej poprawnych kontekstowo odpowiedzi.
- Gemini 1.5 Pro 0409 : 1257 punktów Elo
- Choć ten model jest nieco gorszy od wersji 0514, nadal radzi sobie wyjątkowo dobrze, co wskazuje na wysoką jakość całej serii Gemini 1.5 Pro.
- GPT-4 Turbo : 1,257 punktów ELO
- GPT-4 Turbo to bardziej zoptymalizowana i szybsza wersja modelu GPT-4, zapewniająca równowagę między wydajnością i efektywnością. Dzięki temu jest chętnie wybierana w zastosowaniach wymagających zarówno szybkości, jak i dokładności.
- GPT-4 1106 : 1,251 punktów ELO
- Ta konkretna wersja GPT-4 charakteryzuje się stabilną wydajnością, co potwierdza niezawodność modelu w obsłudze zróżnicowanych i złożonych zadań.
- Claude 3 Opus : 1,248 punktów ELO
- Claude 3 Opus to mocny model w swojej kategorii, wykazujący się znacznymi możliwościami w zakresie sztucznej inteligencji konwersacyjnej, często wykorzystywany w obsłudze klienta i jako asystent osobisty.
- GPT-4 0124 : 1,246 punktów ELO
- Kolejna odmiana GPT-4, ta wersja zajmuje mocną pozycję dzięki swoim precyzyjnie dostrojonym możliwościom w określonych zastosowaniach.
- Yi Large : 1240 punktów Elo
- Yi Large to znakomity przedstawiciel nowej serii modeli, który zyskał popularność dzięki innowacyjnemu podejściu do zagadnień wielojęzyczności i wielokulturowości.
- Gemini 1.5 Flash : 1,230 punktów ELO
- Pierwszą dziesiątkę zamyka Gemini 1.5 Flash, który został zaprojektowany z myślą o szybkim przetwarzaniu, przez co idealnie nadaje się do zastosowań w czasie rzeczywistym, w których czas reakcji ma kluczowe znaczenie.
Modele te reprezentują najnowocześniejsze modele językowe AI z połowy 2024 r., pokazując szybkie postępy w tej dziedzinie. Nieznaczne różnice w wynikach ELO podkreślają intensywną konkurencję wśród wiodących programistów AI w tworzeniu najpotężniejszych i najefektywniejszych modeli.