W dniach 13 i 14 maja użytkownicy mieli okazję śledzić aktualizacje dwóch gigantów w obszarze dostarczania usług online, OpenAI i Google, którzy zaprezentowali nowe funkcje swoich zaawansowanych chatbotów opartych na AI. Poniżej przedstawiamy szczegółowe podsumowanie tych wydarzeń, które obejmują aktualizacje GPT-4o od OpenAI oraz nowości w Google Gemini i innych usługach Google AI.
OpenAI i ChatGPT 4o
Wprowadzenie GPT-4o
OpenAI ogłosiło premierę swojego najnowszego modelu, GPT-4o. Ten model oferuje inteligencję na poziomie GPT-4, ale jest znacznie szybszy i bardziej zaawansowany w przetwarzaniu tekstu, głosu i obrazu. Dzięki GPT-4o użytkownicy mogą teraz lepiej rozumieć i omawiać udostępnione obrazy. Przykładowo, można zrobić zdjęcie menu w obcym języku, a ChatGPT przetłumaczy je, opowie o historii potraw i zaproponuje rekomendacje. W przyszłości planowane są także bardziej naturalne rozmowy w czasie rzeczywistym oraz możliwość prowadzenia rozmów wideo.
Nowe narzędzia dla użytkowników darmowych
Dzięki GPT-4o, użytkownicy darmowej wersji ChatGPT otrzymują dostęp do funkcji, które wcześniej były dostępne tylko dla subskrybentów. Obejmują one:
- Doświadczenie inteligencji na poziomie GPT-4.
- Uzyskiwanie odpowiedzi zarówno z modelu, jak i z internetu.
- Analizowanie danych i tworzenie wykresów.
- Rozmowy o przesłanych zdjęciach.
- Przesyłanie plików do pomocy w streszczaniu, pisaniu lub analizie.
- Korzystanie z pamięci, która zapamiętuje wcześniejsze rozmowy.
Limit wiadomości dla użytkowników darmowych będzie ograniczony, a po jego osiągnięciu ChatGPT automatycznie przełączy się na GPT-3.5, aby kontynuować konwersację.
Google i Gemini
Nowości w Google Gemini
Google również zaprezentowało wiele ekscytujących aktualizacji swojego systemu AI, Gemini. Model Gemini oferuje wielomodalność, co oznacza, że może przetwarzać różne typy danych wejściowych i generować różnorodne wyniki. W ostatnich miesiącach Gemini umożliwiło wykorzystanie do 1 miliona tokenów w zapytaniach, co pozwala na przykład na włączenie wideo do zapytań i generowanie danych JSON z obiektów wideo.
Gemini 1.5 Pro i Flash
Gemini 1.5 Pro jest teraz dostępny dla wszystkich deweloperów na całym świecie, oferując 2 miliony tokenów w prywatnym podglądzie. Z kolei Gemini 1.5 Flash został zoptymalizowany pod kątem niskiej latencji i wysokiej wydajności, również z dostępem do 2 milionów tokenów.
Inne Usługi Google AI
AI Overview w wyszukiwarce Google
Funkcja AI Overview jest teraz dostępna w USA, z planami rozszerzenia na inne kraje. Pozwala ona na przeszukiwanie wideo, stron internetowych, map, finansów, zakupów, hoteli i książek, zapewniając natychmiastowe odpowiedzi na jedno zapytanie. Użytkownicy mogą personalizować wyniki wyszukiwania zgodnie ze swoimi preferencjami.
Project Astra
Project Astra to nowa funkcja, która działa jako osobisty agent AI, umożliwiając prowadzenie rozmów wideo w czasie rzeczywistym z Gemini. Możesz zadawać pytania dotyczące obiektów widocznych na kamerze, a także otrzymywać informacje na temat miejsc, które odwiedzasz. Gemini analizuje wszystkie twoje zdjęcia i tworzy między nimi znaczące połączenia, umożliwiając zadawanie złożonych pytań dotyczących twoich zdjęć.
Veo i Imagen 3
Veo to narzędzie do generowania wysokiej jakości wideo 1080P na podstawie zapytań tekstowych. Umożliwia tworzenie filmów z efektami kinowymi, takimi jak timelapse czy ujęcia lotnicze. Możesz przedłużać sceny za pomocą VideoFx, a lista oczekujących na labs.google jest już otwarta.
Imagen 3 pozwala na generowanie szczegółowych obrazów na podstawie tekstowych zapytań, umożliwiając tworzenie kreatywnych wizualizacji tekstowych.
Music AI Sandbox
Music AI Sandbox umożliwia modyfikowanie dźwięków i dodawanie efektów, pozwalając na tworzenie unikalnych kompozycji muzycznych.
Podsumowanie
Google I/O 2024 przyniosło wiele ekscytujących nowości, które z pewnością zmienią sposób, w jaki korzystamy z technologii AI na co dzień. Od zaawansowanych modeli AI, takich jak GPT-4o i Gemini, po innowacyjne narzędzia generatywne i integracje z systemem Android, Google pokazuje, że przyszłość AI jest jasna i pełna możliwości. Zachęcamy do śledzenia kolejnych aktualizacji i odkrywania, jak te technologie mogą wzbogacić nasze codzienne życie.