News will be here
Fot. Markus Spiske/Unsplash

Poruszenie, jakie wywołała premiera prototypowego ChatuGPT w ostatnich dniach listopada, trudno porównać z jakimkolwiek innym wydarzeniem w internecie. Każdy chciał sprawdzić, jakie możliwości oferuje sztuczna inteligencja – a te były ogromne. Wiele wskazuje jednak na to, że niebawem staną się znacznie większe. Wszystko dzięki nowemu modelowi językowymi.

Wśród wszystkich bazujących na sztucznej inteligencji fenomenów ChatGPT wywołał największe jak dotąd poruszenie. Jedni z miejsca zaczęli snuć mroczne wizje przyszłości w świecie zdominowanym przez roboty, inni zachwycali się możliwościami, jakie oferuje SI. Niektórzy natomiast... wykorzystywali bota w niecnych celach, przez co wywarł on realny wpływ na działalność szkół i uczelni. A to wszystko w ciągu zaledwie trzech miesięcy! Jeśli jednak doniesienia dotyczący modelu GPT-4 się potwierdzą, już teraz możemy stwierdzić, że poznaliśmy zaledwie ułamek potęgi SI od OpenAI.

Jeszcze więcej, jeszcze szybciej, jeszcze dokładniej

modele językowe, GPT-3, GPT-4
Domniemana różnica w liczbie parametrów wykorzystywanych przez modele GPT-3 i GPT-4

Choć to ChatGPT wywołał całe zamieszanie, zdecydowanie ciekawszym aspektem jest jego mózg. Bot od OpenAI jest bowiem jedynie produktem, który korzysta z opracowanego przez tę firmę autoregresyjnego modelu językowego. W tym przypadku mowa o modelu GPT-3 (a właściwie 3.5), którego premiera miała miejsce niemal trzy lata temu. Wówczas mówiliśmy o największym modelu, jaki kiedykolwiek stworzono. W świecie technologii rozwój następuje jednak wyjątkowo szybko, toteż już w 2021 pojawiły się pierwsze doniesienia o jego następcy – GPT-4.

O tym, jak potężny jest model językowy, świadczy przede wszystkim liczba wykorzystywanych przez niego parametrów. Mówimy o wirtualnym mózgu, który dzięki uczeniu maszynowemu przy pomocy sztucznych sieci neuronowych stopniowo dopracowuje umiejętność imitowania ludzkiej mowy/pisma. Liczba parametrów nie przekłada się bezpośrednio na lepsze rezultaty. Z pewnością jej zwielokrotnienie wpływa natomiast na prędkość i responsywność bota. Czemu o tym piszę?

Otóż największym wyróżnikiem GPT-4 na tle poprzednika – przynajmniej pozornie – ma być jego moc. Już w 2021 pojawiły się doniesienia, jakoby nowy model miał operować na stu bilionach parametrów, podczas gdy GPT-3 wykorzystywał jedynie sto siedemdziesiąt pięć miliardów. Jeśli te dane się potwierdzą, można powiedzieć, że GPT-4 będzie pięćset razy lepszy od poprzednika. A ten, jak pokazały ostatnie trzy miesiące, i tak robił furorę. Coraz więcej osób zadaje sobie zatem pytanie, jakie będą możliwości nowego modelu. I tu nie brakuje plotek.

Nowy model zaoferuje skokowy postęp?

ChatGPT, OpenAI
Interfejs ChatuGPT, fot. OpenAI

Obok ChatuGPT w ostatnich miesiącach sporo szumu wywołały także programy takie jak Midjourney. Pierwszy jest narzędziem tekstowym, drugi operuje obrazem. Teoretycznie nie powinny więc ze sobą konkurować, lecz dzięki GPT-4 mogą. Wśród dotychczasowych przecieków i plotek jednym z najciekawszych jest bowiem skategoryzowanie GPT-4 jako modelu multimodalnego. Jednym ze źródeł jest Emil Wallner, ekspert ds. uczenia maszynowego. Jego zdaniem nowy model językowy OpenAI może sprawić, że z poziomu tego samego okienka czatu uzyskamy nie tylko odpowiedzi tekstowe, ale i obrazy, a nawet materiały wideo.

Innym źródłem może być... cennik OpenAI, który udostępniono niedawno. Co prawda nie pada w nim nazwa “GPT-4”, jest jednak zestawienie z obecnym GPT-3.5 Turbo i dwoma innymi modelami opisanymi jako “DV” – jeden oferuje 8K, a drugi aż 32K maksymalnej pojemności kontekstowej. To odpowiednio cztero- i szesnastokrotnie więcej niż podstawowa obecnie wersja operująca na dwóch tysiącach czterdziestu ośmiu słowach naraz. Zmienić mogą się także źródła danych, z których model korzysta. Dotychczasowy bazuje bowiem na zamkniętych zbiorach. Nowy może natomiast uzyskać bieżący dostęp do zasobów internetu – źródłem tych rewelacji jest natomiast Microsoft.

GPT-4 to nie rewolucja, ale...

OpenAI, ChatGPT, GPT-4, Rafael Henrique, Reuters Connect
Fot. Rafael Henrique/Reuters Connect

Gigant z Redmond także chce mieć swój udział w rynku SI, dlatego stworzył Bing Chat. Obecnie jest on co prawda nieco krytykowany między innymi za kiepską responsywność, ale przedstawiciele Microsoftu zdążyli już pochwalić się nadchodzącym upgrade’em, przy okazji niejako ujawniając premierę modelu GPT-4. Ta ma mieć miejsce już 13 marca. Wraz z przeskokiem na lepszy model Bing Chat ma nabrać rozpędu i zyskać nowe funkcje. Oficjalnie padło nawet zapewnienie, że stanie się lepszy od ChatuGPT.

Wiem, brzmi to nieco nieintuicyjnie. Dlaczego OpenAI miałoby udostępnić konkurencji swoją najnowszą technologię, samemu zostając w tyle? Pytanie należałoby jednak postawić inaczej, bo czy Bing Chat i ChatGPT są konkurencyjnymi programami? Jedynie w teorii. W praktyce natomiast Microsoft zainwestował w OpenAI miliardy dolarów, zyskując dostęp do ich technologii na równych zasadach. Jednocześnie firma, której jednym ze współtwórców jest Elon Musk, rozwija swój produkt – mówi się o zaawansowanych pracach nad mobilnym ChatemGPT, ale nie on tu jest najważniejszy.

Ciekawie zresztą na temat przecieków i potencjalnych nowości, jakie zapewni model GPT-4, wypowiedział się niedawno CEO OpenAI. Choć zainteresowanie botem ich firmy jest ogromne, a nadzieje z nowym modelem olbrzymie, Sam Altman studzi zapędy. Dodaje przy tym, że “ludzie proszą się o rozczarowanie i właśnie je dostaną”. Nie chodzi jednak o krytyczną oceną postępów, jakie zanotowano w przypadku nowego modelu językowego. Zdaniem Altmana przesadne są natomiast oczekiwania ludzi, którzy w rzeczywistości nie są gotowi na konsekwencje skokowego rozwoju SI. Prezes stoi przy tym na stanowisku, że GPT-4 ma kontynuować ewolucję, a nie przynieść rewolucję w tym zakresie.

Damian Halik

Damian Halik

Kulturoholik, level 99. Czas na filmy, książki, komiksy i gry, generowany gdzieś między pracą a codziennymi obowiązkami, zawdzięcza opanowaniu umiejętności zaginania czasoprzestrzeni.

News will be here