News will be here
Sundar Pichai (CEO Alphabet) podczas Google I/O 2024, fot. Google

Odkąd Sztuczna Inteligencja zawitała pod strzechy, wielu zadawało sobie pytanie, czy to kres internetowej dominacji Google'a – w końcu po co nam wyszukiwarka, kiedy możemy pytać SI, która przeszuka internet za nas. Wygląda na to, że w Google'u też się nad tym zastanawiano – i uznano, że skoro nie można SI pokonać, to trzeba... zintegrować ją z ofertą.

Oczywiście nie można postrzegać ruchów Aplhabetu (spółka-matka Google’a) jako rewolucyjnych i wywracających do góry nogami wszystko, na czym firma dotąd stała. Wszak Sztuczna Inteligencja już w zeszłym roku była gościem corocznego wydarzenia organizowanego przez Google. Kluczowe są jednak proporcje. Konferencja Google I/O 2023 gościła SI, natomiast Google I/O 2024 właściwie w całości poświęcono właśnie jej.

W zeszłym roku Google mówiło między innymi o tworzeniu treści i narzędzi generowanych przez sztuczną inteligencję, wprowadziło także oprogramowanie fotograficzne Magic Editor do swoich telefonów Pixel, a przy tym ogłosiło, że udostępnia swój model sztucznej inteligencji Bard do użytku globalnego. 12 miesięcy wiele jednak zmieniło. W tym roku Bard oficjalnie został teraz zastąpiony przez Gemini, a SI była obecna właściwie w każdym aspekcie konferencji - od inteligentnych asystentów i generatywnych systemów obrazów, słów, muzyki i mowy, aż po duży model językowy przeszkolony w obszarach specyficznych, takich jak kodowanie lub wiedza medyczna.

Co to zatem oznacza dla konsumentów? Można się spodziewać, że w ciągu najbliższych dwunastu miesięcy sztuczna inteligencja będzie ewoluować na dwa różne sposoby. Z jednej strony nasze codzienne wyszukiwania wkrótce zostaną połączone z nowym rodzajem asystenta AI, kieszonkowym politykiem, który wykorzystuje aparaty naszych smartfonów jako portal. Google zademonstrował Project Astra, prototypowy system, który wykorzystuje wzrok i mowę do odpowiadania na szereg bardzo różnych pytań – rozwiązywania problemu z kodem, wymyślania kalamburu czy znajdowania okularów.

Inne innowacje obejmują Ask Photos, nowy sposób interakcji z własnymi zdjęciami za pomocą poleceń głosowych – na przykład „pokaż mi moje zdjęcia tęczy” lub „Gdzie sfotografowałem to czerwone Audi?”. Im więcej informacji znajduje się w zestawie danych, tym więcej sztuczna inteligencja może zebrać, dlatego Google ogłosił, że wersja Pro Gemini (v1.5) może teraz przeglądać milion tokenów (jednostek przetwarzanych danych) na raz.

Przy obecnym tempie rozwoju i absorpcji tego typu rozwiązania będą miały miejsce bezproblemowo. Gemini wkrada się do Google Workspace i wkrótce stanie się cenną częścią Gmaila. Przykładowy przypadek użycia był przekonujący; wyobraź sobie, że możesz poprosić o podsumowanie wszystkich planów lekcji i wydarzeń na nadchodzący semestr szkolny, co jest dobrodziejstwem dla zapracowanych rodziców.

Badania pokazują, że większość ludzi już korzysta z paska wyszukiwania, jakby była wszechwiedzącą wyrocznią, zwykle zadając bezpośrednie pytania, a nie ciągi powiązanych słów. Bliźnięta i modele, które pójdą po nich, są niesamowicie biegłe w łączeniu tych zapytań w zrozumiałe pakiety – plany posiłków, listy zakupów, plany podróży, wyjaśnienia, sugestie. A wszystko to będzie spersonalizowane, podkreślone przez model dobrze mówionego głosu, który porusza się po bazie danych, która szczegółowo analizuje Twoje upodobania, antypatie, wyszukiwania, lokalizację i historię zakupów, a także wiele, wiele więcej.

Druga ścieżka jest ciemniejsza. Generatywna sztuczna inteligencja już teraz powoduje podziały w branżach kreatywnych, mimo że jest już wstępnie zintegrowana z niezbędnymi narzędziami, takimi jak Photoshop. Firma Google mądrze zaprosiła kilku artystów – Shawnę X, Erica Hu, Erika Cartera i Haruko Hayakawę – do omówienia wykorzystania przez nich Imagen 2, modelu generatywnego obsługiwanego przez Google DeepMind. Były dyrektor kreatywny Nike, Eric Hu, zauważył podobieństwa między „przełomowymi możliwościami” sztucznej inteligencji a takimi ruchami jak renesans i początki fotografii, co jest imponującym twierdzeniem.

Damian Halik

Damian Halik

Kulturoholik, level 99. Czas na filmy, książki, komiksy i gry, generowany gdzieś między pracą a codziennymi obowiązkami, zawdzięcza opanowaniu umiejętności zaginania czasoprzestrzeni.

News will be here