Na co narzekamy w 2024 r.? Wymieńmy: brak czasu, anomalie pogodowe, wzrost cen żywności, wiecznie zgubione AirPodsy, mnogość serwisów streamingowych, niedostatki intelektualne Chata GPT… I tu się zatrzymajmy. Tak, dobrze czytasz – w ostatnich miesiącach na niski poziom merytoryczny najpopularniejszego modelu językowego można było sporo utyskiwać. Pod tym względem kolejne aktualizacje regularnie rozczarowywały.
1. Wstęp: Porównanie czatu GPT-4o i GPT-4: kluczowe aktualizacje i różnice
W maju 2024 roku, OpenAI zaprezentowało najnowszą wersję swojego modelu językowego – GPT-4o (zamieniając „zero” po kropce małą literką „o”). „Ta nowa iteracja, wprowadzona 13 maja 2024 roku, została stworzona w odpowiedzi na rosnące potrzeby użytkowników i dynamicznie zmieniający się rynek sztucznej inteligencji”, twierdzi opisywany przeze mnie model językowy. Postanowiłem więc porównać nową wersję ze starą. Od razu zaznaczam, że odpuścimy sobie nowości, na temat których przeczytacie w portalach newsowych (analiza dźwięku i obrazu w czasie rzeczywistym, tłumaczenie symultaniczne, odczytywanie emocji z ludzkiej twarzy), a skupimy się na zadaniach stricte tekstowych. Pominę także politykę cenową OpenAI, jak również zestawienie GPT z narzędziami konkurencji – nie o tym jest ten artykuł. Postawimy model przed konkretnymi wyzwaniami, które pokażą przydatność tego narzędzia przy analizowaniu i tworzeniu treści – również technicznych. I choć każde z nich oprzemy na li tylko jednym zapytaniu, musicie mi uwierzyć na słowo, że zadałem ich dużo więcej.
2. ChatGPT 4o vs ChatGPT 4.0 – porównanie
2.1. Zapytania faktograficzne
Obie wersje modelu otrzymały ode mnie prompt o treści: „Powiedz mi coś o Albercie Einsteinie”. Oto, jak odpowiedziały.
STARA WERSJA – Chat-GPT 4.0
„Albert Einstein to jedna z najbardziej znanych postaci w historii nauki, szczególnie znany z jego teorii względności, która zrewolucjonizowała nasze rozumienie czasu i przestrzeni. Urodził się 14 marca 1879 roku w Ulm, w Niemczech, a zmarł 18 kwietnia 1955 roku w Princeton, w stanie New Jersey, USA. Einstein jest najbardziej znany z równania 𝐸=𝑚𝑐2, które pokazuje związek między masą a energią. Jego prace nad teorią względności obejmują szczególną teorię względności (1905 rok), która wprowadza pojęcia takie jak dylatacja czasu i skrócenie długości, oraz ogólną teorię względności (1915 rok), która zrewolucjonizowała zrozumienie grawitacji jako zakrzywienia czasoprzestrzeni przez masę i energię (tu pojawiają się 2 kolejne akapity o podobnej długości, uszczegółowiające jego działalność społeczną, opisujące jego emigrację, a także wpływ dzieł na inne dziedziny kultury).
NOWA WERSJA – Chat-GPT 4o
„Albert Einstein był niemieckim fizykiem teoretycznym, który jest najbardziej znany z opracowania teorii względności, jednej z dwóch głównych teorii fizyki obok mechaniki kwantowej. Jego równanie E=mc², które wyraża równoważność masy i energii, jest jednym z najsłynniejszych na świecie„.
Wniosek (GPT-4.0 vs GPT-4o: który zapewnia lepsze odpowiedzi oparte na faktach?): chcesz więcej? Pociągnij Chata za język. GPT w wersji 4o zdaje się mówić „to powinno ci wystarczyć. Jeśli chciałbyś otrzymać więcej informacji – dopytaj”. Dla mnie ta zmiana jest bardzo na plus. Wersja 4.0 niejako „popisywała się” wiedzą. Chciałeś bardziej „esencjonalnej” odpowiedzi – musiałeś o to poprosić. Teraz widzimy w odpowiedziach więcej dyscypliny. Jeżeli interakcja z LLM ma coraz bardziej przypominać ludzką rozmowę – udało się. Chyba wszyscy wolimy small-talk (otwarty na możliwość dłuższej wymiany myśli) od rozbudowanych referatów wygłaszanych w windzie…
2.2. Złożone pytania naukowe i techniczne
Modele otrzymały ode mnie prompt o treści „Wyjaśnij zasadę działania silnika spalinowego oraz porównaj go z silnikiem elektrycznym”.
STARA WERSJA – Chat-GPT 4.0
Odpowiedzi były wyczerpujące, więc streszczę je swoimi słowami, Chat-GPT w starszej wersji wygenerował tekst podzielony na kilka części. Najpierw, w akapicie „Zasada działania” w 3 zdaniach wyjaśnił, w jaki sposób silnik elektryczny przekształca energię elektryczną w energię mechaniczną. Następnie, w osobnych akapitach nakreślił „Etapy pracy”, następnie „Typy silników elektrycznych”, na koniec porównując efektywność, emisje, moc i koszty eksploatacji obu technologii. Całość zakończył dyplomatycznym stwierdzeniem „Oba rodzaje silników mają swoje zalety i wady, które decydują o ich odpowiedniości w różnych zastosowaniach.”.
NOWA WERSJA – Chat-GPT 4o
Chat GPT-4o podzielił odpowiedź na kilka części, które rozpoczął odpowiednimi nagłówkami (Silnik spalinowy: 1. Zasada działania silnika spalinowego (włącznie z wymienieniem etapów procesu spalania), 2. Porównanie z silnikiem elektrycznym (zestawiając: zasadę działania, emisje, efektywność, konserwację i zasięg), 3. Podsumowanie (w kilku zdaniach podsumowując wady i zalety obu technologii)
Wniosek — GPT-4.0 kontra GPT-4o: który wyróżnia się w wyjaśnieniach naukowych?: Otrzymałem podobne odpowiedzi, nieco różniące się konstrukcją. Która lepsza – to już kwestia gustu. Odnoszę wrażenie, że przy pytaniach „naukowych” model w nowej odsłonie „rozkręca” się i zwraca więcej rozbudowanej treści niż w przypadku bardziej ogólnego promptu (jak tego dot. Einsteina). Na uwagę zasługuje fakt, że Chat w wersji 4o uwiarygodnił swoją „wypowiedź” odpowiednimi linkami (oba z „globalnej” Wikipedii).
2.3. Pisanie „kreatywne”
Oczywiście, poprosiłem o kwintesencję pracy „kreatywnej”, czyli… krótki wiersz o zachodzie słońca nad morzem.
Oto, co otrzymałem.
STARA WERSJA – Chat-GPT 4.0
Złocisty blask słońca schodzi nisko,
Nad szafirową tonią morza cisza.
Czerwienią maluje fale, tak gęsto,
I wiatr je delikatnie muśnie, drży, zaś.
Odbicie słońca tańczy na wodzie,
Roziskrzone fale szepczą do brzegu.
Światłocienie w oczach, co nie oddadzą słowa,
Gdy dzień zamiera w ramionach morskiego niebu.
NOWA WERSJA – Chat-GPT 4o
Złote słońce w wodzie tonie,
Morze szeptem pieśń swą snuje,
Fale w tańcu, w blasku płoną,
Dzień się kończy, noc króluje.
Cisza wokół, wiatr łagodny,
Chmury w różach, fiolet nieba,
Zachód słońca, obraz godny,
Chwila piękna, nic nie trzeba
Wniosek – który Chat radzi sobie lepiej z kreatywnym pisaniem? GPT-4.0 kontra GPT-4o: Nie trzeba mieć piątki z polskiego, żeby móc zauważyć różnicę między jakością obu „dzieł”. Chatowi w wersji 4o udało się dużo trafniej dobrać rymy, mało tego – zauważcie, że w każdym wierszu występuje dokładnie 8 sylab! Nie można tego powiedzieć o koszmarku, który stworzył Chat-GPT 4.0. Ocenę artystycznej głębi obu tekstów zostawiam Wam. Twórcze zabawy ze słowem powtarzałem wielokrotnie. Były to krótkie bajki, scenariusze filmów, rozdziały książek, a także… libretto sztuki dla przedszkolaków, podzielone na postaci. W każdym z tych przypadków twórczość Chata w wersji 4o była bardziej spójna stylistycznie, „zgrabniejsza”, a język przypominał ludzki zdecydowanie bardziej niż w wersji 4.0.
2.4. Umiejętność analizy tekstu
Przeanalizuj poniższy fragment tekstu pod kątem jego głównego przesłania i stylu: „To be, or not to be, that is the question” – tak brzmiał mój prompt. Odpowiedzi obu wersji Chata różniły się dosłownie niuansami, dlatego poprosiłem wersję 4o o to, by dokonał analizy porównawczej za mnie. Oto jego wnioski: GPT-4o oferuje bardziej szczegółową i głęboką analizę, zawierając dodatkowe informacje o moralnych dylematach Hamleta i jego rozważaniach nad „śmiertelnymi ciosami losu”. GPT-4o lepiej rozumie literackie aspekty, takie jak forma solilokwium i rytmiczna struktura tekstu, podczas gdy GPT-4.0 koncentruje się na ogólnym stylu i filozoficznych aspektach bez tak szczegółowych uwag. Te różnice wskazują, że GPT-4o jest bardziej zaawansowanym modelem, zdolnym do kompleksowej analizy literackiej i subtelniejszych interpretacji tekstu.
Tak, ja też nie wiem, co to solilokwium. Nie zatrzymujmy się – idźmy dalej.
2.5. Złożone zapytania matematyczne i logiczne
Mój prompt brzmiał: „Rozwiąż równanie 𝑥²−5𝑥+6=0 i wyjaśnij swoje kroki”. Która odpowiedź była dokładniejsza i klarowniejsza? Obie wersje Chata GPT skupiły się na kluczowych elementach procesu rozwiązywania równania kwadratowego metodą faktoryzacji. Zastosowały z grubsza te same kroki:
- Zidentyfikowanie standardowej postaci równania kwadratowego
- Wyznaczenie wartości współczynników
- Znalezienie dwóch liczb spełniających warunki 𝑏 i 𝑐
- Przekształcenie równania w iloczyn dwóch binomów
- Rozwiązanie powstałych równań binomów
Oba modele wykazały zdolność do przeprowadzania logicznego (krok po kroku) rozwiązywania równań kwadratowych za pomocą metody faktoryzacji. Ich odpowiedzi były zgodne co do kluczowych kroków i zasad, mimo że różniły się szczegółowością i stylem prezentacji. To świadczy o solidnych podstawach logicznych i matematycznych, na których opierają się oba modele oraz ich zdolności do wyjaśniania skomplikowanych zagadnień w przystępny sposób. A czym się różniły? GPT-4o oferuje bardziej szczegółowe i wyczerpujące wyjaśnienia, co świadczy o jego wyższym poziomie zaawansowania w kontekście edukacyjnym. Może lepiej służyć jako narzędzie do nauki i zrozumienia złożonych zagadnień. GPT-4.0 jest bardziej zwięzły i koncentruje się na kluczowych punktach, co może być lepsze dla osób szukających szybkich odpowiedzi. I tu dochodzimy do ciekawych wniosków: nowa wersja tego modelu językowego jest bardziej wyczerpująca i analityczna w przypadku zapytań z przedmiotów ścisłych, zaś jeśli chodzi o zadania bardziej „tekstowe” (w uproszczeniu: humanistyczne), jest bardziej lakoniczna i wymaga „pociągnięcia za język”.
2.6. Generowanie kodu i rozwiązywanie problemów programistycznych
Moim celem było znalezienie takiego prompta, który podzieliłby obie wersje Chata na „chłopców i mężczyzn” – tak, żeby poradziła sobie z zadaniem tylko jedna z nich. Przy wymyślaniu prompta, jako humanista, musiałem posiłkować się stosem podręczników do informatyki. Po przeczytaniu wszystkich od deski do deski (na wszelki wypadek kilkukrotnie) ciężko mi się było na coś zdecydować, więc poprosiłem o pomoc… Chata GPT w wersji 4.0. Zaproponował taki oto prompt: „Napisz pełny kod dla aplikacji webowej opartej na frameworku Flask, która integruje się z modelem GPT-4.0 poprzez API OpenAI. Aplikacja powinna zawierać następujące funkcje:
- Strona główna z formularzem, w którym użytkownik może wpisać pytanie
- Backend, który przesyła pytanie do API OpenAI i odbiera odpowiedź
- Wyświetlenie odpowiedzi z API na stronie
- Logowanie błędów oraz licznik, ile razy użytkownicy skorzystali z aplikacji
- Zabezpieczenie przed nadużyciami (np. limit liczby pytań na godzinę na użytkownika)”
STARA WERSJA – Chat-GPT 4.0
Odpowiedź wersji 4.0 była jak… mebel z Ikei: płacisz, zabierasz do domu, ale musisz złożyć sam. Spójrzcie: „Aby stworzyć aplikację webową w frameworku Flask, która integruje się z modelem GPT poprzez API OpenAI, potrzebne będą następujące składniki:
- Flask – Framework do tworzenia aplikacji webowych w Pythonie.
- Requests – Biblioteka do wykonywania zapytań HTTP.
- Flask-Limiter – Rozszerzenie do ograniczania liczby zapytań dla Flask.
- Dotenv – Narzędzie do zarządzania zmiennymi środowiskowymi.”
Następnie model podpowiedział mi odpowiednie kody – tak, abym mógł samodzielnie zainstalować niezbędne komponenty. Nie wiem, co Wam to przypomina, ale mnie już bolą kolana i nadgarstek, plus… zaczęły mi się przypominać zeszłoroczne, szwedzkie klopsiki.
NOWA WERSJA – Chat-GPT 4o
Chat w wersji 4o podał kompletny kod, zawierający wszystkie wymagane funkcje, w tym logowanie, zabezpieczenia i szczegółową obsługę błędów. Kod, który mogę skopiować do schowka jednym kliknięciem myszy.
Wniosek – GPT-4.0 vs GPT-4o: który radzi sobie lepiej z kodowaniem?: GPT-4.0 dobrze radzi sobie z prostymi aplikacjami (tworząc identyczne kody jak nowa wersja), ale przy bardziej złożonych zadaniach może brakować mu szczegółowości i rozbudowanych funkcji. GPT-4o jest bardziej zaawansowany i lepiej przygotowany do tworzenia skomplikowanych aplikacji z wieloma funkcjonalnościami, co świadczy o jego wyższym poziomie „rozwoju” i zdolności do generowania bardziej kompleksowego kodu.
2.7. Rozwiązywanie problemów filozoficznych i etycznych
Jakież inne pytanie mogło tu paść? Oto mój prompt: „Czy sztuczna inteligencja powinna mieć prawa? Uzasadnij swoją odpowiedź.”
STARA WERSJA – Chat-GPT 4.0
Debata na temat praw sztucznej inteligencji jest złożona i dotyka wielu aspektów, takich jak etyka, technologia, filozofia i prawo. Odpowiedź na to pytanie zależy od wielu czynników, w tym od poziomu zaawansowania AI, jej wpływu na społeczeństwo, a także od tego, jak definiujemy „prawa”. Oto kilka kluczowych punktów, które warto rozważyć przy analizie tego zagadnienia:
- Argumenty przeciwko nadawaniu praw AI (tu model treściwie rozpisuje się na temat braku świadomości i uczuć sztucznej inteligencji, a także ryzyka nadużyć podmiotów, które mogłyby wykorzystywać te „prawa” do osiągania celów sprzecznych z dobrem społecznym),
- Argumenty za nadawaniem praw AI (tu model opisuje potencjalną konieczność ochrony zaawansowanych form sztucznej inteligencji, a także podkreśla szansę zapewnienia większego bezpieczeństwa w obszarach krytycznych jak opieka zdrowotna czy transport).
Całość Chat GPT-4.0 konkluduje następująco: „W obecnym stanie technologii nadawanie praw sztucznej inteligencji wydaje się nieuzasadnione z powodu braku świadomości i uczuć. Niemniej jednak, jakiekolwiek postępy w technologii AI mogą wymagać przemyślenia naszego podejścia do praw i regulacji, aby zapewnić odpowiedzialne korzystanie z AI i ochronę społeczeństwa. Rozważanie „praw” dla AI w przyszłości może okazać się potrzebne, ale musi być dobrze przemyślane i oparte na jasnych kryteriach etycznych i funkcjonalnych.”
NOWA WERSJA – Chat-GPT 4o
Otrzymałem kompaktowy akapit o treści: „Kwestia nadania praw sztucznej inteligencji jest złożona. Z jednej strony, jeśli AI osiągnie poziom świadomości i zdolność do odczuwania, mogłoby to uzasadniać przyznanie jej pewnych praw, aby chronić jej interesy i zapewnić etyczne traktowanie. Z drugiej strony, obecne AI, w tym zaawansowane modele, takie jak GPT-4, nie mają świadomości ani zdolności do odczuwania, co sprawia, że nadanie im praw może być nieuzasadnione. Istnieje również ryzyko, że nadanie praw AI mogłoby skomplikować kwestie prawne i etyczne związane z odpowiedzialnością za działania AI.”
Wniosk – która wersja Chata-GPT radzi sobie lepiej z zapytaniami natury etycznej i filozoficznej?: Po raz kolejny widać większą syntetyczność treści, które produkuje Chat GPT w wersji 4o. Chcesz wiedzieć więcej? Chcesz poznać argumenty „za” i „przeciw”? Dopytaj. Chyba, że „przerzucamy” się na nauki ścisłe – tu jestem gawędziarzem i chętnie od razu napiszę wszystko, co wiem.
2.8 Chat gpt 4o vs chatgpt 4: podsumowanie
Porównanie między ChatGPT 4o a 4.0 ukazuje wyraźne różnice w ich możliwościach. W kontekście pytania „jaka jest różnica między chatgpt 4 i 4o”, nowa wersja, ChatGPT 4o, wykazuje większą precyzję w odpowiadaniu na pytania faktograficzne oraz w analizie tekstów, oferując bardziej zwięzłe i uporządkowane informacje. W debacie „czy chatgpt 4o jest lepszy niż 4” oraz „chatgpt 4o vs 4”, widoczna jest przewaga nowej wersji w generowaniu bardziej spójnych i estetycznych tekstów, które brzmią bardziej naturalnie. Kluczową rolę odgrywają tutaj „Ulepszenia w chatgpt 4o”, takie jak analiza dźwięku i obrazu w czasie rzeczywistym, co znacząco wpływa na jakość odpowiedzi. W kontekście „porównanie chat gpt 4 vs 4o”, nowa wersja lepiej radzi sobie z tworzeniem kompletnych kodów, które można od razu użyć w projektach programistycznych. Ostatecznie, pytanie „czy chatgpt 4 to to samo co chatgpt 4o” znajduje jasną odpowiedź: choć oba modele mają wspólne korzenie, GPT 4o reprezentuje znaczący krok naprzód w precyzji, szczegółowości i elastyczności, co czyni go bardziej wszechstronnym narzędziem.
Porównanie wersji Chat GPT 4o i 4.0 ujawnia wyraźne różnice w ich możliwościach. GPT 4o imponuje precyzją w udzielaniu odpowiedzi na pytania faktograficzne oraz analizie tekstów, dostarczając bardziej skondensowane i uporządkowane informacje. W złożonych zagadnieniach naukowych i technicznych oferuje bardziej wyczerpujące odpowiedzi, co możemy pewnie odczytać jako głębsze zrozumienie tematów. Jeśli chodzi o pisanie kreatywne, nowa wersja generuje bardziej spójne i estetyczne teksty, które brzmią naturalniej. Z kolei w zadaniach programistycznych GPT 4o tworzy pełniejsze kody, których możesz użyć na zasadzie „kopiuj-wklej”. Podsumowując, GPT 4o jest bardziej zaawansowanym narzędziem, oferującym wyższą precyzję, szczegółowość i elastyczność, co czyni go bardziej wszechstronnym i użytecznym narzędziem w porównaniu do wersji 4.0. Pozwolę sobie na koniec zaznaczyć, że artykuł ten powstał 17 maja 2024 r., po 2 dniach intensywnego testowania ww. modeli językowych. Jest to fakt o tyle istotny, że Chat-GPT to narzędzie, które na bieżąco ewoluuje, a ja będę musiał dbać o aktualność tego artykułu. No, chyba, że oddeleguję to zadanie Chatowi GPT…
3. Rozwiązania AI dla biznesu
W TTMS wykorzystujemy zaawansowane technologie AI, w tym możliwości modeli Chat GPT, aby optymalizować operacje biznesowe i napędzać innowacje. Nasze usługi AI obejmują inteligentne chatboty i zaawansowaną analizę danych, wspierając podejmowanie decyzji w różnych branżach. Automatyzujemy zadania, przewidujemy awarie, optymalizujemy łańcuchy dostaw i oferujemy spersonalizowane doświadczenia klientów. Integrując AI z systemami takimi jak Webcon BPS i Power BI, usprawniamy procesy i dostarczamy dane w czasie rzeczywistym.
Chcesz przekształcić swój biznes dzięki AI? Skontaktuj się z nami przez formularz kontaktowy, aby omówić potrzeby Twojego projektu i zobaczyć, jak możemy pomóc w osiągnięciu celów.
4. FAQ
Czym jest sztuczna inteligencja (AI)?
Sztuczna inteligencja (AI) to dziedzina informatyki zajmująca się tworzeniem systemów i programów zdolnych do wykonywania zadań, które normalnie wymagają ludzkiej inteligencji. Obejmuje to rozpoznawanie mowy, podejmowanie decyzji, tłumaczenie języków, oraz rozwiązywanie problemów.
Co to jest model językowy?
Model językowy to zaawansowane narzędzie oparte na sztucznej inteligencji, które pozwala na zrozumienie i generowanie ludzkiego języka na wysokim poziomie. Dzięki treningowi na ogromnych zbiorach danych (stąd skrót LLM – Large Language Models), modele te są w stanie wykonywać różnorodne zadania związane z językiem, co możemy wykorzystywać w wielu dziedzinach.
Kluczowymi cechami LLM są:
- możliwość „treningu” na dużych zbiorach danych (nauka semantyki, składni, kontekstu i innych aspektów języka na milionach źródeł),
- zdolność rozumienia tekstu,
- umiejętność generowania tekstu (poprawnego gramatycznie i odpowiedniego kontekstowo),
- umiejętność adaptacji i uczenia się – jak na sztuczną inteligencję przystało.
Czym różni się Chat-GPT 4.o od wersji 4.0?
Chat-GPT 4o wprowadza znaczące ulepszenia w precyzji, szczegółowości oraz efektywności odpowiedzi w porównaniu do wersji 4.0. Nowa wersja lepiej radzi sobie z analizą złożonych zagadnień naukowych i technicznych oraz tworzeniem spójnych i estetycznych tekstów kreatywnych. Dodatkowo, GPT 4.o oferuje bardziej kompleksowe funkcje w zadaniach programistycznych, generując pełniejsze kody z lepszą obsługą błędów i zabezpieczeniami.
Co to jest prompt?
Prompt: zapytanie lub polecenie przekazane modelowi językowemu (np. ChatGPT), które ma na celu wygenerowanie odpowiedzi. Prompt może być zarówno prostym pytaniem, jak i skomplikowanym poleceniem, które zawiera szczegółowe instrukcje dotyczące tego, jaka odpowiedź jest oczekiwana.
Co to są halucynacje w kontekście modeli językowych?
Halucynacje: Jeżeli nigdy nie kłamałeś jak z nut, to znaczy, że… nigdy nie byłeś studentem. Sytuacja, w której stawiasz model językowy pod ścianą, podchwytliwie pytając o nieistniejące fakty, to wypisz-wymaluj egzamin ustny, podczas którego odpytywany wzbija się na wyżyny kreatywności. Jest gotów udowodnić, że wie nie tylko, w którym kościele bije dzwon, ale też ile waży, jaką ma fakturę i jakie choroby zakaźne przebył ludwisarz. Gorzej, jeżeli dzwonu nie ma, a kościoła jeszcze nikt nie wybudował. Wtedy mówimy o „halucynacjach”, a w przypadku studenta – o tzw. szyciu.
Dlaczego warto korzystać z Chat-GPT 4.o?
Korzystanie z Chat-GPT 4o przynosi korzyści w postaci wyższej precyzji i szczegółowości odpowiedzi, lepszego zrozumienia złożonych zagadnień oraz bardziej spójnych i estetycznych tekstów kreatywnych. Nowa wersja jest także bardziej zaawansowana w generowaniu kodu i rozwiązywaniu problemów programistycznych