Generativní umělá inteligence zvládá dnes neuvěřitelné věci. Odstartoval to ChatGPT v listopadu 2022 a mílovými kroky jsme se dostali do stavu, kdy si můžeme popovídat jako rovný s rovným, nebo je nechat dělat úžasné úkoly. K čemu se však který hodí a jaké mají výhody a nevýhody? Pojďme si společně projít a porovnat, co která aplikace aktálně nabízí.
ChatGPT 3.5
Neplacená verze ChatuGPT stačí na většinu základních potřeb. Dokáže dobře komunikovat, vytvářet sumarizace, psát apod. Ještě v listopadu roku 2022 jsme byli z tohoto u vytržení, dnes už ale mají mnozí jiné nároky. Především objem informací, ze kterých čerpá, se zastavil původně v září roku 2021, posléze je OpenAI posunula do roku 2022. Ale stejně je to málo. 3.5 nemá přístup k internetu, takže nezná aktuální informace, většina trénovacích dat je z anglosaské kultury a i čeština je poněkud šroubovaná. Vzhledem k omezenému zdrojovému objemu častěji halucinuje, tedy vymýšlí si správné odpovědi.
Nezavrhujme tuto verzi však úplně. Je to superfunkční psací stroj, který dokáže pravé zázraky. Vědomostí má opravdu velkou kopu a pokud chcete dětem vysvětlit, proč vznikla a jak probíhala bitva u Thermopyl, je tohle váš skvělý parťák s prvotřídním poměrem cena/výkon.
ChatGPT 4.0 Turbo
Tato verze byla dřívplacená, ale nyní už je v sekci free verze. Důležité je, že má přístup na internet. To je zásadní výhoda, takže se lze ptát i na to, co není ve trénovacích datech. Nedávno upravila firma OpenAI i systém zdrojování, takže lze snadno získat i informace, odkud ChatGPT informaci vzal a ověřit si ji.
Další výhodou je možnost analýzy dat, která lze dát v mnoha podobách – od pdf souboru, přes xls, jpg až po datový soubor json. ChatGPT dokáže analyzovat obsah a pracovat s ním. Takže třeba z tabulek dokáže snadno vyseparovat informace podle požadavků je hodnotit, upravovat, předělávat a opět generovat výstup klidně jako xls soubor.
Další výhodou je možnost vytváření obrázků pomocí generativní umělé inteligence Dall-E. Je tu ale méně možností, než u konkurenčního Midjourney.
Velmi zajímavou možností je používání takzvaných GPTs, kde je možné si předdefinovat prompty a pak už jen je automaticky používat.
ChatGPT 4.0 Turbo Team
Zde najdeme všechno jako ve výše zmíněné verzi, ale je možné vytvořit týmy, které spolu mohou kolaborovat. Lze vytvářet GPTs, prompty a akce, které si lze vyměňovat a vytvářet tak lepší výstupy. Cena 30 dolarů za měsíc za uživatele týmu.
ChatGPT 4o
Nejnovější přírůstek u OpenAI není pětka, v níž všichni doufají, ale je to vlastně multimodální čtyřka. Co znamená to multimodální? Především to, že dokáže pracovat s mnoha vstupy i výstupy. Namíříte fotoaparát na matematickou úlohu a on jí přečte a vypočítá. V asistentu v mobilu už můžete napřímo komunikovat s botem, a to tak, že mu můžete i skákat do řeči. On umí napodobovat i lidské pocity (překvapení, potěšení) a konverzace je tam mnohem přirozenější. To jsou ale věci, které se do 4o dostávají postupně.
To, co je ale okamžité je výrazně rychlejší odpověď. Už nemusíte čekat tak dlouho, než umělá inteligence vyťuká na monitor všechna písmenka. Násobně rychlejší odpovědi jsou dost zásadní právě pro rychlou vzájemnou konverzaci.
Gemini
Google nejdřív měl tuto generativní umělou inteligenci pod názvem Bard. Před pár týdny ji ale oficiálně přejmenoval na Gemini. V základní neplacené verzi nabízí velmi podobné vlastnosti jako ChatGPT 3.5. Na rozdíl od něj se ale občas snaží hledat na internetu, někdy to zcela odmítá, jindy si odkazy zcela vyhalucinuje. Je to zajímavá a trochu nebezpečná vlastnost této umělé inteligence, která by se přitom dle logiky věci měla opírat o vyhledavač Google.
Placená verze za přibližně 550 Kč / měsíc nabídne nejen více možností, jako je generování či detekování obrázků, mnohem delší kontextové okno (tedy jakousi paměť vzájemné komunikace), ale třeba i velký cloudový prostor na Google One. Halucinování by mělo být potlačeno intenzivním napojením na Google. Vylepšené jazykové modely se dotáhly na ChatGPT, takže umí velmi dobře náš jazyk a perfektně chápou kontext. Umí také pracovat s uloženými soubory v cloudu apod.
Nová generace I/O (nebo chcete-li verze 1.5) bude umět pracovat v reálném čase s reálnými daty. Ale ty úžasné věci, které nám předvedl Google na své konferenci ještě ani zdaleka nejsou v reálném provozu.
Copilot
Microsoft nabídl svou umělou inteligenci nejdřív zdarma v rámci vyhledavače Bing. Později ji přesunul do balíku Office 365. Základní verze zůstala, lze ji využívat, ale proti předchozím AI nástrojům má mnohem menší kontextové okno, osekané funkce a bohužel i slabší odpovědi. Výhodou je možnost generování obrázků a napojení na internet vyhledavačem Bing.
Copilot v Office 365 je zatím určen spíš pro uživatele v kancelářích, kdy dokáže pracovat například s uloženými dokumenty. U nás zatím je jen v omezeném množství, protože podmínkou je celkem velké množství uživatelů na licenční ujednání (minimálně 300 uživatelů na firmu). Copilot zatím nedosahuje tak navenek efektních výsledků, ale pro podniky se jednoho dnes stane nezbytným pomocníkem, protože pracuje pouze s určenými daty a neposílá je nikam ven.
Claude
Britská firma Antropic dostala ohromné peníze od Amazonu i Googlu, aby postavila svého konkurenta proti ChatuGPT. A zdá se, že se jí to povedlo. Před nedávnem u nás uvedený model (ano, kvůli pravidlům v Evropské unii se sem žádná z těchto firem moc nežene, i když je tu půl miliarda lidí) umí perfektní češtinu, která se dokáže vyvarovat i tradičních nectností generativní umělé inteligence, jako je typické opakování některých slov a vět, halucinování a nedostatečné pochopení zadaného úkolu. Poněkud jiný systém práce této umělé inteligence znamená zcela jiné druhy odpovědí, které nečiší tak umělou inteligencí.
Claude není tak multimodální jako ostatní verze, ale možná někomu bude mnohem lépe vyhovovat jeho funkčnost a jednostranná využitelnost.
Autor: Jan Čech