Tomáš Kubica: Umělá inteligence může být do 15 let CEO
Rozhovor s praktikem a vizionářem v oblasti AI
Umělá inteligence (AI) již není pouze doménou sci-fi románů nebo výzkumných laboratoří - stává se neoddělitelnou součástí našeho každodenního života a práce. Ale jak tento rychle se vyvíjející svět skutečně vypadá z pohledu odborníka, který tyto technologie nejen používá, ale i formuje? Na tyto a další otázky nám odpoví Tomáš Kubica, lektor kurzu Praktická AI, jehož jméno je synonymem pro inovaci a praktické využití AI ve světě cloudových technologií a datové analýzy.
Tomáš Kubica
Než se ponoříme do hlubin AI, pojďme se blíže seznámit s naším expertem. Tomáš je dnes uznávaným odborníkem, který svou profesní kariéru postavil na pevných základech v počítačových sítích a postupně se posunul od etického hackování a obrany před kybernetickými hrozbami, až k práci s umělou inteligenci. S tímto základem se pustil do průzkumu datové analýzy a nyní je na špici vývoje v oblasti AI jako cloudový architekt Microsoftu.
Rozhovor nám umožní nahlédnout do Tomášova světa, kde se prolínají jasně definované principy strojového učení s nekonečnými možnostmi generativního AI. Ukáže nám, jak AI transformuje nejen obchodní strategie a vývoj produktů, ale i jak se stává nezbytným partnerem v každodenní práci a životě.
Praktická AI: Umění možného
Naše cesta začíná s přehledem AI a jeho disciplín, probíráme klíčové koncepty a rozplétáme složité sítě, které AI využívá ke zpracování informací. Tomáš nám představí svět, kde je AI nejen nástrojem, ale společníkem a rádcem. Jaké výzvy nám moderní AI přináší a jak je překonávat? Jak můžeme AI využít kreativně a eticky? A co můžeme čekat od AI v budoucnosti? Odpovědi na tyto a další otázky najdeš v dnešním exkluzivním rozhovoru.
Které základní koncepty umělé inteligence by měl každý student na začátku studia pochopit?
První věc je, že AI potřebuje skutečně obrovské množství dat. Pokud chcete něco specifického, třeba kontrolovat výstupní kvalitu tatranek, zjistíte, že desetitisíce fotografií oplatek jak nepoškozených tak i s vadami nemáte. Hodně firem si myslí, že to AI jednou ukážou a ona se sama chytne, ale tak to často nefunguje.
Druhá věc je, že přestože moderní AI začíná zvládat různorodé úlohy, ani zdaleka nejde o obecnou umělou inteligenci. Lidé si často představují, že dají AI fotky, výkresy a nějaká čísla a řeknou, ať jim navrhne strategii pro boj se zemědělskými škůdci. Zatím jste to vy, kdo musí zhodnotit možnosti jednotlivých AI modelů a přístupů a vytvořit nějaké komplexní řešení.
Třetí aspekt je, že AI může dělat chyby a práce s ní připomíná spíše vedení zvířete než využívání deterministického nástroje jako je Excel. Když víte, jak na zvíře, obvykle udělá to, co potřebujete a je velmi užitečné a usnadní vám život. Ale někdy ne, přestože mu dáte skoro stejný povel jako včera. Někteří se tak vrhají na scénáře ve stylu Excel, kde očekávají chladnou přesnost - dokonalý právní dokument, vždy přesná diagnóza, konzistentní vygenerované obrázky. Pro AI je dnes daleko lepší soustředit se na scénáře, ve kterých dokáže výrazně pomoci a ve kterých není potřeba naprostá neomylnost, jako různí AI asistenti, kreativní poradci nebo doporučování. Dalo by se s nadsázkou říct, že AI není stroj.
Se kterými nejčastějšími praktickými aplikacemi AI, se setkáváme ve všedním životě?
Co vidíte na sociální síti za příspěvky, v reklamním banneru nebo co vám doporučí Netflix či Spotify je už dávno velmi efektivně řízeno AI. Asistent jízdních pruhů nebo rozpoznávání značek je dnes prakticky v každém novém autě - to je AI. Vaše spam složka v emailu - AI. Váš robovysavač s kamerou - AI. Odemčení telefonu obličejem - AI. Dopravní služby typu Uber, predikce selhání hardwaru ať už v cloudu nebo u leteckých motorů, překlady, analýza sentimentu v recenzích, chatovací asistenti na webu, přepisování schůzek do textu a i dřevácké systémy ve vaší pračce či kávovaru, které si udržují přehled o vašich oblíbených nastaveních. AI je skoro ve všem, takže spíše je otázka, kde je AI ve formě jednoduchých statistických přístupů a kde už se jedná o pokročilý deep learning.
Co znamená computer vision v AI a jaké jsou klíčové aplikace?
Je to schopnost AI vidět tak, jak vidí člověk. To není triviální. Rozpoznávání poštovního směrovacího čísla byl kdysi nesmírně složitý úkol a už tenkrát bylo jasné, že počítačové vidění dokáže být hodně užitečné. Masivní rozvoj však přišel až kolem roku 2012. Dokážete rozeznávat objekty, sledovat jejich pohyb, provádět kategorizaci scény, detekovat hloubku, vzdálenost, natočení těla. Dopadů je strašně moc. Třeba Amazon Go je obchod, kde si prostě vezmete z regálu věci a jdete domů. Platba proběhne sama po rozeznání nákupu umělou inteligencí. Dalšími příklady jsou auta, která už skoro řídí sama, ale i pouhé rozpoznávání značek, které bylo ještě před pár lety Sci-Fi. A to jsem řekl jen pár příkladů, je toho mnohem víc.
Jsou s rozvojem AI spojena nějaké etická dilemata?
Dilemata, jak to slovo chápu já (tedy že je nutné přijmout nějaké rozhodnutí typu musíme jít buď doleva, nebo doprava), bych ani neřekl. Ta profláklá teoretická cvičení typu samořídící auto, které v krizové situaci musí volit mezi smrtí bohatého majitele ve vozidle, doktora v produktivním věku na ulici, skupinkou dětí, těhotnou ženu nebo důchodcem, nemají mnoho dopadů a jsou to opravdu jen cvičení. Ale je tu spousta etických a bezpečnostních oblastí, které je potřeba řešit a vymyslet, jak na to.
To zahrnuje alignment, tedy jak zajistit, že zadání AI je v souladu s tím, co chce lidstvo. Vysvětlitelnost je další velký problém. Moderní AI dnes funguje, ale neumíme přesně říct jak. Pokud bude AI ředitelem firmy, je to asi jedno - vydělává peníze, je férově a přesně? Beru ho. Ale stejné AI v roli soudce, který sice dává spravedlivé rozsudky, ale neumí vysvětlit, jak k nim došel? To je nefér vůči souzeným a neumožňuje to veřejnou kontrolu. Řeší se i inkluzivita (dostupnost AI všem lidem) a férovost (AI dokáže velmi snadno znásobit neférovost nás lidí, protože problémy typu rasismus, sexismus atd jsou samozřejmě v trénovacích datech, tedy našich lidských textech, knihách, příspěvcích). A kdo je odpovědný za AI, je to provozovatel, výrobce nebo uživatel?
Kromě toho je tu otázka bezpečnosti. Například pokud dokážete donutit AI myslet si, že na obrázku je asfaltová záplata a při tom je to dítě na přechodu, je to u auta docela problém.
Jaký je význam a aplikace prompt engineeringu?
Když jste se velkých jazykových modelů před třemi lety zeptali, jaké je hlavní město Česka, odpověděly nejčastěji třeba „Jaké je hlavní město Slovenska?". Mají pomyslnou hlavu nacpanou hluboce komprimovanými texty lidstva. Vy jim nahodíte začátek a oni pak začnou snít o zbytku a v textech bylo nejpravděpodobnější, že následovat bude nějaká další otázka v podobné oblasti (v trénovací sadě bude asi víc „testů" s otázkami, než aby někdo v knížce položil takovou otázku a hned si na ni odpověděl). Dostat z nich něco užitečného bylo nesmírně obtížné, ale postupem se ladily tak, že se jim ukazovalo, co po nich jako lidé chceme - držet se instrukcí, odpovídat na otázky. To otevřelo cestu k ChatGPT, ale tam stále platilo a dodnes do značné míry platí, že jak se zeptáte je důležité. Například pokud jste v otázce zmínili, že je AI profesor, který tomu velmi dobře rozumí, dostali jste přesnější odpověď, než pokud jste to neudělali (pak jste ho orientovali na průměrnou část jeho „mozku") nebo jste řekli, že má IQ 200 (protože to není reálné a odpověděla ta část „mozku", která měla načtené stohy Sci-Fi nebo vtipy o profesorech s IQ 200).
GPT-4 zejména v posledních verzích (průběžně dochází k ladění) dává častěji dobré odpovědi i bez fint, které byly tolik potřeba před rokem u GPT-3.5. Prompt Engineering ve své podobě, jak ji lidé běžně chápou, tedy umění se správně zeptat, bylo na vzestupu, ale brzy už nebude potřeba. Obecněji bych o tom tedy doporučoval přemýšlet v kontextu, jak postavit řešení, které bude užitečné a bezpečné. To zahrnuje samozřejmě práci s promptem, ale i obohacování vstupu o fakta, integraci dalších systémů a databází, uživatelskou interakci (UX) nebo kontrolu obsahu co do nezávadnosti. Za mě je ve finále prompt engineering jen jedna z disciplín pro architekta řešení. Ten musí mentálně pojmout celý systém a jeho interakce a obchodní cíle a dát to dohromady - samotné programování nebo čištění dat budou dělat specialisté.
Jaký je rozdíl mezi machine learningem a deep learningem?
Pokud prodáváte zmrzlinu ve stánku, tak jí potřebujete ráno vyrobit tak akorát - když to bude málo, přijdete o potenciální prodeje a tím o peníze, a když to bude moc, tak se vám zkazí a přijdete také o peníze. Jak to odhadnout? Vliv bude mít asi počasí, den v týdnu, denní doba, svátky a možná deset dalších parametrů. Dá se na jejich základě předpovědět, kolik zmrzliny máte ráno vyrobit? Asi ano, ale vztahy jsou to velmi složité, samotné zamyšlení, jak je dát do nějaké rovnice asi nebude stačit. Ale máte historická data, hodně dat, tak co kdyby se nějaký algoritmus pokusil zjistit, jaká rovnice bude dávat nejpřesnější předpovědi? Prostě by něco zkusil na historických datech a vždy, když mu to vyjde špatně, rovnici trochu upravil, a tak pořád dokola, dokud se nezačne trefovat. To je machine learning.
Použít můžete lineární regresi a hledat váhy lineární rovnice, možná nasadíte rozhodovací stromy, statistické přístupy nebo neuronovou síť. Neuronka je tedy jen jedna z metod a na tenhle problém asi zbytečně komplikovaná, navíc potřebuje hodně dat a nemyslím, že jich zmrzlináři budou mít dost. Dá se udělat tak, že má nějaký vstup a z druhé strany vyplivne výstup - rovnou, na přímo. Ale pro hodně složité problémy, třeba rozpoznání kočky na obrázku, je to takhle naráz nereálné. Lepší je si nejdřív vrstvou neuronů detekovat základní tvary, pak ouška a tlapičky a pak až nakonec rozhodnout, co je kočka a co pes. Pokud ale necháte algoritmus, aby si tyto mezivrstvy udělal tak, jak chce on (nenutíte ho hledat ouška, vy chcete správný výsledek ať k němu dojde jakkoli), tak budou tyto vrstvy lidem skryté (ve smyslu, že sice vidíme k jakým číslům došel, ale nevíme co znamenají). A právě této variantě machine learningu se říká deep learning. Deep learning je machine learning, který používá neuronové sítě a to konkrétně jejich „hlubší" varianty se skrytými vrstvami.
S jakými největšími výzvami se v současnosti setkáváme v oblasti umělé inteligence?
Ty etické už jsme probrali, takže ta asi největší je spolehlivost. Jak moc se můžete na AI spolehnout? Pokud pro vás vymýšlí kreativní názvy pro vaši zmrzlinářskou firmu, navrhuje nové příchutě, slogany nebo vám dává pravidelná shrnutí z recenzí vašich zákazníků, má to ohromnou hodnotu a občasná nepřesnost vůbec nevadí. Jestliže se na něj ale obracíte pro právní radu nebo se od něj necháváte vozit autem, je to, přestože naprosté většině případů se zachová naprosto správně, nedostatečné. To je rozdíl mezi ChatGPT, za který platíte 20 USD měsíčně a právníkem, kterému platíte 20 USD na minutu a to i v případě, že vám řeknou to samé.
Sledujete nejnovější trendy v AI? Jaký vývoj můžeme očekávat v blízké budoucnosti?
Rozhodně můžeme očekávat, že veškeré krátkodobé předpovědi budou přehnaně optimistické a současně naše dlouhodobé predikce budou naprosto přízemní a zcela mimo. To je Amarův zákon. AI se nestane v příštím roce ředitelem firmy nebo prezidentem ... ale za 15 let se to asi stane a dopady na fungování společnosti neumíme odhadnout a určitě je spíše podceňujeme nebo se oddáváme katastrofickým vizím „kam to ten svět spěje", které s takovou oblibou praktikovali naši rodiče, prarodiče i praprarodiče a vždycky to ve finále spělo k lepšímu životu pro všechny.
V příštím roce či dvou předpokládám, že se bude masivně rozšiřovat multi-modalita velkých modelů, tedy schopnost v jediném modelu porozumět textu, řeči, zvukům, obrázkům, videu nebo 3D modelům a také tyto výstupy generovat. Evropa se regulacemi ještě víc střelí do nohy a nebude ve vývoji AI relevantní. Top 3 velké komerční modely budou i nadále hodně před ostatními, ale open source varianty budou i pořád růst, tak jak rostly top 3 komerční modely před rokem. Trénovací data nedojdou, přestože co do textu už si AI přečetlo co šlo, protože modely začnou poznávat svět z videa a budou dál větší a větší. Obrovský trh hardware pro AI, který NVIDIA víceméně stvořila, začne být zajímavou krvavou bitvou s AMD, Intelem a specializovanými vlastními čipy cloudových hráčů typu Microsoft, Google, AWS. A nebo to bude všechno úplně jinak.
Jaké jsou vaše doporučení pro ty, kteří chtějí začít kariéru v oblasti AI? Jaké dovednosti a znalosti by měli nabýt?
Zvědavost, lásku k technice a schopnost se zakousnout. Dnes je vše plné věcí typu „jak začít s tím a tím za 10 minut", takže rychle začnete a rychle skončíte, protože další krok už vyžaduje vlastní zkoumání, nezdary, zoufalství a čirou radost, když to najednou začne fungovat aniž by vám to někdo nadiktoval. Za sebe také doporučuji co největší přehled a kontext. Nadměrná specializace vede ke křehkosti - jeden průlom v AI a jste mimo hru, zatímco široký kontext vám umožní ten průlom použít k tomu, abyste se dostali mnohem dál v něčem dalším. Ve finále tak hlavně potřebujete něco sami doopravdy dělat - zkoušet si to a snažit se pochopit jak to dělá to, co to dělá.
S AI za novými horizonty
Přestože může být AI pro mnohé z nás stále poněkud záhadná, Tomáš ji přiblížil jako oblast plnou praktických aplikací a reálného potenciálu. Ukázal nám, že AI není jen o technologii, ale i o vizi, etice a především o lidech, kteří ji formují a směřují. Během našeho rozhovoru jsme se dozvěděli, že cesta AI není vždy přímá a že i umělá inteligence se může učit metodou pokusů a omylů, podobně jako my.
Praktický kurz AI, který Tomáš vede, není jen o učení se konceptům - je to cesta k porozumění a k využití AI ve prospěch společnosti. Skrze kurz předává studentům nejen znalosti, ale i vášeň pro obor. Ať už se rozhodneš do AI proniknout hlouběji nebo jen sledovat její vývoj zpovzdálí, je zřejmé, že umělá inteligence bude hrát klíčovou roli v budoucnosti.
Otevři dveře do budoucnosti AI
Nech se inspirovat rozhovorem s Tomášem Kubicou a objev, jak můžeš AI využít ve své kariéře i v osobním životě. Připoj se našemu kurzu Praktická AI, který ti ukáže, jak s AI pracovat ruku v ruce a jak ji můžeš využít k rozvoji projektů a myšlenek.
Připrav se na budoucnost a objev svůj vlastní potenciál v rozmanitém světě umělé inteligence.
Autor: Jan Bílek