Postřehy z doktorského studia

Zdárně jsem dokončil doktorské studium Aplikované informatiky na Fakultě informatiky a statistiky VŠE a během posledního měsíce jsem si pro sebe sepisoval zásadní body, které mne během studia potkaly. Rozhodl jsem se je vydat, ať odkáži na všechny výstupy, co se můžou hodit pro praxi. Také bych tímto rád pomohl uchazečům o studium v rozhodnutí, zda do toho vůbec jít. Slibuji, že se určitě dočtete jiné věci než v soupisu od Jindry Mynarze.

Hmatatelné výstupy mého studia

Během sedmiletého studia Ph.D. jsem dokončil poměrně dost věcí:

Co mne potkalo během studia

Ke konci mého magisterského studia jsme s docentem Novotným a podobně smýšlejícími studenty řešili spolupráce komerčních firem s univerzitou, až z toho vzniklo kompetenční centrum Retail Analytics. Oproti očekávání firem jsme nepřinesli tisíce hodin bezplatné práce studentů, ale jasně stanovené projekty a ucelené týmy. Reálně mi nejvíce dalo budování věrnostního programu prodejci vysavačů, přehodnocení segmentace zákazníků u velkého copycentra a zlepšování Business Intelligence pro tvůrce pokladních systémů obrovského maloobchodního řetězce.

Během těchto zkušeností se katedra pod Otovým vedením začala více věnovat podpoře inovací, což přispělo k vzniku podni­katelskému akcelerátoru xPORT.

V té době jsme vytvářeli také startup Farfalia (chvíli také pod názvy Crossdata či Asimplia), kterým jsme chtěli přinést chytřejší způsob zapojení dat do businessu. Namísto změti grafů a čísel jsme automatizovali psaná doporučení, která přímo mířila na zlepšení výkonnosti obchodu. Bohužel nám to ze spousty důvodů nevyšlo. Někdy by se hodilo detailně popsat failstory.

Nečekal bych, že mne studium zavede také do Ruska, kam jsme jeli diskutovat možné partnerství s jednou významnou univerzitou. I tři dny v Moskvě byl dost silným kafem, ke kterým jsem si pořád pouštěl Buty.

Výběr školitele

Přesně podle Marka Twaina jsem nikdy nedopustil, aby škola stála v cestě mému vzdělání. Trajektorii studia si každý kreslí sám.

Zásadním bodem, který studenta provází několik let a mění se jen při velmi vážných situacích, je volba školitele. Nejspíše je to ještě důležitější než volba tématu práce. Jsem rád, že se mi cesty zkřížily s Otou Novotným už během diplomové práce, protože mi byl po celou doktorandskou dobu umožňovatelem, nefungoval jako mikromanažer a poskytoval vždy profesionální konstruktivní zpětnou vazbu.

Měl jsem díky jeho přístupu privilegium odmítnout zapojení do různých výzkumů, na které se doktorandi typicky hodí. Nemusel jsem tak naštěstí analyzovat statistiky přihlášených studentů na univerzitu, a hlavně jsem se nemusel podílet na projektech pro různá ministerstva, což by se mi příčilo.

Protože je v povinných a volitelných předmětech doktorské studium pojato více konzultačně, mohl jsem prakticky všechny předměty pojmout vždy ve vztahu k mému tématu, ať již byla relevance silnější nebo volnější.

Týmový přístup

Na doktoranda čekají ve skříni minimálně dva strašáci: grantové financování výzkumu a obodovaná publikační činnost třešničkovaná časopisy s impakt faktorem.

Univerzity mají dobře propracovaný systém, jak podporovat vědu a výzkum, což však s sebou nese neskutečné formální peklo např. v podobě financování přes interní grantovou soutěž (IGA). Já tyto formality velkých organizací bytostně neumím, takže se hodilo, že jsme velmi brzy dali dohromady tým.

Jednomu týmu jsem se zařekl, že bychom usilovali o článek s impakt faktorem. Chtěli jsme si dopřát (byť neexistující) titul IF před jméno a drželi jsme se jednoho tématu v různých obměnách. Spoiler: povedly se nám dva impaktované časopisy.

Zajímavou problematikou takového virtuálního týmu je nízká motivace, když jedinou fungující incentivou je možné vydání článku, které je minimálně rok v nedohlednu. Projektový management v takovém případě nelze dělat nátlakem. Přišlo mi dost zásadní, aby projekt pořád někdo táhnul, jinak členové při své práci mimo univerzitu, na své disertaci a osobním životě nemusí mít vždy potřebu proaktivně kontrolovat, zda se nečeká na jejich vstup. Oproti byznysu jsou akademické termíny většinou vágní a deadline nikdo nevnímá smrtelně. Měli jsme dlouhé proluky a celkově šlo o proces delší než dlouhý. Asi přirozeně do toho občas padla tvrdá prokrastinace nebo čisté zablokování, že někdo pár týdnů nemůže reagovat či přispět. Pozitivně lze říci, že nám fungovala komunikace přes e-maily, jednu dobu vedení úkolů v Githubu, ale hlavně týmové aktivity: intenzivnější sezení v čajovně a na stejcích. V případě tohoto týmu s Lenkou, Lucií, Zdeňkem a Markem (díky moc, vy čtyři!) bylo skvělé, že každý přinesl do projektu úplně jiný pohled, což je potřeba. A projevilo se to i v pořadí autorů článků.

Výše zmiňované granty IGA v tomto projektu pomohly s financováním vložného na konference a peníze na čaje. Bez nich bychom museli složitěji hledat se svými školiteli školní šuplíky pro jiné financování.

Práce při studiu, studium při práci

Doktorandem naplno nebo pracovat při studiu? Reálně bych si nedokázal představit fungovat pouze studijně, ale takto už jsem to měl od prváku vysoké školy. Neslušně řečeno mi přijde, že naplno fungující doktorandi jsou většinou z úplně jiného světa než lidi, kteří se potkali s praxí. Vždy jsem silně využíval oboustranný náhled na byznys z akademického světa a naopak.

Škola bývá dost flexibilní v nárocích na doktoranda. Jak i uvádí Martin Potančok v testimoniálu, ohledně časů výuky se vždy dalo dobře domluvit.

Financování doktorandů je pořád špatné a nesrovnatelné s odbornou prací mimo univerzitu, i když je pravda, že fakulta se snaží a profesoři umí vždy někde na pozadí najít financování, když určitý výzkum dává smysl. Ale to byste museli sekat jakékoliv články jako cvičky (principem vybli bibli).

Co bych doporučil doktorandům k celému studiu

Měl bych 11 rad dalším uchazečům o doktorské studium:
  1. Výběr tématu, u kterého člověk zůstane i přes opakované pivotování, je naprosto zásadní. Osobně bych nemohl zůstat u něčeho, co by mne pořád nelákalo prozkoumávat do větší hloubky a co zároveň zažívám i prakticky. V tom ohledu jsem se školitelem prodiskutoval téma tak, aby vyhovovalo jemu, ale musel jsem si táhnout já upřesnění, co bude a nebude součástí výzkumu. Profesoři navrhují svá témata, ale berte to spíš jako hrubou oblast, ve které čekají, čeho se aktivně chopíte.
  2. Úvodní rešerše literatury je podstatná již v rámci návrhu projektu ještě před samotným začátkem studia, protože nechcete objevovat kolo.
  3. Pravidelně prohledávat literaturu. Specializované akademické vyhledavače mi většinou nefungovaly dobře, protože jsou příliš složité a při pokročilém vyhledávání zase naopak příliš omezují výběr. Paradoxně jsem tak byl spokojen s Google Scholar a obměnou terminologie, abych se dostal k čerstvé literatuře. Jsem vyznavač přímého a bezplatného přístupu k akademickým výtvorům, což ale nesedí na většinu potřebných článků. Takže veřejně oceňuji Sci-hub jako zázračný zdroj, přes který si můžete rychle identifikovat, zda má nějaký článek vůbec smysl oficiálně získávat. Mimo to má univerzitní knihovna dost rešeršních služeb a seminářů.
  4. Rozmyslet, kterým vědcům v oboru se ozvat a v jaký moment. Až moc pozdě jsem došel k tomu, že není třeba se bát ozvat i velkým autorům o radu nebo komentář.
  5. Najít si svého poradce pro nepříjemné záležitosti: mně takto radil jeden kolega s veškerými formálními akademickými tématy, ve kterých jsem se nevyznal (co jsou to predátorské časopisy, jak dát dohromady interní granty). Naopak jsem se i já snažil radit ostatním v těch částech studia, které pro mne byly pohodové. Vhodným místem na takové seznámení je třeba Applied Informatics PhD Meetup od prof. Svátka.
  6. Nezatracovat na začátku béčkové konference. To jsou takové konference a časopisy, u nichž je velká šance publikovat. Myslím, že přes všechnu pachuť jsou dobré pro první ročník pro oťukání výzkumu a vyladění veškerého procesu reproduktovatelného výzkumu.
  7. Udělat si vlastní plán a nenechat se namočit do jiných náročných aktivit. Už jsem zmiňoval, že univerzita nabízí spoustu příležitostí na účasti ve výzkumech, kde byste zůstali ztraceni a nepomohlo by to nijak vašemu výzkumu. Třeba správně pojaté oponentury článků a prací zaberou velké množství času, a určitě lze půlku z nich odmítnout.
  8. Připravte se na komplikované vztahy mezi částmi univerzity i fakulty. Bohužel nečekejte, že škola funguje jako jeden celek – ani vůči externímu světu, a hlavně ani vůči sobě. Tímto VŠE nehaním, neb tuším, že to je takto všude.
  9. Mějte trpělivost se zamítáním článků a dlouhou dobou reakcí. Procesy peer-reviews trvají sice nepříjemně dlouho (klidně několik měsíců než vůbec získáte reakci, že se bude vašemu přihlášenému článku někdo věnovat), ale při větším množství recenzentů se stávají objektivním pohledem na vaše výstupy.
  10. Využijte možného prodloužení (respektive pozastavení) studia. Berte to jako přirozenou součást procesu. Já jsem během pozastaveného studia udělal největší pokroky na disertační práci.
  11. Zvažte možnosti zahraničních stáží pro zapojení na výzkumných projektech nebo pro soustředění na sepsání monografie. Já jsem to osobně nevyužil, protože jsem si nemohl dovolit na půl roku chybět v domovině, ale mám na to velmi dobré reference.

Co bych doporučil doktorandům ke psaní disertační práce

Zkusil jsem dát dohromady i 9 rad k samotnému psaní práce.
  1. Počítejte s tím, že všechny analýzy budete muset opakovat. Reproduktovatelnost při jakékoliv analýzy dat je naprosto klíčová. Na Courseře je na to kurz Reproducible research pro jazyk R. Vyhraďte si čas na automatizaci načítání, zpracování a výstupů dat. Nejhorší jsou ty momenty, když máte v bitmapě připravený obrázek do článku a potřebujete přejmenovat nějakou legendu. Skriptování v R, Pythonu či jakémkoliv jiném jazyku bych bral jako základ i mimo statistická témata.
  2. Postupy a procesy si zaznamenávejte. Jak během skriptování, tak v průběhu zpracování dat se hodí následovat nějakou zaběhlou metodu. Mně bylo nejbližší využít CRISP-DM. Mimo jiné tvoří tyto systematické postupy dobrou kostru metodiky článků a napojení na IMRAD.
  3. Ideální by bylo mít kompletně veřejné datasety i postupy – např. v Google Colab. Když se mrknete, jak kupř. vypadají codelabs pro TensorFlow, tak byste rádi, aby většina zpracování dat mohla probíhat takto systematicky a sdíleně.
  4. Pište v textovém editoru, který je pro vás pohodlný. Nejsem nerdovský typ, abych mohl psát rovnou v LaTeXu, ale mám rád dobře nasázené dokumenty, takže jsem disertaci psal v LyXu, což je WYSIWYG nádstavba, a k tomu jsem měl BibDesk an organizaci literatury. Podrobněji můžete pročíst třeba podobné doporučení Adama Herouta z brněnského FIT VUT. Ve Wordu bych nepřežil citace ani neustálou kontrolu formátování. Příště bych použil něco cloudového. Bojoval jsem se šablonou práce a mnoha úskalími správného formátování. Jestli chcete mou šablonu disertace pro účely FIS VŠE, napište.
  5. Nastavte si se školitelem správně očekávání ohledně jeho role. Funguje na nějaké univerzitě, že školitel audituje veškeré detaily práce? Osobně jsem nemohl očekávat, že bych měl zkontrolovánu každou větu, ale byl jsem si jist, že školitel projde logické návaznosti a strukturu práce. Nad to už spíše fungoval jako mentor. Takže jsem na pravidelné schůzky chodil se seznamem témat a otázek, kde jsem potřeboval slyšet jeho názor nebo podporu určitého směrování.
  6. Sestavte a udržujte minimální kostru práce. Čím dál v procesu psaní disertace jsem více a více prioritizoval, co je naprosto zásadní (vůči domluvenému projektu, vůči cílům práce), kterou kapitolu bych mohl zredukovat na jeden odstavec a v jakém případě bych mohl i ten odstavec vypustit.
  7. Ptejte se často na zpětnou vazbu. Přes kamarády z oboru a kontakty ze sociálních sítí jsem se několikrát ujišťoval, že nějaký směr výzkumu by vůbec mohl padnout na ornou půdu. Ke konci psaní mi tyto kontakty hodně pomohly s kontrolou jazykové úrovně, srozumitelnosti a čitelnosti. Ne­oddalujte sepisování výstupů pro Den doktorandů a jiné možnosti získat průběžnou zpětnou vazbu od akademické obce.
  8. Hlídejte si průběžně formální a jazykovou úroveň dokumentu. Přes LyX jsem měl citace v pořádku od začátku a nemusel jsem vymýšlet nějaké zástupné symboly. Velkou část mé angličtiny mi ohlídal textový editor, něco automatizovaná kontrola v Google Docs, ale největší přínos mi nabídla služby Grammarly (zde bez affiliate linku), která mne upozornila na spoustu divně napsaných vět.
  9. Pište v angličtině. Neochuzujte vědecký svět o svá poznání jen tím, že omezíte své výstupy na rodný jazyk.

Co bylo dobré na celém studiu

Studium má mnoho různých součástí a nejste vedeni za kreditovou ručičku, jako v případě bakalářského či magisterského studia. Seznam povinností doktoranda se zdá jistě být dost rozsáhlý, ale ten mix mi dává dohromady smysl. Že je následující pokračování seznamu příliš krátké není třeba vnímat špatně.

Velkým benefitem doktorského studia je utvrzení ve vědeckých metodách: je důležité přesně stanovit, proč a jak se bude výzkum dělat. Nemůžete si jen tak sepsat určitý závěr, pokud není podložen hodnotnými referencemi nebo silným primárním výzkumem.

Opět potvrdím štěstí na školitele, když uvedu, jak se mi pozdávalo, že přímo vedoucí katedry rozvíjí kompetenční centra pro spolupráci s praxí a podnikatelský akcelerátor Xport pro vznik globálních startupů.

Povinné a volitelné předměty fungující spíše přes individuální konzultace jsou skvělou možností dostat se k profesorům na zajímavé konzultace. Vždy se mi podařilo ohnout obsah předmětu (např. seminárních prací) ke svému tématu.

Co by mohlo být děláno lépe

Rád bych podle slibu přispěl k upevňování vážnosti a dobrého jména univerzity a fakulty, takže zkusím sepsat i oblasti, které jsem nepobíral zcela dobře. Protože jsem studium musel mít vedle práce a rozvíjení rodiny většinu času na hodně vedlejší větvi, neměl jsem aktivní život na kampusu a uvědomuji si, že možná hledám výtky, které jsou dávno vyřešené a třebas jsem o nich jen nevěděl.
  1. Jaká je koncepce katedry a fakulty? Čím chce být KIT VŠE nebo FIS VŠE vyhlášené? Asi nikdy jsem neslyšel vizi a ambice těchto organizací. O­ficiální profilování je příliš vágní. Jako doktorand jsem byl myslím příliš malý pán, abych měl šanci do toho mluvit. Informatika je příliš dynamický obor a výzkum by měl být orientován raději na plus pět let než dohánění mínus pěti let; což potřebuje strategický leadership.
  2. Je v pořádku, že každý akademický pracovník vede svou linku, nebo by mělo být méně témat, kterými katedra žije a táhne je dopředu ve větších týmech a partičkách? Ucelenost výzkumu jsem vnímal více u jiných kateder (např. KIZI má jasnější linku stále řešit téma jako GUHA, webové ontologie apod.). Možná to souvisí i s komunikací a PR těchto témat – úplně mimo jsem třeba dobře vnímal, jak se Michal Pěchouček snaží na ČVUT rozvíjet umělou inteligenci. Když si třeba otevřete stránku Artifical Intelligence Center, tak to je prostě nabušená výzva studentům, doktorandům a dalším, aby se zapojili do super témat!
  3. Atribuci mezifakultního a meziškolního výzkumu jsem vnímal jako složitou zejména vzhledem k financování, takže jsem se ani nepokoušel aktivně spolupracovat s někým z jiné univerzity. A to si myslím, že je špatně. Subjektivně vnímám články autorů z více univerzit jako robustnější.
  4. Tlačit na mezinárodní rovinu výzkumu. Podle mne má smysl, aby více děl bylo primárně mezinárodních, pokud chce univerzita hrát významnou roli. Vyzývání (challenging) studentů k řešení globálních témat je jistě první priorita. Aktivní navazování mezinárodních kontaktů je na to další dílek skládanky. Mně tento typ aktivit náhodou navedl na WU Wien na CLV workshop s Peterem Faderem a Brucem Hardiem, tedy největšími kapacitami v mém oboru, kteří nakonec sepisovali i externí posudky na mou disertační práci (toť zároveň má třetí doporučená priorita v této oblasti).
  5. Chápu, že je extrémně těžké udržet lidi na fakultě, aby fungovali proaktivně na rozvoji fakulty a zároveň měli zkušenosti a kredibilitu z praxe. Má být mladý nadějný vědec svázán jen ke katedře, nebo má být katedra plná hybridních úvazků profesionálů, co se občas na kampusu zastaví?
  6. Týmový výzkum je rozhodně přínosná forma aktivní práce, avšak v rámci doktorského studia se silně bije s potřebami jednotlivce, kdy v našich podmínkách je disertační práce solitérské dílo. Zároveň si sebemrskačsky uvědomuji, že někteří autoři píší pouze s někým.
  7. Starost o student experience (obdoba zaběhlého oboru customer experience). Podobně jako jsem já v průběhu studia měl tolik divností a neznámých a pokud bych neměl na telefonu pár známých, tápal bych a bál se zaťukat na dveře studijní referentky. Myslím, že spoustě pracovníků univerzity je zcela jedno, co a jak prožívá student na magisterském či doktorském stupni a neberou je jako své zákazníky. Úplně v posledním tažení pro mne takovou zvláštností byla kauza chlebíčky. Je totiž zvykem, že na hlavní obhajobu disertační práce donáší doktorand pohoštění. Přes 38 tisíc zobrazení mého tweetu je však důkazem, že se zde narazilo na dost velké nepochopení, že má jít o poděkování akademické obci, které nesnižuje důstojnost studenta.

Jak budu pokračovat

Titul pro mne teď naštěstí neznamená žádnou okamžitou změnu. Vizitky ani podpis v e-mailu si neměním. V práci už mi doktore říkali, a to je spíše chci odnaučit.

Fakulta projevila zájem o další spolupráci. Vzhle­dem k mé zajímavé práci v Google a početným rodinným závazkům nechci intenzivně učit, ani řešit vědeckovýzkumnou činnost navíc. Akademikem naplno tedy nikoliv. Chci však rozvíjet svou dosavadní mezidisciplinární cestu na využití IT prostředků pro analýzu zákaznické báze zejména pro marketingové účely. V tom si věřím, že mám dost postupů, které markeťáci ani šéfové firem neznají, případně znalí analytici neumí jejich přínos vysvětlit a zrealizovat.

Mnohokrát okolo mne zazněla potřeba sepsat knihu. Asi aby se s ní dávalo mávat na konferencích řka „I wrote The Book“. To ještě promyslím.

1 komentář u „Postřehy z doktorského studia

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *