Pojďme si procvičit nabyté znalosti analýzou dat o zpoždění vlaků ve Francii. Data najdete zde, podrobnosti k datasetu najdete na Githubu.
Následující úkoly jsou spíše doporučení. Pokud bys k analýze přistupovala jinak, směle do toho! Klidně k řešení napiš poznámku, o co se snažíš a s čím případně potřebuješ pomoci, a kouč ti poradí. Zkus si u jednotlivých úkolů procvičit také grafy :)
V kterém roce/měsíci bylo nejvíc zrušených vlaků?
Která stanice je „nejhorší“? Např. dle počtu zrušených vlaků, největšího zpoždění na odjezdu apod.? Pozor, pro některé stanice jsou data jen z roku 2018.
Na které trati je průměrně největší zpoždění?
Zkus zjistit, jestli je nějaká závislost na roční době – např. zda je v zimě více zpoždění než v létě, které měsíce jsou nejrizikovější z hlediska zpoždění apod.
Cokoli dalšího tě zajímá aneb prostor pro tvé experimenty: Pochlub se funkčním kódem s okomentovaným řešením, případně kouče požádej o radu, pokud něco nefunguje. Pokud ti vyjde nějaký zajímavý graf, pochlub se s ním v kanále #projekty na Slacku!