Explorativní datová analýza a statistika jedné proměnné  31. března 2021

Materiály

Nejste účastníkem kurzu
Pro zápis do kurzu se nejprve přihlašte a následně použijte tlačítko v přehledu kurzu.

Domácí projekty

0.

Odkaz na tvůj notebook na DeepNote a případné poznámky:

1.

Pomocí stejného postupu jako v hodině načti data z Mošnova (data viz template na DeepNote).

2.

Vytvoř graf, který porovná vývoj ročních úhrnů srážek (tj. vždy suma srážek za daný rok) v jednotlivých stanicích.

3.

Zjisti, ve které z těchto stanic byl nejteplejší den (nejvyšší maximální teplota) v roce 2010 a který to byl.

4.

Podnikavý zemědělec by rád začal pěstovat novou plodinu, která ale v daném roce plodí jen pokud je splněno: - maximálně 30 % dní klesne minimální denní teplota pod nulu, - alespoň 40 % dní svítí slunce více než pět hodin, - průměrná vlhkost za celý rok je větší než 75 %.

Doporučila bys na pěstování této plodiny na základě počtu let v historii, ve kterých byly tyto podmínky splněny, Ruzyni nebo Mošnov? Jak velkou pravděpodobnost má zemědělec, že mu další rok bude tato nová plodina plodit?

5.

Uložila sis data z Ruzyně do souboru ruzyne_tidy.csv. Jenže nějaký diskový šotek do některých řádků vložil chybu: Ve sloupci tlak vzduchu je hodnota vlhkosti. Data se sice už zachránit nepodaří, nicméně bude dobré chybu napravit alespoň označeních chybných dat jako NA. Pro kolegu, který bohužel s chybějícími daty pracovat neumí, bude navíc potřeba připravit ještě jeden csv soubor, který bude obsahovat alespoň nějaké rozumné hodnoty. Data viz template na DeepNote.

Poslední dva úkoly prověří pravdivost známých pranostik. Stačí, když splníš jeden z nich:

6.

Jak často přijíždí Svatý Martin na bílém koni do Mošnova? Jaké je procento svátků Sv. Martina (11. 11.), kdy byla celková výška sněhu větší než 0?

7.

Který z ledových mužů je nejmrazivější? Pankrác (12. 5.), Servác (13. 5.) nebo Bonifác (14. 5.)? Zjisti to porovnáním mediánů minimálních teplot těchto dní.