Explorativní analýza a statistika jedné proměnné  26. září 2022

Materiály

Nejste účastníkem kurzu
Pro zápis do kurzu se nejprve přihlašte a následně použijte tlačítko v přehledu kurzu.

Domácí projekty

Template s úkoly na DeepNote si zduplikuj TADY.

0.

Odkaz na tvůj notebook na DeepNote a případné poznámky(nezapomeň změnit práva na "Edit" a přejmenovat soubor):

1.

Načti data pro alespoň 3 stanice pomocí funkce load_chmi_excel_files. Pomocí sns.lineplot vykresli rychlost větru v červnu, červenci a srpnu 2021.

Zkuste vypozorovat nějaké rozdíly mezi stanicemi. Poté použijte sns.boxplot nebo px.box a ověřte, jestli jsou vypozorované rozdíly vidět.

2.

Vytvoř graf, který porovná vývoj ročních úhrnů srážek (tj. vždy suma srážek za daný rok - na to se ti bude hodit resample) ve dvou libovolných stanicích.

3.

Zjisti, ve které z těchto stanic byl nejteplejší den (den s nejvyšší maximální teplotou) v roce 2010 a který den to byl.

4.

Podnikavý zemědělec by rád začal pěstovat novou plodinu, která ale v daném roce plodí jen pokud je splněno:

  • maximálně 35 % dní klesne minimální denní teplota pod nulu,
  • alespoň 40 % dní svítí slunce více než pět hodin,
  • průměrná vlhkost vzduchu za celý rok je větší než 70 %.

Doporučila bys na pěstování této plodiny na základě počtu let v historii, ve kterých byly tyto podmínky splněny, Ruzyni nebo Mošnov? Jak velkou pravděpodobnost má zemědělec, že mu další rok bude tato nová plodina plodit?

Tip: Pro řešení úlohy se hodí resample a quantile.

5.

Který z ledových mužů je nejmrazivější? Pankrác (12. 5.), Servác (13. 5.) nebo Bonifác (14. 5.)?

Zjisti to porovnáním mediánů minimálních teplot těchto dní, pro výpočet ale použij pouze dny kdy mrzlo, tj. kdy byla minimální teplota pod nulou.