Template s úkoly na DeepNote si zduplikuj TADY.
Odkaz na tvůj notebook na DeepNote (nezapomeň změnit práva na "Edit" a přejmenovat soubor):
Použij data z tabulky countries
a spočti korelační koeficienty mezi jednotlivými sloupci. Slovně popiš, které hodnoty tě zaujaly a proč.
Dál pracuj s tabulkou countries
a spočítej průměrnou dobu dožití (life_expectancy
) pro jednotlivé příjmové skupiny (income_groups
) a regiony (world_6region
). (Nápověda: vzpomeň si, jak jsme v minulé hodině analyzovali vztah mezi dvěma kategorickými proměnnými).
Pomocí jedné funkce graficky zobraz vztahy všech dvojic těchto proměnných: life_expectancy
, life_expectancy_male
a life_expectancy_female
v tabulce countries
. Porovnej s korelačními koeficienty a popřemýšlej, proč vycházejí jinak, než by někdo mohl čekat.
Použij data o filmech z minulé hodiny (movies_complete
) a graficky zobraz distribuci příjmů (lifetime_gross
) těchto filmových studií: ['BV', 'WB', 'Par.', 'Uni.', 'Fox', 'Sony', 'DW', 'NL', 'FoxS', 'Col.']. Nápověda - pro filtraci studií použij metodu isin()
viz dokumentace.
Stáhni si tabulku OMdb_mojo_clean.csv
z této adresy a udělej join s finální tabulkou z minulé hodiny. Potom spočítej cross-korelace všech hodnocení ve výsledném datasetu.
Spočtěte korelační koeficient pro oběžnou poloosu a oběžnou dobu a pomocí korelace dokažte, že existuje vztah mezi těmito veličinam.
Poslední úkol je spíše k zamyšlení (nemusíš psát kód): Zjisti, které z TOP 20 filmů z oficiálního žebříčku IMDB nejsou v naší finální tabulce z minulé hodiny. Dokážeš zdůvodnit proč?