import pandas as pd
df = pd.read_csv('city.csv', sep=';')
df
df[ df.CountryCode == 'AFG' ]['Population'].sum()
df.groupby('CountryCode').sum()['Population']
df.groupby('CountryCode').sum()
df.groupby('CountryCode').agg(['min', 'max', 'mean', 'sum', 'count']).head()
df.groupby('CountryCode').agg(['min', 'max', 'mean', 'sum', 'count'])['Population'].head()
df.groupby('CountryCode').agg(['min', 'max', 'mean', 'sum', 'count'])['Population'].reset_index().head()
code_group = df.groupby('CountryCode')
code_group
# for index, value in code_group:
# print(index)
# print(value)
code_group.get_group('AFG')
code_group.describe()['Population']
# Задание 1
# Сгруппировать данные по CountryCode
# получить максимум и минимум по Population
# взять первых 10 результатов
# нормализовать индексы полученного датафрейма
# Задание 2
# Сгруппировать данные по CountryCode
# получить разницу между максимум и минимум по Population
# взять первые 10 результатов
# на выходе получить именно датафрейм (не серию)