Python for Data Processing and Analysis
[Materiały do zajęć]
Wymagane oprogramowanie
- Python 3.7+ Sugerowana dystrybucja: Anaconda (zawiera większość pakietów i narzędzi, z których będziemy korzystać, w tym np. Jupyter Notebook, Spyder)
Literatura
- Gagolewski M., Bartoszuk M., Cena A., Przetwarzanie i analiza danych w języku Python, Wydawnictwo Naukowe PWN, Warszawa, 2016
- McKinney W., Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython, O’Reilly Media, 2012
- Richert W., Coelho L.P., Building Machine Learning Systems with Python, Packt Publishing, 2013
- Lutz M., Learning Python, O’Reilly Media, 2013
- Bressert E., SciPy and NumPy, O’Reilly Media, 2012
- VanderPlas J., Python Data Science Handbook: Essential Tools for Working with Data, O’Reilly, 2016
Harmonogram
Zajęcia 1
Wykład
- Wprowadzenie: praca z notatnikami Jupyter, Markdown.
- Wprwadzenie do języka Python.
- Typy skalarne w Pythonie.
Laboratoria
- Wybranego środowiska programistycznego np. Spyder, VisualCode, Pycharm.
- Python — podstawy.
- Wybrane zadania z listy nr 1.
Zajęcia 2
Wykład
- Typy sekwencyjne.
- Zarządzanie elementami
- Obiekty iterowalne.
- Pętle
Laboratoria
- Lista zadań nr 2.
Zajęcia 3
Wykład
- Słowniki i zbiory.
- Funkcje.
Laboratoria
- Lista zadań nr 3 (funkcje) – cz. 1
Zajęcia 4
Wykład
- Obiektowość w języku Python..
Laboratoria
- Lista zadań nr 3 (funkcje) – cz. 2
Zajęcia 5
Wykład
- Wyjątki
raise Exception(" ... ")
– hierarchia wyjątków,assert
. - Podstawowe polecenia w powłoce (bash)
- Skrypty, moduły, pakiety.
Laboratoria
- Lista zadań nr 4 (obiektowe)
Zajęcia 6
NumP
y.
Laboratoria
- Lista zadań nr 5 (
Numpy
) – cz. I
Zajęcia 7
Wykład
Pandas
czyli ramki danych i operacje na nich.
Laboratoria
- Lista zadań nr 5 (
Numpy
) – cz. II Numpy
(cz. II) +Pandas
(cz. I)
Zajęcia 8
Wykład
Pandas
– cz. II.SQL
Laboratoria
Pandas
+SQL
(cz. I)- Lista zadań nr 6 (
Pandas
) – cz. I
Zajęcia 9
Wykład
- Wizualizacja danych (
matplotlib, seaborn, pandas
).
Laboratoria
Pandas
+SQL
(cz. II)- Lista zadań nr 6 (
Pandas
) – cz. II
Zajęcia 10
Wykład
- Przetwarzanie danych tekstowych (
string, re, pandas.str
)
Laboratoria
- Lista zadań nr 7 (grafika)
Zajęcia 11
Wykład
- Przetwarzanie plików.
- Web scraping.
Laboratoria
- Lista zadań nr 8 (text) – cz. I
Zajęcia 12
Wykład
- Wnioskowanie statystyczne (porównanie
R
iPython
).
Laboratoria
- Lista zadań nr 8 (text) – cz. II
Zajęcia 13
Wykład
- Wybrane algorytmy uczenia maszynowego — analiza regresji;
Laboratoria
- Lista zadań nr 10 (stat+ML)
Zajęcia 14
Wykład
- Wybrane algorytmy uczenia maszynowego:
- klasyfikacja;
- analiza skupień;
Laboratoria
Oddawanie PD3
Zajęcia 15
Wykład
- Inne zastosowania, Cython.
Laboratoria
Oddawanie PD3