Przetwarzanie i analiza danych w języku Python

Python for Data Processing and Analysis

[Materiały do zajęć]

Wymagane oprogramowanie

  • Python 3.7+ Sugerowana dystrybucja: Anaconda (zawiera większość pakietów i narzędzi, z których będziemy korzystać, w tym np. Jupyter Notebook, Spyder)

Literatura

  1. Gagolewski M., Bartoszuk M., Cena A., Przetwarzanie i analiza danych w języku Python, Wydawnictwo Naukowe PWN, Warszawa, 2016
  2. McKinney W., Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython, O’Reilly Media, 2012
  3. Richert W., Coelho L.P., Building Machine Learning Systems with Python, Packt Publishing, 2013
  4. Lutz M., Learning Python, O’Reilly Media, 2013
  5. Bressert E., SciPy and NumPy, O’Reilly Media, 2012
  6. VanderPlas J., Python Data Science Handbook: Essential Tools for Working with Data, O’Reilly, 2016

Harmonogram

Zajęcia 1

Wykład

  1. Wprowadzenie: praca z notatnikami Jupyter, Markdown.
  2. Wprwadzenie do języka Python.
  3. Typy skalarne w Pythonie.

Laboratoria

  1. Wybranego środowiska programistycznego np. Spyder, VisualCode, Pycharm.
  2. Python — podstawy.
  3. Wybrane zadania z listy nr 1.
Zajęcia 2

Wykład

  1. Typy sekwencyjne.
  2. Zarządzanie elementami
  3. Obiekty iterowalne.
  4. Pętle

Laboratoria

  1. Lista zadań nr 2.
Zajęcia 3

Wykład

  1. Słowniki i zbiory.
  2. Funkcje.

Laboratoria

  1. Lista zadań nr 3 (funkcje) – cz. 1
Zajęcia 4

Wykład

  1. Obiektowość w języku Python..

Laboratoria

  1. Lista zadań nr 3 (funkcje) – cz. 2
Zajęcia 5

Wykład

  1. Wyjątki raise Exception(" ... ") – hierarchia wyjątków, assert.
  2. Podstawowe polecenia w powłoce (bash)
  3. Skrypty, moduły, pakiety.

Laboratoria

  1. Lista zadań nr 4 (obiektowe)
Zajęcia 6
  1. NumPy.

Laboratoria

  1. Lista zadań nr 5 (Numpy) – cz. I
Zajęcia 7

Wykład

  1. Pandas czyli ramki danych i operacje na nich.

Laboratoria

  1. Lista zadań nr 5 (Numpy) – cz. II
  2. Numpy (cz. II) + Pandas (cz. I)
Zajęcia 8

Wykład

  1. Pandas – cz. II.
  2. SQL

Laboratoria

  1. Pandas + SQL (cz. I)
  2. Lista zadań nr 6 (Pandas) – cz. I
Zajęcia 9

Wykład

  1. Wizualizacja danych (matplotlib, seaborn, pandas).

Laboratoria

  1. Pandas + SQL (cz. II)
  2. Lista zadań nr 6 (Pandas) – cz. II
Zajęcia 10

Wykład

  1. Przetwarzanie danych tekstowych (string, re, pandas.str)

Laboratoria

  1. Lista zadań nr 7 (grafika)
Zajęcia 11

Wykład

  1. Przetwarzanie plików.
  2. Web scraping.

Laboratoria

  1. Lista zadań nr 8 (text) – cz. I
Zajęcia 12

Wykład

  1. Wnioskowanie statystyczne (porównanie R i Python).

Laboratoria

  1. Lista zadań nr 8 (text) – cz. II
Zajęcia 13

Wykład

  1. Wybrane algorytmy uczenia maszynowego — analiza regresji;

Laboratoria

  1. Lista zadań nr 10 (stat+ML)
Zajęcia 14

Wykład

  1. Wybrane algorytmy uczenia maszynowego:
  • klasyfikacja;
  • analiza skupień;

Laboratoria

Oddawanie PD3

Zajęcia 15

Wykład

  1. Inne zastosowania, Cython.

Laboratoria

Oddawanie PD3