Cykl: Wprowadzenie do analizy danych z wykorzystaniem Pythona · Część 3/5

Python: Praca z danymi

Kacper Sieradziński9 grudnia 2024 · 2 min czytania

Streszczenie

→ Dlaczego Python?
→ pandas - Manipulacja i Analiza Danych
→ Korzyści płynące z używania pandas
→ Przykład zastosowania pandas

Czy kiedykolwiek zastanawiałeś się, jak ułatwić sobie pracę z dużymi zbiorami danych? Python to język programowania, który dzięki szerokiemu wachlarzowi bibliotek, takich jak pandas, NumPy czy matplotlib, stał się nieocenionym narzędziem w analizie danych. W tym artykule dowiesz się, jak efektywnie wykorzystać te biblioteki do przetwarzania, analizy i wizualizacji danych.

Kurs · 24 lekcje8h 14m

Kurs

Kurs Python od podstaw — PyStart

Zacznij programować w Pythonie od zera. Praktyczny kurs wideo z ćwiczeniami — bez wcześniejszego doświadczenia.

✓24 lekcje wideo + 80 ćwiczeń
✓Realne bazy z e-commerce
✓Społeczność i code-review

699 zł

Zacznij kurs Pythona

Dlaczego Python?

Python zdobył popularność w świecie analizy danych dzięki swojej prostocie, elastyczności i ogromnej społeczności, która nieustannie rozwija i optymalizuje nowe narzędzia. Dla analityków danych i naukowców kluczowe jest posiadanie narzędzi, które pozwolą na szybkie i intuicyjne przetwarzanie danych. Tutaj wkracza trio: pandas, NumPy i matplotlib.

pandas - Manipulacja i Analiza Danych

Korzyści płynące z używania pandas

Pandas to biblioteka, która jest podstawowym narzędziem do manipulacji danych w Pythonie. Umożliwia pracę z rozbudowanymi zestawami danych, które można filtrować, sortować i przetwarzać. Oferuje szeroką gamę funkcji, które pozwalają użytkownikom na:

Łatwe ładowanie danych: Pandas wspiera różne formaty danych, w tym CSV, Excel, SQL i inne.
Przetwarzanie dużych zbiorów danych: Dzięki DataFrames i Series praca z tabelami danych staje się intuicyjna.
Czyszczenie danych: Funkcje takie jak dropna(), fillna() czy replace() pomagają w usuwaniu braków danych i normalizacji zbiorów.

Przykład zastosowania pandas

Załóżmy, że chcemy zaimportować dane ze zbioru CSV i przeprowadzić podstawową analizę:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import pandas as pd

# Wczytanie danych z pliku CSV
data = pd.read_csv('dane.csv')

# Wyświetlenie podstawowych informacji o zbiorze danych
print(data.info())

# Filtrowanie danych
filtered_data = data[data['wiek'] > 30]

# Agregacja danych
mean_income = filtered_data['dochód'].mean()
print(f'Średni dochód: {mean_income}')

NumPy - Wydajność i Prędkość

Kurs · 24 lekcje8h 14m

Kurs

Kurs SkumajBazy — Czas w końcu nauczyć się SQLa

Kompleksowy kurs SQL dla programistów, analityków i wszystkich, którzy chcą efektywnie pracować z danymi. Od podstaw do zaawansowanych zapytań.

✓24 lekcje wideo + 80 ćwiczeń
✓Realne bazy z e-commerce
✓Społeczność i code-review

599 zł

Zapisz się na kurs

Moc obliczeniowa z NumPy

NumPy to biblioteka zapewniająca wsparcie dla operacji na wielkich zestawach danych liczbowych poprzez tzw. tablice n-dimensional (arrays). Dzięki NumPy możemy wykonywać skomplikowane obliczenia w sposób bardzo szybki i wydajny, co jest kluczowe przy pracy z big data.

Przykład użycia NumPy

NumPy umożliwia szybkie operacje matematyczne, co można zobaczyć na poniższym przykładzie:

Python
1
2
3
4
5
6
7
8
import numpy as np

# Tworzenie tablicy NumPy
array = np.array([1, 2, 3, 4, 5])

# Operacje matematyczne
squared_array = array ** 2
print(squared_array)

matplotlib - Wizualizacja Danych

Potęga wizualizacji

Matplotlib to biblioteka do wizualizacji, która pozwala na tworzenie wykresów i diagramów. Jest idealna do prezentowania wyników analizy danych, co ułatwia ich zrozumienie i interpretację.

Przykład użycia matplotlib

Poniższy przykład pokazuje, jak stworzyć prosty wykres liniowy:

Python
1
2
3
4
5
6
7
8
9
10
11
12
import matplotlib.pyplot as plt

# Przykładowe dane
x = np.linspace(0, 10, 100)
y = np.sin(x)

# Tworzenie wykresu
plt.plot(x, y)
plt.title('Wykres funkcji sinus')
plt.xlabel('x')
plt.ylabel('sin(x)')
plt.show()

Integracja Wszystkich Trzech Narzędzi

Kurs · 24 lekcje8h 14m

Kurs

Kurs Python dla początkujących — PyStart

Zacznij programować w Pythonie! Idealne dla osób bez doświadczenia. Praktyczne zadania, projekty i wsparcie społeczności.

✓24 lekcje wideo + 80 ćwiczeń
✓Realne bazy z e-commerce
✓Społeczność i code-review

699 zł

Rozpocznij naukę

Często najpotężniejsze rezultaty uzyskuje się poprzez połączenie wszystkich trzech bibliotek. Przykładowo, za pomocą pandas można wczytać dane, z NumPy wykonać skomplikowane obliczenia, a matplotlib użyć do wizualizacji wyników. Dzięki integracji tych narzędzi analiza danych staje się prostsza i bardziej przejrzysta.

Podsumowanie

Python, przy wykorzystaniu bibliotek pandas, NumPy i matplotlib, oferuje wszechstronne środowisko pracy z dużymi zbiorami danych. Od manipulacji danymi, przez szybkie obliczenia numeryczne, po kompleksowe wizualizacje — wszystko to jest możliwe dzięki tym narzędziom. Jeśli chcesz jeszcze bardziej zgłębić ten temat, rozważ zapisanie się do newslettera, aby otrzymywać najnowsze informacje i przykłady z zakresu analizy danych.

Część 4 z 5

Tworzenie wykresów w Pythonie - wprowadzenie do Matplotlib

druga lekcja cyklu „Wprowadzenie do analizy danych z wykorzystaniem Pythona"

Czytaj kolejny →

Python: Praca z danymi

Kurs Python od podstaw — PyStart

Dlaczego Python?

pandas - Manipulacja i Analiza Danych

Korzyści płynące z używania pandas

Przykład zastosowania pandas

NumPy - Wydajność i Prędkość

Kurs SkumajBazy — Czas w końcu nauczyć się SQLa

Moc obliczeniowa z NumPy

Przykład użycia NumPy

matplotlib - Wizualizacja Danych

Potęga wizualizacji

Przykład użycia matplotlib

Integracja Wszystkich Trzech Narzędzi

Kurs Python dla początkujących — PyStart

Podsumowanie

Tworzenie wykresów w Pythonie - wprowadzenie do Matplotlib

Powiązane artykuły

Decyzja OpenAI: treści dla dorosłych w ChatGPT - test dla prawa: AI Act, RODO

Plan wdrożenia AI – krok po kroku

Docker – Kompletny przewodnik dla początkujących i zaawansowanych

Powiązane artykuły

Decyzja OpenAI: treści dla dorosłych w ChatGPT - test dla prawa: AI Act, RODO

Plan wdrożenia AI – krok po kroku

Docker – Kompletny przewodnik dla początkujących i zaawansowanych