Pandas je široko popularna Python biblioteka koja se koristi u polju analize podataka i manipulacije. Danas je analiza i rad s ogromnim količinama podataka važniji nego ikad, a Pandas igra ključnu ulogu u obezbjeđivanju potrebnih alata za ovu svrhu. Jedan od značajnih zadataka koji se često obavljaju tokom analize podataka je mogućnost upita za određene informacije i vraćanja kolone na osnovu određenih uslova. U ovom članku ćemo raspravljati o tome kako doći do takvih rezultata koristeći moćnu Pandas biblioteku zajedno sa detaljnim objašnjenjem koda, funkcija i potrebnih biblioteka.
Preduvjeti: Instalacija Panda
Prije nego što uđete u rješenje, morate imati instalirane Pande na vašem sistemu. U slučaju da nemate već instaliran Pandas, možete koristiti sljedeću naredbu da ga instalirate preko Pythonovog upravitelja paketa, pip:
pip install pandas
Nakon što uspješno instalirate Pandas, nastavite da ga uvezete u svoju Python skriptu koristeći:
import pandas as pd
Sada kada smo instalirali Pande i uvezli ih u našu skriptu, pređimo na rješavanje problema.
Rešenje problema: postavljanje upita za DataFrame i vraćanje kolone
Pod pretpostavkom da imamo DataFrame i da moramo da upitamo specifične informacije na osnovu određenih uslova, na primer, pronalaženje kolone pod nazivom „starost“ u kojoj su vrednosti veće od datog broja. To možemo postići koristeći Pandas' upit () funkcija.
Hajde da prvo napravimo uzorak DataFrame sa nekim podacima u svrhu demonstracije:
data = {
"Name": ["Alice", "Bob", "Charlie", "David", "Eve"],
"Age": [25, 32, 29, 41, 38],
"City": ["New York", "San Francisco", "Los Angeles", "Chicago", "Miami"]
}
df = pd.DataFrame(data)
Objašnjenje korak po korak: Rad s Pandas funkcijom upita
Sada kada smo kreirali uzorak DataFrame, hajde da razložimo korake za upit i vraćanje potrebnih podataka:
1. Koristiti upit () funkcija za filtriranje DataFrame-a na osnovu uvjeta:
age_filter = df.query('Age > 30')
The upit () funkcija prihvata string koji sadrži uslov, ovdje 'Age > 30', da u skladu s tim filtrira DataFrame.
2. Da biste vratili samo kolonu 'Starost' filtriranog okvira podataka, koristite:
result = age_filter['Age']
3. Na kraju, odštampajte rezultat:
print(result)
Druge slične funkcije i biblioteke vredne pažnje
Osim upit () funkcija, postoje i druge slične alternative dostupne u Pandas, poput lok [] i iloc[] funkcije, koje mogu služiti istoj svrsi filtriranja i preuzimanja podataka. Izbor funkcije zavisi od složenosti problema i jednostavnosti koda.
Štaviše, Pandas je često uparen sa drugim bibliotekama kako bi se dalje poboljšale mogućnosti analize podataka. numpy je biblioteka za numeričke operacije, koja koristi optimizaciju performansi Panda. Paralelno, matplotlib biblioteka pomaže u stvaranju uvjerljivih vizualizacija podataka, što korisnicima olakšava razumijevanje obrazaca podataka.
U zaključku, Pandas biblioteka služi kao osnovni alat u analizi i filtriranju podataka, u kombinaciji sa drugim bitnim bibliotekama kao što su NumPy i Matplotlib, kako bi se obezbedile fleksibilne i efikasne tehnike manipulacije podacima.