Pandas je široko korišćena Python biblioteka za manipulaciju i analizu podataka, i iloc je ključna funkcija unutar biblioteke koja omogućava korisnicima da biraju i manipuliraju podacima indeksiranjem baziranim na cijelim brojevima. Ovo može biti posebno korisno kada radite s velikim skupovima podataka. U ovom članku ćemo istražiti upotrebu pandas iloc u različitim scenarijima i objasnite kako funkcija radi korak po korak kako biste lakše razumjeli njen značaj i potencijalne primjene u analizi podataka.
pandas iloc: Rješenje uobičajenog problema
Uobičajeni izazov sa kojim se suočavaju analitičari podataka je kako efikasno odabrati i analizirati određene dijelove svog skupa podataka. Objekt DataFrame u pandama nudi mnoge odlične metode za rješavanje ovih izazova, a jedna od najsvestranijih i najmoćnijih funkcija je iloc indexer. Omogućava korisnicima da pristupe redovima i stupcima DataFrame-a na osnovu indeksiranja baziranog na cijelim brojevima.
Počnimo s raspravom o objašnjenju korak po korak kako koristiti iloc u scenariju praktične analize podataka.
Korak po korak objašnjenje Pandas iloc-a
Korištenje pandas iloc-a je jednostavno i intuitivno. Pretpostavimo da imamo sljedeći DataFrame:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Cathy', 'David'], 'Age': [25, 29, 21, 35], 'City': ['New York', 'San Francisco', 'Los Angeles', 'Boston']} df = pd.DataFrame(data)
Naš DataFrame ima 4 reda i 3 kolone. Da biste koristili iloc, morate dati indekse za redove i stupce kojima želite pristupiti. Evo nekoliko primjera:
1. Pristup određenom redu i koloni:
# Access row 2 (index 1) and column 'Name' (index 0) selected_data = df.iloc[1, 0] print(selected_data) # Output: Bob
2. Pristup nizu redova i kolona:
# Access rows 1 to 3 (indexes 0 and 1) and columns 'Name' and 'Age' (indexes 0 and 1) selected_data = df.iloc[0:2, 0:2] print(selected_data) # Output: # Name Age # 0 Alice 25 # 1 Bob 29
3. Pristup određenim redovima i kolonama:
# Access rows 1 and 4 (indexes 0 and 3) and columns 'Name' and 'City' (indexes 0 and 2) selected_data = df.iloc[[0, 3], [0, 2]] print(selected_data) # Output: # Name City # 0 Alice New York # 3 David Boston
Biblioteke i zavisnosti
Koristiti pandas iloc, morate imati instaliranu biblioteku pandas, kao i sve druge biblioteke o kojima pande zavise, kao što je NumPy. Možete ih instalirati putem pip ili conda:
pip install pandas numpy
or
conda install pandas numpy
Nakon što su biblioteke instalirane, možete početi koristiti pandas i iloc u svom Python okruženju kao što je prikazano u primjerima iznad.
Druge srodne funkcije i metode indeksiranja
Dodatno iloc, pandas pruža nekoliko drugih funkcija i metoda indeksiranja koje mogu biti korisne u različitim situacijama. Neki od glavnih su:
- mjesto: Ovaj indeksator omogućava korisnicima pristup redovima i kolonama na osnovu indeksiranja zasnovanog na oznakama, umjesto indeksiranja baziranog na cijelim brojevima kao što je iloc.
- na: Koristi se za pristup jednoj vrijednosti na osnovu indeksiranja zasnovanog na oznakama.
- iat: Slično 'at', ali za indeksiranje bazirano na cijelim brojevima. Koristi se za pristup jednoj vrijednosti zasnovanoj na indeksiranju zasnovanom na cijelim brojevima.
Istraživanje ovih funkcija i razumijevanje načina na koji se mogu koristiti u kombinaciji s iloc-om ojačat će vašu sposobnost izvođenja složenih manipulacija podacima pomoću panda.