Pandas je moćna Python biblioteka za analizu i manipulaciju podataka, koja se široko koristi u različitim domenima, uključujući i svijet mode. Koristeći Pande, modni stručnjaci i programeri mogu uočiti trendove, obrasce i uvide analizirajući skupove podataka koji se odnose na modnu industriju. U ovom članku ćemo se pozabaviti moćnim Pandas funkcijama, značiti i suma, i njihove primjene u analizi modnih podataka.
Ove funkcije mogu biti od velike pomoći u otkrivanju važnih informacija o modnim artiklima kao što su prodaja, trendovi cijena, ocjena proizvoda i još mnogo toga. Izračunavajući srednju vrijednost i zbroj različitih atributa, možemo izvući vrijedne uvide za donošenje informiranih odluka o stajlingu i modnim trendovima.
Rješenje problema
Da demonstrira upotrebu pandi značiti i suma funkcije, pretpostavimo da imamo skup podataka koji sadrži detalje o različitim modnim artiklima kao što su njihov stil, boje, cijena i ocjena. Uvest ćemo ovaj skup podataka u pandas DataFrame i započeti našu analizu koristeći funkcije srednje vrijednosti i sume.
import pandas as pd # Read data from a CSV file and load it into a DataFrame data = pd.read_csv('fashion_items.csv') # Calculate mean and sum of the price column mean_price = data['price'].mean() sum_price = data['price'].sum() print('Mean price:', mean_price) print('Total price:', sum_price)
Korak po korak objašnjenje koda
- Prvo, uvozimo pandas biblioteku sa pseudonimom 'pd'.
- Zatim čitamo podatke iz CSV datoteke pod nazivom 'fashion_items.csv' i učitavamo ih u DataFrame pod nazivom 'data' koristeći funkciju pd.read_csv. Skup podataka sadrži informacije o raznim modnim artiklima.
- Zatim izračunavamo srednju cijenu svih modnih artikala koristeći funkciju mean() primijenjenu na stupac 'price' u DataFrameu. Ova vrijednost je pohranjena u varijablu pod nazivom 'mean_price'.
- Slično tome, izračunavamo ukupnu cijenu svih modnih artikala pozivanjem funkcije sum() u stupcu 'price'. Ova vrijednost je pohranjena u varijablu pod nazivom 'sum_price'.
- Na kraju ispisujemo izračunate srednje i ukupne cijene modnih artikala.
Povezane biblioteke i funkcije u Pandas
Postoji mnoštvo biblioteka i funkcija koje dopunjuju upotrebu panda za analizu podataka u modnoj industriji. Osim toga, neke od ovih korisnih funkcija značiti i suma uključuju:
Pandas groupby funkcija
The groupby funkcija je posebno korisna za agregiranje podataka na osnovu specifičnih stupaca. Na primjer, ako želimo analizirati srednju i ukupnu cijenu modnih artikala za svaki stil prisutan u našem skupu podataka.
# Group data by style and calculate mean and sum of the price grouped_data = data.groupby('style')['price'].agg(['mean', 'sum']) print(grouped_data)
Pandas funkcija spajanja
The spojiti funkcija nam omogućava da kombinujemo dva okvira podataka na osnovu zajedničke kolone. Na primjer, pretpostavimo da imamo zaseban skup podataka koji sadrži informacije o popularnosti svakog stila. Spajanjem oba okvira podataka možemo transformisati ove informacije u vrijedne uvide.
# Import data related to style popularity style_popularity_data = pd.read_csv('style_popularity.csv') # Merge the original data and style_popularity_data based on the 'style' column merged_data = pd.merge(data, style_popularity_data, on='style') print(merged_data.head())
Razumijevanjem i implementacijom ovih moćnih funkcija u Pandas biblioteci, modni stručnjaci i programeri mogu donositi informirane odluke i s lakoćom analizirati najnovije trendove i stilove.