U današnjem svijetu, manipulacija podacima i analiza postali su ključni dio različitih industrija. Jedan takav zadatak koji se često javlja je pretvaranje riječi u brojeve u skupovima podataka. Ovaj članak će govoriti o tome kako se Pythonova moćna biblioteka, pandas, može koristiti za efikasno obavljanje ovog zadatka. Istražit ćemo korake, kod i koncepte uključene u rješavanje ovog problema, osiguravajući da shvatite proces i da ga lako implementirate.
Za početak, hajde da shvatimo problem koji želimo riješiti. Zamislite da imate skup podataka sa kolonom koja sadrži brojeve napisane riječima, kao što su „jedan“, „dva“, „tri“ itd. Naš cilj je da konvertujemo ove brojeve reči u njihove celobrojne parnjake koristeći Python i pande.
Korak 1: Uvoz potrebnih biblioteka
Da bismo izvršili ovaj zadatak, prvo moramo uvesti potrebne biblioteke. U ovom slučaju, koristit ćemo biblioteku pandas za rukovanje i manipulaciju podacima, i inflect za pretvaranje riječi u brojeve.
import pandas as pd import inflect
pandas biblioteka
pandas je biblioteka otvorenog koda za manipulaciju i analizu podataka koja pruža strukture podataka i funkcije potrebne za rukovanje strukturiranim podacima. Izgrađen je na vrhu programskog jezika Python i igra značajnu ulogu u prethodnoj obradi, čišćenju i analizi podataka. Neke od njegovih glavnih struktura podataka uključuju serije, okvir podataka i indeks, koji pomažu u radu s različitim tipovima podataka i operacijama.
odraziti biblioteku
inflect je Python biblioteka koja pomaže u računanju množine i jednine imenica, rednih brojeva i pretvaranje brojeva u riječi ili riječi u brojeve. U ovom članku ćemo se fokusirati na njegovu sposobnost pretvaranja riječi u brojeve. Da biste koristili inflect, morat ćete ga instalirati pomoću sljedeće naredbe:
!pip install inflect
Korak 2: Kreiranje pandas DataFrame-a
Sada kada smo uvezli potrebne biblioteke, napravimo pandas DataFrame sa kolonom koja sadrži brojeve kao riječi. Ovo će poslužiti kao naš uzorak podataka u svrhu ilustracije.
data = {'Numbers_in_words': ['one', 'two', 'three', 'four', 'five']}
df = pd.DataFrame(data)
print(df)
Korak 3: Pretvaranje riječi u brojeve
Zatim ćemo koristiti biblioteku inflekta za pretvaranje brojeva u riječi u njihove cjelobrojne parnjake. Napravit ćemo funkciju pod nazivom 'convert_word_to_number' koja uzima riječ kao ulaz i vraća odgovarajući broj.
def convert_word_to_number(word):
p = inflect.engine()
try:
return p.singular_noun(word)
except:
return None
df['Numbers'] = df['Numbers_in_words'].apply(convert_word_to_number)
print(df)
U ovom isječku koda definiramo funkciju koja koristi inflect engine za pretvaranje riječi u brojeve. Zatim koristimo metodu pandas apply() da primijenimo ovu funkciju na svaki element stupca 'Numbers_in_words' u DataFrameu.
Da sumiramo, vidjeli smo kako se Python, pandas i inflect mogu koristiti za pretvaranje riječi u brojeve u skupu podataka. Pande služe kao osnovni alat za manipulaciju podacima, dok biblioteka inflekta pomaže u operacijama koje uključuju riječi i brojeve. Prateći ove korake, možete lako pretvoriti brojeve riječi u cijele brojeve u vašim skupovima podataka i dalje analizirati i manipulirati vašim podacima. Sretno kodiranje!