Glavni problem sa raščlanjivanjem e-pošte je taj što to može biti dugotrajan proces. E-pošta je često oblikovana na način koji otežava razumijevanje i može sadržavati velike količine teksta.
import email
msg = email.message_from_string('From: foo@bar.comnSubject: testnntest')
print msg['From']
print msg['Subject']
Ovaj kod uvozi modul e-pošte, koji vam omogućava da analizirate e-poruke. Zatim kreira objekt poruke iz niza i ispisuje zaglavlja „Od“ i „Subject“ iz poruke.
Raščlanjivanje
Parsing u Pythonu je proces pretvaranja niza teksta u strukturu podataka koju Python interpretator može razumjeti. To može uključivati identifikaciju i izdvajanje određenih informacija iz teksta, kao što su pojedinačne riječi ili rečenice.
Python pruža niz ugrađenih parsera za rukovanje različitim tipovima teksta, uključujući regularne izraze i leksičke analizatore. Ovi alati se mogu koristiti za raščlanjivanje nizova u liste stavki, rječnike parova ključ/vrijednost ili druge strukture podataka.
E-pošta je komunikacijski protokol koji se koristi za slanje poruka između računala. E-poruke se sastoje od odjeljka zaglavlja, dijela tijela i odjeljka podnožja. Odeljak zaglavlja sadrži informacije o e-poruci, kao što su adresa e-pošte pošiljaoca i adresa e-pošte primaoca. Dio tijela sadrži samu poruku. Odjeljak podnožja sadrži informacije o e-poruci, kao što je kada je poslana i koliko bajtova ima.