Glavni problem kod čitanja csv datoteka sa web servera je taj što graničnik koji se koristi u datoteci možda nije isti kao graničnik koji koristi Python. Ovo može dovesti do grešaka pri pokušaju uvoza podataka u Python.
import csv
import urllib2
response = urllib2.urlopen('http://samplecsvs.s3.amazonaws.com/SalesJan2009.csv')
csv_file = csv.reader(response)
for row in csv_file:
print row
Ovaj kod uvozi csv i urllib2 module. Zatim koristi urllib2 da otvori url 'http://samplecsvs.s3.amazonaws.com/SalesJan2009.csv'. Kod tada kreira varijablu csv_file koja je postavljena na funkciju csv.reader, prosljeđujući varijablu odgovora kao argument. Kod zatim koristi for petlju za ponavljanje kroz svaki red u csv_fileu i ispisuje svaki red na konzoli.
CSV datoteke
CSV datoteke su datoteke vrijednosti odvojene zarezima. Obično se koriste za pohranjivanje podataka u tabelarnom formatu. CSV datoteke se mogu čitati pomoću Pythonovog csv modula.
Web i CSV savjeti
Postoji nekoliko savjeta za rad s web i CSV podacima u Pythonu.
Prvo, važno je razumjeti da postoje dvije različite vrste podataka: tekstualni i binarni. Binarni podaci se sastoje od 1s i 0s, dok su tekstualni podaci samo niz znakova.
Kada radite s binarnim podacima, važno je koristiti prave alate. Na primjer, pandas biblioteka se može koristiti za čitanje i pisanje binarnih datoteka.
Drugo, važno je pratiti nazive kolona kada radite sa CSV datotekama. Python ima ugrađenu funkciju zvanu split() koja se može koristiti za podjelu datoteke u pojedinačne stupce.
Konačno, takođe je važno zapamtiti da su CSV datoteke vrijednosti razdvojene zarezima (CSV). To znači da svaka kolona mora biti navedena u posebnom redu.