Fichiers texte (CSV) en python

1 – Introduction

Un fichier « CSV » est un fichier texte qui respecte un certain format. En effet, comme son nom l’indique (comma seperated values) : valeurs séparées par des virgules. Le format CSV est très utilisé comme format par les tableurs (comme excel) et les logiciels de base de données pour les opérations d’import et d’export.

Dans cet article, on va découvrir le format « CSV », puis étudier la manière de manipuler ce genre de fichiers en Python.

2 – Fichiers CSV

Le contenu d’un fichier est un ensemble de lignes, où chaque ligne est composée de plusieurs valeurs séparées par des virgules (la virgule est le séparateur par défaut).

Exemple de fichier CSV : 

Sexe,Prénom,Année de naissance
M,Bob,1990
F,Alice,1980
F,Eve,2000

Le séparateur par défaut est la virgule « , ». Toutefois, on peut définir d’autres séparateurs comme : le point-virgule « ; », l’espace  » « , les deux points « : », … etc.

3 – Python et fichiers CSV

Comme les fichiers CSV sont des fichiers texte, il faut d’abord les ouvrir en mode lecture texte « r ». Pour cela, on utilise la fonction « open »

file = open("fichier.csv", "r")

Ensuite, on peut commencer à lire le contenu. Il existe différentes méthodes pour lire un fichier CSV selon ce qu’on veut récupérer : quelques caractères, une lignes, la listes des lignes, ou tout simplement tout. Soit « file » notre variable python qui est obtenue après ouverture du fichier :

  • file.read(n) : lire les « n » (au max) premiers caractères du fichier et les renvoie dans une chaîne de caratères.
  • file.readline() : lire la première ligne, c’est-à-dire, lire des caractère jusqu’à arriver au caractère « \n ».
  • file.readlines() : lire tout le fichier et le retourner sous forme de liste de lignes.
  • file.read() : lire tout le contenu du fichier et le retourner dans une chaîne de caractères.

Pour écrire dans un fichier texte, on utilise la méthode « write ».

  • file.write(texte) : écrire « texte » dans le fichier.

Enfin, pour fermer le fichier, on utilise la méthode « close ». C’est toujours important de fermer un fichier surtout après une écriture.

  • file.close()

Par exemple, pour remplacer le séparateur d’un fichier CSV de virgule « , » à dière « # », on a deux manières de faire :

3.1 – Sans le module csv

Pour lire le contenu d’un fichier CSV sans utiliser le module Python « csv », il faudra lire le fichier ligne par ligne et parser les lignes en python :

f = open("fichier.csv", "r+")     # mode lecture/écriture
lignes = f.readlines()
f.seek(0) # retour au début du fichier
for l in lignes:
# découper les lignes en plusieurs éléments
s = l.split(",")
# regrouper les éléments
ss = "#".join(s)
# écrire la ligne dans le fichier
f.write(ss)
f.close()

3.2 – Avec le module csv

Avec le module CSV, on utilise une la fonction « reader » qui génère un itérateur et qui itère sur les ligne du fichier. Cette fonction s’occupe également de parser les lignes. Ensuite, on utilise « writer » pour l’écriture.

import csv
f = open("fichier.csv", "r+")
r = csv.reader(f, delimiter=",")
lignes = list(r)
f.seek(0) # retour au début du fichier
w = csv.writer(f, delimiter="#")
w.writerows(lignes)
f.close() # fermeture du fichier

3 – Quelques Exercices

D’autres exercices sont disponibles sur ma playlist youtube.

3.1 – Récupérer les commentaires d’un programme python

Hypothèse : Les chaînes de caractère dans le programme python ne contiennent pas le caractère « # ».

Les étapes à suivre sont :

  1. Ouverture du fichier en mode lecture « r »
  2. Pour chaque ligne :
    1. Vérifier si la ligne contient le caractère « # » et récupérer son indice.
    2. Extraire la sous chaîne de caractère à partir du « # » jusqu’à la fin de la ligne.
    3. mettre cette sous chaîne dans une liste.
  3. Fermeture du fichier et renvoi de la liste.

Le code de la fonction python ressemble à ça :

def getComments(file):
f = open(file) # ouverture du fichier en mode lecture
ligne = f.readline()
res = []
while ligne != "": # parcours du contenu du fichier
pos = ligne.find("#") # recherche l'indice de '#'
if pos != -1:
res.append(ligne[pos:])
ligne = f.readline()
f.close() # fermeture du fichier
return res # renvoi du résultat

3.2 – Récupérer une ligne d’un fichier CSV

On dispose d’un fichier CSV qui contient un certain nombre de lignes et de colonnes. On voudrait récupérer une ligne particulière. Le programme doit accepter les indices positifs et négatifs. Si l’indice de la ligne se trouve en dehors de l’intervalle des lignes du fichier, le programme renvoie une liste vide.

Les étapes à suivre sont :

  1. Ouverture du fichier en mode lecture.
  2. Lecture du contenu du fichier dans un reader CSV.
  3. Vérification que l’indice de ligne appartient bien à l’intervalle.
  4. Fermeture du fichier et renvoie de la ligne

Le programme ressemble à :

def getLigne(file, n, sep=","):
f = open(file, 'r')
# lire le contenu du fichier
r = csv.reader(f, delimiter=sep, quoting=csv.QUOTE_NONNUMERIC)
liste = list(r)
f.close()
if (n < len(liste)) and (n >= -len(liste)):
res = liste[n]
else:
res = []
return res

3.3 – Récupérer une colonne d’un fichier CSV

Cet exercice ressemble beaucoup à l’exercice précédent. Il suffit juste d’inverser les lignes et les colonnes du fichier pour retrouver exactement la même situation.

Les étapes à suivre sont :

  1. Ouverture du fichier et récupération du contenu dans un reader CSV.
  2. Inversement des lignes et des colonnes
  3. Suite comme l’exercice précédent.

Le programme ressemble à ça :

def getColonne(file, n, sep=","):
f = open(file, 'r')
r = csv.reader(f, delimiter=sep, quoting=csv.QUOTE_NONNUMERIC)
lr = list(zip(*r)) # inverser les lignes et les colonnes

# vérifier que "n" est dans le bon intervalle
if (n < len(lr)) and (n >= -len(lr)):
r = list(lr[n])
else:
r = []
f.close()
return r

Il existe une autre manière de faire : L’idée est de lire le contenu du fichier, de parcourir le contenu ligne par ligne et extraire l’élément en question de chaque ligne. Le code ressemble à :

def getColonne(file, n, sep=","):
f = open(file, 'r')
r = csv.reader(f, delimiter=sep, quoting=csv.QUOTE_NONNUMERIC)
liste = list(r)
f.close()
res = []
if (n < len(liste[0])) and (n >= -len(liste[0])):
for ligne in liste:
res.append(ligne[n])
return res

4 – Conclusion

Dans cet artcile, on a vu comment manipuler (ouverture/lecture/écriture) d’un fichier texte en Python, et particulièrement un fichier CSV.

L’article a traité également quelques exercices liés aux fichiers CSV. Vous pouvez trouvez plus d’exercices sur les fichiers CSV en Python sur ma playlist youtube