Pandas
Introduction
Pandas est la bibliothèque Python de référence pour la manipulation et l'analyse de données. Elle fournit des structures de données rapides, flexibles et expressives.
Installation
DataFrame
Le DataFrame est la structure de données principale de Pandas:
import pandas as pd
# Créer un DataFrame
df = pd.DataFrame({
'nom': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'ville': ['Paris', 'Lyon', 'Marseille']
})
print(df)
Opérations Courantes
| Opération | Code |
|---|---|
| Lire un CSV | pd.read_csv('fichier.csv') |
| Afficher les premières lignes | df.head() |
| Infos sur les colonnes | df.info() |
| Statistiques | df.describe() |
| Sélectionner une colonne | df['nom'] |
| Filtrer | df[df['age'] > 25] |
Manipulation de Données
# Ajouter une colonne
df['salaire'] = [3000, 3500, 4000]
# Supprimer une colonne
df.drop('ville', axis=1, inplace=True)
# Trier
df.sort_values('age', ascending=False)
# Groupby
df.groupby('ville').mean()
Valeurs Manquantes
# Détecter les valeurs manquantes
df.isnull()
# Supprimer les lignes manquantes
df.dropna()
# Remplir les valeurs manquantes
df.fillna(0)
Exercice Interactif
Essayer Pandas directement dans votre navigateur: