Science des données

Comment créer un DataFrame Pandas en Python?

Comment créer un DataFrame Pandas en Python?

Pandas DataFrame est une structure de données annotée 2D (bidimensionnelle) dans laquelle les données sont alignées sous forme de tableau avec différentes lignes et colonnes. Pour une meilleure compréhension, le DataFrame se comporte comme une feuille de calcul qui contient trois composants différents : index, colonnes et données. Les Pandas DataFrames sont le moyen le plus courant d'utiliser les objets du panda.

Les Pandas DataFrames peuvent être créés en utilisant différentes méthodes. Cet article expliquera toutes les méthodes possibles par lesquelles vous pouvez créer Pandas DataFrame en python. Nous avons exécuté tous les exemples sur l'outil pycharm. Commençons la mise en œuvre de chaque méthode une par une.

Syntaxe de base

Suivez la syntaxe suivante lors de la création de DataFrames en python Pandas :

pd.DataFrame(Df_data)

Exemple: Expliquons avec un exemple. Dans ce cas, nous avons stocké les données des noms et des pourcentages des étudiants dans une variable 'Students_Data'. De plus, en utilisant le pd.DataFrame (), nous avons créé un DataFrames pour afficher le résultat de l'étudiant.

importer des pandas au format pd
Etudiants_Données =
'Nom' :['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Pourcentage' :[90,80,70,85]
résultat = pd.DataFrame(Students_Data)
imprimer (résultat)

Méthodes pour créer des cadres de données Pandas

Les Pandas DataFrames peuvent être créés en utilisant les différentes manières dont nous parlerons dans le reste de l'article. Nous imprimerons le résultat des cours de l'étudiant sous forme de DataFrames. Ainsi, en utilisant l'une des méthodes suivantes, vous pouvez créer des DataFrames similaires qui sont représentés dans l'image suivante :

Méthode # 01 : Création de Pandas DataFrame à partir du dictionnaire de listes

Dans l'exemple suivant, les DataFrames sont créés à partir des dictionnaires de listes liées aux résultats de cours de l'étudiant. Tout d'abord, importez la bibliothèque d'un panda, puis créez un dictionnaire de listes. Les clés dict représentent les noms de colonnes tels que "Student_Name", "Course_Title" et "GPA". Les listes représentent les données ou le contenu de la colonne. La variable 'dictionary_lists' contient les données des étudiants qui sont ensuite affectées à la variable 'df1'. À l'aide de l'instruction print, imprimez tout le contenu des DataFrames.

Exemple:

# Bibliothèques d'importation pour pandas et numpy
importer des pandas au format pd
# Importer la bibliothèque de panda
importer des pandas au format pd
# Créer un dictionnaire de liste
dictionnaire_listes =
'Student_Name' : ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title' : ['SQA', 'SRE', 'Les bases de l'informatique', 'Intelligence artificielle'],
'GPA' : [3.1, 3.3, 2.8, 4.0]
# Créer le DataFrame
dframe = pd.DataFrame(dictionary_lists)
imprimer (dframe)

Après avoir exécuté le code ci-dessus, la sortie suivante s'affichera :

Méthode n°02 : Créer Pandas DataFrame à partir du dictionnaire du tableau NumPy

Le DataFrame peut être créé à partir du dict de tableau/liste. A cet effet, la longueur doit être la même que tous les narra. Si un index est passé, la longueur de l'index doit être égale à la longueur du tableau. Si aucun index n'est passé, alors, dans ce cas, l'index par défaut est une plage (n). Ici, n représente la longueur du tableau.

Exemple:

importer numpy en tant que np
# Créer un tableau numpy
nparray = np.déployer(
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'Bases de l'informatique', 'Intelligence artificielle'],
[3.1, 3.3, 2.8, 4.0]])
# Créer un dictionnaire de nparray
dictionnaire_de_nparray =
'Student_Name' : nparray[0],
'Cours_Titre' : nparray[1],
'GPA' : nparray[2]
# Créer le DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
imprimer (dframe)

Méthode n°03 : Création de pandas DataFrame à l'aide de la liste des listes

Dans le code suivant, chaque ligne représente une seule ligne.

Exemple:

# Importer la bibliothèque Pandas pd
importer des pandas au format pd
# Créer une liste de listes
listes_groupes = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Les bases de l'informatique', 2.8],
['Sana', 'Intelligence Artificielle', 4.0]]
# Créer le DataFrame
dframe = pd.DataFrame(group_lists, colonnes = ['Student_Name', 'Course_Title', 'GPA'])
imprimer (dframe)

Méthode n°04 : Création de pandas DataFrame à l'aide de la liste de dictionnaire

Dans le code suivant, chaque dictionnaire représente une seule ligne et des clés qui représentent les noms de colonnes.

Exemple:

# Importer les pandas de la bibliothèque
importer des pandas au format pd
# Créer une liste de dictionnaires
dict_list = [
'Student_Name' : 'Samreena', 'Course_Title' : 'SQA', 'GPA' : 3.1,
'Student_Name' : 'Raees', 'Course_Title' : 'SRE', 'GPA' : 3.3,
'Student_Name' : 'Sara', 'Course_Title' : 'Les bases de l'informatique', 'GPA' : 2.8,
'Student_Name' : 'Sana', 'Course_Title' : 'Artificial Intelligence', 'GPA' : 4.0]
# Créer le DataFrame
dframe = pd.DataFrame(dict_list)
imprimer (dframe)

Méthode # 05: Création de pandas Dataframe à partir de la série dict of pandas

Les touches dict représentent les noms des colonnes et chaque série représente le contenu des colonnes. Dans les lignes de code suivantes, nous avons pris trois types de séries : Name_series, Course_series et GPA_series.

Exemple:

# Importer les pandas de la bibliothèque
importer des pandas au format pd
# Créer la série de noms d'étudiants
Nom_série = pd.Série (['Samreena', 'Raees', 'Sara', 'Sana'])
Course_series = pd.Série(['SQA', 'SRE', 'Les bases de l'informatique', 'Intelligence artificielle'])
GPA_series = pd.Série([3.1, 3.3, 2.8, 4.0])
# Créer un dictionnaire de séries
dictionnaire_de_nparray
\
'] = 'Name' : Name_series, 'Age' : Course_series, 'Department' : GPA_series
# Création de DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
imprimer (dframe)

Méthode # 06: Créez Pandas DataFrame en utilisant la fonction zip().

Différentes listes peuvent être fusionnées via la fonction list(zip()). Dans l'exemple suivant, les pandas DataFrame sont créés en appelant pd.Fonction DataFrame(). Trois listes différentes sont créées qui sont fusionnées sous forme de tuples.

Exemple:

importer des pandas au format pd
# Liste1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# Liste2
Course_Title = ['SQA', 'SRE', 'Les bases de l'informatique', 'Intelligence artificielle']
# Liste3
GPA = [3.1, 3.3, 2.8, 4.0]
# Prenez la liste des tuples de trois listes plus loin, fusionnez-les à l'aide de zip().
tuples = list(zip(Student_Name, Course_Title, GPA))
# Attribuer des valeurs de données aux tuples.
tuples
# Conversion de la liste de tuples en pandas Dataframe.
dframe = pd.DataFrame(tuples, colonnes=['Student_Name', 'Course_Title', 'GPA'])
# Imprimer les données.
imprimer (dframe)

Conclusion

En utilisant les méthodes ci-dessus, vous pouvez créer des Pandas DataFrames en python. Nous avons imprimé le cours GPA d'un étudiant en créant des Pandas DataFrames. Espérons que vous obtiendrez des résultats utiles après avoir exécuté les exemples mentionnés ci-dessus. Tous les programmes sont bien commentés pour une meilleure compréhension. Si vous avez d'autres façons de créer des Pandas DataFrames, n'hésitez pas à les partager avec nous. Merci d'avoir lu ce tutoriel.

Comment utiliser le moteur de triche GameConqueror sous Linux
L'article couvre un guide sur l'utilisation du moteur de triche GameConqueror sous Linux. De nombreux utilisateurs qui jouent à des jeux sur Windows u...
Meilleurs émulateurs de console de jeu pour Linux
Cet article répertorie les logiciels d'émulation de console de jeu populaires disponibles pour Linux. L'émulation est une couche de compatibilité logi...
Meilleures distributions Linux pour les jeux en 2021
Le système d'exploitation Linux a parcouru un long chemin depuis son apparence originale, simple et basée sur le serveur. Ce système d'exploitation s'...