Science des données

Tutoriel sur l'histogramme Python NumPy()

Tutoriel sur l'histogramme Python NumPy()
Un histogramme est un mappage d'intervalles en fréquences. Il est utilisé pour approximer la fonction de densité de probabilité de la variable particulière. Il est également connu sous le nom de graphique à barres. De nombreuses options sont disponibles en python pour construire et tracer des histogrammes. La bibliothèque NumPy de python est utile pour les opérations scientifiques et mathématiques. L'une des fonctionnalités importantes de cette bibliothèque est d'implémenter l'histogramme en utilisant la fonction histogram(). Cette fonction est utilisée pour créer l'histogramme qui représente graphiquement la distribution de fréquence des données. Dans l'histogramme, les intervalles de classe sont représentés par des bacs qui ressemblent à des rectangles horizontaux, et la hauteur variable représente les fréquences. La connaissance de la création d'un tableau NumPy est nécessaire pour comprendre les exemples présentés dans ce tutoriel.

Syntaxe:

numpy.histogramme(input_array, bins=10, range=Aucun, normé=Aucun, weights=Aucun, densité=Aucun)

Cette fonction peut prendre six arguments pour retourner l'histogramme calculé d'un ensemble de données. Les objectifs de ces arguments sont expliqués ci-dessous.

Cette fonction peut renvoyer deux tableaux. L'un est le tableau hist qui contient l'ensemble des données d'histogramme. Un autre est le tableau de bord qui contient les valeurs du bac.

Exemple 1 : Imprimer le tableau d'histogrammes

L'exemple suivant montre l'utilisation de la fonction histogram() avec un tableau à une dimension et l'argument bins avec les valeurs séquentielles. Un tableau de 5 nombres entiers a été utilisé comme tableau d'entrée, et un tableau de 5 valeurs séquentielles a été utilisé comme valeur bins. Le contenu du tableau d'histogrammes et du tableau bin s'imprimera ensemble en sortie.

# Importer la bibliothèque NumPy
importer numpy en tant que np
# Appeler la fonction histogram() qui renvoie les données de l'histogramme
np_tableau = np.histogramme([10, 3, 8, 9, 7], bacs=[2, 4, 6, 8, 10])
# Imprimer la sortie de l'histogramme
print("La sortie de l'histogramme est : \n", np_array)

Production:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.

Exemple 2 : imprimer l'histogramme et les tableaux bin

L'exemple suivant montre comment le tableau histogram et le tableau bin peuvent être créés à l'aide de la fonction histogram(). Un tableau NumPy a été créé en utilisant la fonction arrange() dans le script. Ensuite, la fonction histogram() a été appelée pour renvoyer séparément les valeurs du tableau d'histogramme et du tableau bin.

# Importer la bibliothèque NumPy
importer numpy en tant que np
# Créer un tableau NumPy en utilisant arange()
np_tableau = np.ranger(90)
# Créer des données d'histogramme
hist_array, bin_array = np.histogramme(np_array, bins=[0, 10, 25, 45, 70, 100])
# Imprimer le tableau d'histogrammes
print("Les données du tableau d'histogrammes sont : ", hist_array)
# Imprimer le tableau des bacs
print("Les données du tableau bin sont : ", bin_array)

Production:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.

Exemple 3 : imprimer l'histogramme et les tableaux de bacs en fonction de l'argument de densité

L'exemple suivant montre l'utilisation de la densité argument de la fonction histogram() pour créer le tableau histogramme. Un tableau NumPy de 20 nombres est créé en utilisant la fonction arange (). La première fonction histogram() est appelée en définissant le densité valeur à Faux. La deuxième fonction histogram() est appelée en définissant le densité valeur à Vrai.

# importer le tableau NumPy
importer numpy en tant que np
# Créer un tableau NumPy de 20 nombres séquentiels
np_tableau = np.ranger(20)
# Calculer les données de l'histogramme avec une fausse densité
hist_array, bin_array = np.histogramme(np_array, densité=Faux)
print("L'histogramme produit en définissant la densité sur False : \n", hist_array)
print("La sortie du tableau bin : \n", bin_array)
# Calculer les données de l'histogramme avec la densité réelle
hist_array, bin_array = np.histogramme(np_array, densité=True)
print("\nL'histogramme produit en définissant la densité sur True : \n", hist_array)
print("La sortie du tableau bin : \n", bin_array)

Production:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.

Exemple 4 : Dessiner un graphique à barres à l'aide de données d'histogramme

Vous devez installer la bibliothèque matplotlib de python pour dessiner le graphique à barres avant d'exécuter le script de cet exemple. hist_array et tableau_bin ont été créés en utilisant la fonction histogram(). Ces tableaux ont été utilisés dans la fonction bar() de la bibliothèque matplotlib pour créer le graphique à barres.

# importer les bibliothèques nécessaires
importer matplotlib.pyplot en tant que plt
importer numpy en tant que np
# Créer un ensemble de données d'histogramme
hist_array, bin_array = np.histogramme([4, 10, 3, 13, 8, 9, 7], bacs=[2, 4, 6, 8, 10, 12, 14])
# Définir quelques configurations pour le graphique
plt.chiffre(figsize=[10, 5])
plt.xlim(min(bin_array), max(bin_array))
plt.grille(axe='y', alpha=0.75)
plt.xlabel('Valeurs de bord', taille de police=20)
plt.ylabel('Valeurs d'histogramme', taille de police=20)
plt.title('Histogramme Chart', fontsize=25)
# Créer le graphique
plt.bar(bin_array[:-1], hist_array, largeur=0.5, couleur='bleu')
# Afficher le graphique
plt.spectacle()

Production:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.

Conclusion:

La fonction histogram() a été expliquée dans ce tutoriel en utilisant divers exemples simples qui aideront les lecteurs à connaître le but de l'utilisation de cette fonction et à l'appliquer correctement dans le script.

Comment développer un jeu sur Linux
Il y a dix ans, peu d'utilisateurs de Linux prédisaient que leur système d'exploitation préféré serait un jour une plate-forme de jeu populaire pour l...
Ports Open Source des moteurs de jeux commerciaux
Les récréations de moteur de jeu gratuites, open source et multiplateformes peuvent être utilisées pour jouer à d'anciens ainsi qu'à certains des titr...
Meilleurs jeux de ligne de commande pour Linux
La ligne de commande n'est pas seulement votre plus grand allié lorsque vous utilisez Linux, elle peut également être une source de divertissement car...