Crea un grafico a barre migliore con questo trucco
Migliora il grafico a barre con questo trucco
(È davvero un grafico a dispersione seaborn!)
Ogni volta che ho bisogno di ispirazione per visualizzazioni efficaci, sfoglio The Economist, Visual Capitalist o The Washington Post. Durante una di queste incursioni, ho trovato un’infografica interessante – simile a quella mostrata sopra – che rappresentava l’età di ciascun membro del Congresso degli Stati Uniti rispetto alla loro generazione.
La mia prima impressione è stata che si trattasse di un grafico a barre orizzontali, ma una visione più attenta ha rivelato che ogni barra era composta da più indicatori, rendendolo un grafico a dispersione. Ogni indicatore rappresentava un membro del Congresso.
In questo progetto Quick Success Data Science, ricreeremo questo grafico attraente utilizzando Python, pandas e seaborn. Lungo il percorso, scopriremo una serie di tipi di indicatori che potresti non conoscere.
Dataset
Poiché gli Stati Uniti hanno leggi sull’età di candidatura, i compleanni dei membri del Congresso fanno parte del registro pubblico. Puoi trovarli in diversi luoghi, tra cui il Biographical Directory of the United States Congress e Wikipedia.
- Creazione di embedding BERT con Hugging Face Transformers
- Come utilizzare Chat-GPT e Python per costruire un grafo di conoscenza in Neo4j basato sui propri articoli
- Ricercatori del MIT hanno sviluppato una tecnica di intelligenza artificiale (AI) che permette a un robot di sviluppare piani complessi per manipolare un oggetto utilizzando l’intera mano.
Per comodità, ho già compilato un file CSV con i nomi dei membri attuali del Congresso, insieme ai loro compleanni, ramo del governo e partito, e l’ho salvato in questo Gist.
Il Codice
Il codice seguente è stato scritto in Jupyter Lab e viene descritto per celle.
Importazione delle librerie
from collections import defaultdict # Per contare i membri per età.
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import patches # Per disegnare riquadri sul grafico.
import pandas as pd
import seaborn as sns
Assegnazione di costanti per i dati generazionali
Annoteremo il grafico in modo che le coorti generazionali, come i Baby Boomer e la Generazione X, siano evidenziate. Il codice seguente calcola gli intervalli di età attuali per ciascuna coorte e include liste per i nomi delle generazioni e i colori di evidenziazione. Poiché vogliamo considerare queste liste come costanti, metteremo in maiuscolo i nomi e useremo un trattino basso come prefisso.
# Prepara i dati generazionali per il grafico come riquadri sul grafico:CURRENT_YEAR = 2023...