Crea un grafico a barre migliore con questo trucco

Migliora il grafico a barre con questo trucco

(È davvero un grafico a dispersione seaborn!)

Ogni volta che ho bisogno di ispirazione per visualizzazioni efficaci, sfoglio The Economist, Visual Capitalist o The Washington Post. Durante una di queste incursioni, ho trovato un’infografica interessante – simile a quella mostrata sopra – che rappresentava l’età di ciascun membro del Congresso degli Stati Uniti rispetto alla loro generazione.

La mia prima impressione è stata che si trattasse di un grafico a barre orizzontali, ma una visione più attenta ha rivelato che ogni barra era composta da più indicatori, rendendolo un grafico a dispersione. Ogni indicatore rappresentava un membro del Congresso.

In questo progetto Quick Success Data Science, ricreeremo questo grafico attraente utilizzando Python, pandas e seaborn. Lungo il percorso, scopriremo una serie di tipi di indicatori che potresti non conoscere.

Dataset

Poiché gli Stati Uniti hanno leggi sull’età di candidatura, i compleanni dei membri del Congresso fanno parte del registro pubblico. Puoi trovarli in diversi luoghi, tra cui il Biographical Directory of the United States Congress e Wikipedia.

Per comodità, ho già compilato un file CSV con i nomi dei membri attuali del Congresso, insieme ai loro compleanni, ramo del governo e partito, e l’ho salvato in questo Gist.

Il Codice

Il codice seguente è stato scritto in Jupyter Lab e viene descritto per celle.

Importazione delle librerie

from collections import defaultdict  # Per contare i membri per età.
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import patches  # Per disegnare riquadri sul grafico.
import pandas as pd
import seaborn as sns

Assegnazione di costanti per i dati generazionali

Annoteremo il grafico in modo che le coorti generazionali, come i Baby Boomer e la Generazione X, siano evidenziate. Il codice seguente calcola gli intervalli di età attuali per ciascuna coorte e include liste per i nomi delle generazioni e i colori di evidenziazione. Poiché vogliamo considerare queste liste come costanti, metteremo in maiuscolo i nomi e useremo un trattino basso come prefisso.

# Prepara i dati generazionali per il grafico come riquadri sul grafico:CURRENT_YEAR = 2023...