Un caso di studio mostra come utilizzare un modello di regressione lineare multipla per prevedere il fatturato mensile di un e-commerce:
- Creazione del Dataset: si parte con l’integrazione dei dati da Google Analytics e BigQuery, includendo metriche come il numero di sessioni, il tasso di conversione e il carrello medio.
- Feature Selection: si identificano le variabili più rilevanti che influenzano il fatturato. Ad esempio, il carrello medio netto e il numero di acquisti giornalieri sono risultate le variabili più significative.
- Scelta del Modello: Utilizzando la regressione lineare multipla, si individuacla funzione che meglio si adatta ai dati storici.
- Addestramento e Validazione: si valida il modello per assicurarsi che funzioni bene sia sui dati storici che sui nuovi dati, evitando il sovraddestramento.
Il modello ha raggiunto un coefficiente di determinazione (accuratezza) R2di 0.94, indicando un'alta precisione nel spiegare la variabilità del fatturato. Il RMSE (Root Mean Square Error) di 66.30 indica che la previsione sul fatturato può sbagliare di circa 66.30 unità.