Giorgio Gilestro, professore di Neurobiologia presso l’Imperial College London, ci ha parlato di riproducibilità della ricerca, open lab notebooks e strumenti open source, approfondendo il ruolo della trasparenza e della tracciabilità dei processi scientifici nello sviluppo di una ricerca più aperta, verificabile e innovativa.
Negli ultimi anni il tema della riproducibilità è diventato centrale nel dibattito scientifico. Dal suo punto di vista, perché oggi è diventata una condizione necessaria per fare ricerca?
La riproducibilità oggi va letta alla luce di un cambiamento molto profondo: la velocità con cui produciamo dati e pubblicazioni è enormemente aumentata rispetto a venti o trent’anni anni fa. Non si tratta soltanto di una crescita del numero di ricercatori, ma soprattutto della capacità tecnica di raccogliere e analizzare dati.
Questo cambiamento ha conseguenze dirette: se vogliamo fare una scienza realmente integrata, cioè costruire nuova conoscenza a partire da quella prodotta da altri, la riproducibilità non può più essere considerata un semplice “nice to have”, ma diventa una condizione imprescindibile.
Nel mondo industriale questo principio è già ben consolidato. Nel settore farmaceutico, per esempio, ogni nuova linea di ricerca prende avvio esclusivamente da dati ritenuti solidi e verificabili, perché in caso contrario si rischia di investire tempo e risorse su basi inaffidabili. Non vi è motivo per cui lo stesso approccio non debba essere adottato anche in ambito accademico.
Per lungo tempo la questione è stata affrontata in modo piuttosto formale, ricorrendo a espressioni come “i dati sono disponibili su richiesta”. Oggi questa impostazione non è più adeguata: i dati dovrebbero essere resi disponibili già al momento della pubblicazione. Si tratta tuttavia di una pratica non ancora pienamente diffusa.
In concreto, che cosa significa oggi rendere una ricerca riproducibile? Quali pratiche e strumenti utilizza nel suo laboratorio?
Nel nostro caso significa prima di tutto investire tempo in un vero e proprio controllo di qualità. Dal momento in cui finiamo gli esperimenti al momento in cui pubblichiamo un preprint passano spesso tre o quattro mesi.
In quel periodo “puliamo” i dati: raccogliamo esattamente quelli usati nelle analisi, li organizziamo, documentiamo tutto il processo. Usiamo strumenti come i Jupyter Notebooks, che permettono di integrare dati, codice e descrizione del processo in un unico ambiente riproducibile.
Annotiamo anche il software utilizzato, le versioni, i parametri. Questo è fondamentale: chiunque deve poter rifare esattamente la stessa analisi.
Ma non è solo una questione di apertura verso l’esterno, è anche un controllo interno. Questo processo infatti ci permette di intercettare errori, bug nel codice, problemi nelle analisi prima della pubblicazione. In un certo senso, è lo stesso principio del controllo qualità di un prodotto industriale: non metti sul mercato qualcosa che non hai verificato.
Lei promuove un approccio molto aperto, basato anche su open lab notebooks. Cosa significa lavorare in questo modo?
Nel nostro caso significa condividere il processo di ricerca praticamente in tempo reale.
A mano a mano che sviluppiamo strumenti, modifichiamo protocolli o analizziamo dati, documentiamo tutto su piattaforme accessibili. Ogni aggiornamento è immediatamente visibile e consultabile, senza soluzione di continuità tra lavoro e diffusione.
Questo include anche tentativi falliti, modifiche, aggiustamenti. È un livello di trasparenza molto alto, che però riflette meglio la realtà del lavoro scientifico.
È chiaro che non mi aspetto che qualcuno dall’altra parte replichi tutto immediatamente: ci sarà sempre un ritardo, ma il punto è che il processo è aperto e questo cambia radicalmente il modo in cui la conoscenza può essere condivisa e riutilizzata.
Molti ricercatori percepiscono queste pratiche come onerose. È davvero così? E quali benefici ha osservato?
Sì, è oneroso, nel senso che richiede tempo e investimento iniziale. La fase più impegnativa è quella di avvio, in cui si costruisce il sistema: dalla scelta degli strumenti alla formazione delle persone, fino alla definizione delle procedure. Una volta impostato il sistema, tuttavia, il processo tende a diventare ordinario. Quando queste pratiche si consolidano, i costi si riducono sensibilmente, mentre i benefici restano pienamente evidenti.
Per chi è all’inizio della carriera esiste inoltre un vantaggio molto concreto: la reputazione. Se i primi lavori sono trasparenti, ben documentati e riproducibili, questo viene riconosciuto all’interno della comunità scientifica di riferimento. Ne deriva una maggiore credibilità, che favorisce anche l’avvio di collaborazioni.
Non si tratta quindi soltanto di una scelta etica: è anche un vero e proprio vantaggio competitivo. Un investimento che, nel tempo, produce un ritorno tangibile.
Nel suo lavoro emerge anche un forte investimento nello sviluppo di strumenti open source. Che ruolo ha questo aspetto?
Per noi è centrale. Non si tratta solo di condividere dati, ma di costruire strumenti.
Utilizziamo hardware e software open source per sviluppare sistemi che ci consentono di realizzare esperimenti per i quali non esistono soluzioni commerciali. Per esempio, impieghiamo microcomputer a basso costo, integrati con sistemi di acquisizione video e algoritmi di intelligenza artificiale, per analizzare il comportamento in tempo reale.
Questo approccio ci offre un vantaggio significativo: ci permette di esplorare domande di ricerca che, in assenza di questi strumenti, non sarebbero nemmeno affrontabili. Non si tratta quindi solo di ottimizzare processi esistenti, ma di rendere possibili nuovi tipi di esperimento.
Un’analogia utile è quella della Formula 1: le vetture non vengono acquistate già pronte, ma progettate, modificate e perfezionate continuamente. Allo stesso modo, quando si opera ai confini della conoscenza, è necessario costruire e adattare i propri strumenti.
In questo senso, la condivisione non rappresenta un limite, ma un elemento di forza. Anche rendendo pubblici strumenti e metodologie, il vantaggio competitivo non si riduce: ciò che fa la differenza non è la rapidità di pubblicazione, ma la capacità di formulare e perseguire domande di ricerca che richiedono proprio quegli strumenti.
Quali leve possono favorire una transizione verso pratiche più aperte e riproducibili? E che ruolo avrà l’intelligenza artificiale?
Gli incentivi sono fondamentali. Oggi esistono tre livelli:
- reputazione personale
- carriera (ancora poco sviluppato)
- finanziamenti
Nei programmi di finanziamento europei, per esempio, l’open science è già valorizzata, ma raramente costituisce un criterio vincolante. Finché non assumerà questo ruolo, il cambiamento resterà inevitabilmente parziale.
A mio avviso, la leva più efficace è proprio quella dei finanziatori: nel momento in cui chi eroga i fondi introduce requisiti stringenti, l’adozione di determinate pratiche diventa rapida e diffusa.
In questo scenario, l’intelligenza artificiale ha un ruolo ambivalente. Da un lato, consente di accelerare in modo significativo i processi di verifica (già oggi è possibile riprodurre un’analisi a partire da un dataset in pochi minuti), dall’altro lato, però, rende altrettanto semplice generare dati falsi o manipolati. Questo porterà inevitabilmente a una crescente esigenza di tracciabilità completa del dato.
In prospettiva, non sarà più sufficiente valutare il risultato finale e sarà necessario poter risalire all’intero processo che lo ha generato. Un po’ come avviene per la tracciabilità alimentare, dove l’autenticità di un prodotto è garantita dalla possibilità di ricostruirne l’origine lungo tutta la filiera.
Probabilmente la scienza dovrà arrivare a qualcosa di simile: un sistema condiviso di tracciabilità e certificazione che premi le pratiche realmente riproducibili. Un vero e proprio “bollino DOCG” degli esperimenti, capace di tutelare e valorizzare la ricerca fatta bene.

| *Giorgio Gilestro è professore di Neurobiologia presso l’Imperial College London, dove dirige un gruppo di ricerca che si occupa di sonno, ritmi circadiani e comportamento, con particolare attenzione allo sviluppo di strumenti sperimentali innovativi per l’analisi automatizzata dei dati biologici. La sua attività scientifica combina neuroscienze, analisi computazionale e sviluppo di tecnologie open source per lo studio del comportamento animale. Accanto alla ricerca, è noto per il suo impegno sui temi della riproducibilità della ricerca, degli open lab notebooks e dell’open source applicato alla pratica scientifica. Nel suo laboratorio promuove un approccio basato sulla condivisione in tempo reale di dati, protocolli e strumenti, con l’obiettivo di rendere la ricerca più trasparente, verificabile e accessibile, favorendo al tempo stesso nuove modalità di collaborazione e innovazione scientifica. |
