La trascrittomica monocellulare rivela una nuova funzione dinamica dei fattori di trascrizione durante l’emopoiesi embrionale

Abstract

I recenti progressi nelle tecniche di trascrittomica monocellulare hanno aperto le porte allo studio delle reti di regolazione genica (GRN) a livello monocellulare. Qui, abbiamo studiato i GRNs che controllano l'emergere di cellule staminali ematopoietiche e cellule progenitrici da endotelio embrionale di topo utilizzando una combinazione di test di trascrittoma monocellulare. Abbiamo scoperto che un eptad di fattori di trascrizione (Runx1, Gata2, Tal1, Fli1, Lyl1, Erg e Lmo2) è specificamente coespressa in una popolazione intermedia che esprime sia i marcatori endoteliali che ematopoietici. All'interno dell'eptad, abbiamo identificato due serie di fattori di funzioni opposte: uno (Erg/Fli1) che promuove il destino delle cellule endoteliali, l'altro (Runx1/Gata2) che promuove il destino ematopoietico. Sorprendentemente, i nostri dati suggeriscono che, anche se Fli1 inizialmente supporta il destino della cellula endoteliale, acquisisce un ruolo pro-ematopoietico quando viene espresso insieme a Runx1. Questo lavoro dimostra la potenza della sequenza di RNA a singola cellula per la caratterizzazione di dinamiche complesse del fattore di trascrizione.

Introduzione

Nell’ultimo decennio, i progressi nella trascrittomica ad alto rendimento e nelle analisi dell’occupazione del DNA hanno fornito preziose intuizioni su come i fattori di trascrizione (TF) regolano le decisioni sul destino delle cellule e determinano l’identità delle cellule. È diventato chiaro che durante lo sviluppo embrionale, l’espressione delle principali TF è strettamente regolata, ed è stato dimostrato che l’espressione combinatoria di un numero relativamente limitato di TF è sufficiente per stabilire (e potenzialmente cambiare) l’identità e la differenziazione cellulare attraverso la loro azione sulle reti di regolazione genica sottostanti (GRN) (Iwafuchi-Doi e Zaret, 2016). In questo contesto, sono state utilizzate l’analisi trascrittomica di massa e il sequenziamento di immunoprecipitazione della cromatina (ChIP-seq) per descrivere le interazioni delle TF, fornendo così modelli GRN (Dunn et al., 2014; Mullen et al., 2011). Recentemente, queste tecniche sono state utilizzate con successo per studiare il sistema ematopoietico embrionale in un modello di differenziazione in vitro delle cellule staminali embrionali (ESC) (Goode et al., 2016).

Tuttavia, l’uso di popolazioni di cellule di massa costituisce un’importante limitazione nei nostri sforzi per comprendere appieno i GRN. Anche se la trascrittomica di massa può rivelare correlazioni geniche globali cruciali tra stati cellulari semi-stabili, non può risolvere le interazioni geniche più sottili che si verificano in complessi stati di transizione. Inoltre, l’uso di un approccio di tipo bulk rende difficile dedurre le conseguenze dirette sul paesaggio trascrizionale su cui agiscono queste TF.

Queste limitazioni possono essere superate con l’uso di approcci a cella singola. Negli ultimi cinque anni, sono stati raggiunti enormi progressi tecnici nel campo. L’espressione genica può essere efficacemente valutata a livello monocellulare, rendendo possibile distinguere le sottopopolazioni all’interno di tessuti e colture cellulari (Kolodziejczyk et al., 2015; Scialdone et al., 2016). La trascrittomica monocellulare è stata precedentemente utilizzata per svelare complesse transizioni evolutive come la gastrulazione (Scialdone et al., 2016), dimostrando che è possibile determinare combinazioni di TF che sono espresse a livello monocellulare con il progredire della differenziazione cellulare.

Nel presente lavoro abbiamo applicato approcci di trascrittomica monocellulare all’ontogenesi del sistema sanguigno nell’embrione del topo. I GRN che sono coinvolti nella produzione dello stelo ematopoietico e delle cellule progenitrici (HSPC) all’origine di tutte le cellule del sangue non sono ben compresi. Durante l’embriogenesi del topo, HSPCs sono generati principalmente nel sacco vitellino (YS), da E7-E7.5, e nella regione aorta-gonad-mesonefros (AGM), da E10.5. Essi emergono dalle cellule endoteliali che formano la vascolarizzazione, attraverso un processo chiamato transizione da endoteliale a ematopoietico (EHT) (Boisset et al., 2010; Choi et al., 1998; Eilken et al., 2009; Lancrin et al., 2009; Zovein et al., 2008). È stato proposto che un heptad di sette TF (Gata2, Runx1, Erg, Fli1, Lmo2, Lyl1 e Tal1) noti per essere essenziali per lo sviluppo del sangue formano un complesso trascrizionale potenzialmente coinvolto nella generazione di HSPC. Questa proposta si basava sull’analisi in massa ChIP-seq del legame di queste sette TF agli elementi regolatori di 927 geni della linea cellulare HPC7 (Wilson et al., 2010). Tuttavia, non vi era alcuna prova diretta che tutte e sette le sette TF fossero espresse insieme a livello monocellulare durante l’embriogenesi o che i target heptad giocassero un ruolo cruciale nello sviluppo. Impiegando l’analisi trascrittomica monocellulare e un sistema di differenziazione delle CSE in vitro che dà origine alle cellule del sangue, abbiamo affrontato queste domande e fornito nuovi spunti sulla formazione di HSPC da cellule endoteliali. I nostri dati mostrano che durante l’EHT, due serie di TF hanno effetti opposti che permettono una differenziazione adeguata. Attraverso la transizione, Erg e Fli1 supportano il destino delle cellule endoteliali mentre Runx1 e Gata2 promuovono quello ematopoietico. Inaspettatamente, abbiamo scoperto che il fattore di trascrizione endoteliale Fli1 potrebbe acquisire una funzione ematopoietica quando espresso insieme al regolatore master ematopoietico Runx1. Questo lavoro dimostra che l’analisi GRN basata su dati trascrittomici monocellulari può evidenziare gli aspetti biologici che mancano ai metodi classici di massa, sottolineando la potenza degli approcci monocellulari nella comprensione delle complesse transizioni evolutive.

Risultati

I fattori chiave di trascrizione identificano una popolazione intermedia tra le cellule endoteliali e le cellule del sangue durante l’EHT in vivo e in vitro

Abbiamo eseguito RT-PCR quantitativa monocellulare (sc-q-RT-PCR) su 95 geni associati a cellule ematopoietiche, endoteliali (Endo), e la muscolatura liscia vascolare (VSM) (file supplementare 1). Singole cellule sono state ordinate da YS e AGM sezionate da embrioni di topo a E9, E10.5 e E11. Per arricchire per le cellule sottoposte a EHT, abbiamo selezionato le cellule utilizzando sia il marcatore endoteliale VE-caderina (VE-Cad) e il marcatore ematopoietico CD41 (Figura 1-figure supplementi 1 e 2). Utilizzando clustering gerarchico, queste cellule potrebbero essere separati in tre gruppi principali in entrambi i tessuti: Le cellule endo, Pre-HSPCs, che hanno espresso sia i geni ematopoietici che endoteliali (Taoudi et al., 2008), e HSPCs (Figura 1A e B, Figura 1-figure supplements 1 e 2).

Mentre la frequenza di ogni popolazione di cellule differivano tra tessuti e punti temporali (Figura 1-figure supplement 3), i gruppi erano più fortemente correlati (Pearson r > 0,9) alle loro controparti rispetto ad altri gruppi nello stesso tessuto e raggruppati insieme utilizzando l’analisi dei componenti principali (PCA) e clustering gerarchico (Figura 1-figure supplement 4 e Figura 1A).

Inoltre, E9.5 YS Gfi1-/–Gfi1b^–^/– cellule, che non sono in grado di completare l’EHT a causa della mancanza dei due repressori trascrizionali Gfi1 e Gfi1b (Lancrin et al., 2012), raggruppati insieme ai Pre-HSPC, rafforzando l’idea che questa popolazione è un passo intermedio essenziale tra Endo e HSPC (Figura 1-figure supplement 5 e Figura 1B).

EHT può essere ricapitolato in vitro utilizzando il modello di differenziazione delle CSE (Huber, 2010). Abbiamo eseguito una differenziazione di 3,25 giorni seguita dall’isolamento delle cellule Flk1+, arricchite in cellule che formano una colonia di esplosione (BL-CFC) (Choi et al., 1998), che sono state coltivate per altri 1,5 giorni prima di eseguire sc-q-RT-PCR utilizzando gli stessi 95 geni (Figura 1C). Clustering gerarchico identificato quattro gruppi, corrispondenti a Endo, HSPCs, e Pre-HSPCs trovato nella vascolarizzazione embrionale e un quarto gruppo caratterizzato da un’elevata espressione di Acta2 (actina del muscolo liscio) e Serpine1 e da una bassa espressione dei geni endoteliali ed ematopoietici, che abbiamo identificato come VSM (Figura 1-figure supplemento 6A e Figura 1D).

In entrambi i sistemi in vivo e in vitro, la caratteristica più notevole della popolazione Pre-HSPCs è la co-espressione di sette geni che codificano per i fattori di trascrizione associati all’emopoiesi: Erg, Fli1, Tal1, Lyl1, Lmo2, Runx1 e Gata2 (Figura 1E e F, Figura 1-figure supplement 6B e C), che sono stati proposti per lavorare insieme come un complesso (Wilson et al., 2010). Al contrario, le cellule Endo espresso solo Erg, Fli1, Lmo2 e Tal1 mentre HSPCs espresso Fli1, Lmo2, Lyl1, Runx1 e Tal1. Ciò suggerisce che queste sette TF potrebbero essere importanti per stabilire e/o mantenere l’identità di tipo cellulare della popolazione dei Pre-HSPC.

Sovraespressione simultanea di Erg, Fli1, Tal1, Lyl1, Lmo2, Runx1, Cbfb e Gata2 durante la differenziazione dell’emangioblasto porta alla formazione di una popolazione simile a quella dei Pre-HSPC

La coespressione delle sette TF nelle popolazioni dei Pre-HSPC in vivo e in vitro ci ha spinto a chiederci se la coespressione di questi geni possa essere collegata all’identità dei Pre-HSPC. Per determinare l’effetto dell’espressione di questi sette fattori a livello monocellulare, abbiamo stabilito una linea cellulare ES inducibile in cui tutti e sette i geni e Cbfb, una proteina essenziale per il legame e la funzione del DNA Runx1 (Wang et al., 1996; Tahirov et al., 2001), potrebbero essere espressi simultaneamente a seguito dell’aggiunta di doxiciciclina (dox). Abbiamo generato una linea cellulare ES inducibile (i8TFs) in cui le otto sequenze di codifica sono state collegate tra loro da sequenze T2A (Figura 2A). Questa strategia sfrutta il meccanismo del “salto ribosomiale” del peptide T2A virale (Donnelly et al., 2001) per consentire la produzione di otto proteine da una singola trascrizione. L’espressione di tutte e otto le proteine è stata convalidata da western blot dopo 24 ore di trattamento dox in coltura ESC (Figura 2B). Come controllo, abbiamo creato una linea ESC, che non contiene alcun nuovo cDNA (Empty), ma è altrimenti identica alla linea i8TFs.

Abbiamo studiato l’effetto della sovraespressione delle otto TF durante la differenziazione dell’emangioblasto. Dopo tre giorni di coltura EB, le cellule Flk1+ sono state differenziate per un giorno in coltura BL-CFC, in quel momento le cellule hanno perso la loro identità mesodermica e hanno prodotto cellule muscolari lisce endoteliali e vascolari. Dox è stato aggiunto a questo punto di tempo, e le cellule sono state coltivate per altri due giorni. Le cellule sono stati ripresi ogni 15 minuti per 48 ore e sono stati raccolti alla fine della cultura per la citometria a flusso. La linea cellulare vuota non ha mostrato alcuna differenza importante, né in termini di marcatori della superficie cellulare né in termini di morfologia cellulare dopo il trattamento con dox. Al contrario, abbiamo notato un cambiamento drammatico in seguito all’attivazione delle otto TF quando quasi tutte le cellule hanno sviluppato lo stesso fenotipo (VE-Cad+ CD41+^e cKit+ CD41+ a^seconda della colorazione) (Figura 3A). Questo cambiamento è stato accompagnato da una marcata diminuzione del numero di cellule rotonde (Figura 3B e Figura 3-figure supplement 1). L’espressione simultanea delle otto TF non ha cambiato la frequenza delle cellule viventi (Figura 3C) ma c’è stata una diminuzione del 40% del numero di cellule in fase S, suggerendo che l’espressione delle otto TF ha un impatto negativo sulla proliferazione cellulare (Figura 3D).

Per valutare l’impatto della sovraespressione simultanea di questi otto geni sull’attività di differenziazione ematopoietica, abbiamo eseguito un test di unità di formazione delle colonie (CFU). Abbiamo placcato le cellule di entrambe le condizioni i8TFs – dox e i8TFs + dox in assenza di dox in un mezzo che permette la crescita sia delle cellule mieloidi che di quelle eritroidi. Abbiamo osservato un drammatico aumento del numero di unità di formazione di colonia dalle cellule +dox, suggerendo che l’induzione delle otto TFs aumenta il potenziale di differenziazione ematopoietica (Figura 3E).

La sovraespressione delle otto TF ha portato alla produzione di una maggioranza di cellule VE-Cad+ CD41+ (Figura 3A). Tuttavia, all’inizio del trattamento dox, la maggior parte delle cellule erano VE-Cad-^CD41- (Figura 3-figure supplement 2A), che sono stati arricchiti in cellule muscolari lisce vascolari (denominate eVSMs) (Figura 3-figure supplement 2B). Per capire l’impatto dell’espressione delle otto TF sulle due principali popolazioni non ematopoietiche – la popolazione^endoteliale VE-Cad+ CD41- (chiamata Endo) e l’eVSM – abbiamo isolato le cellule Endo ed eVSM al giorno 1 della coltura BL-CFC (Figura 3-figure supplement 2A) e le abbiamo coltivate in condizioni di coltura emogenica endoteliale (HE) con o senza dox per 48 ore. Utilizzando la citometria a flusso, abbiamo dimostrato che entrambe le popolazioni sono state colpite dal trattamento con dox e sono diventate quasi interamente VE-Cad+ CD41+ (Figura 3-figure supplement 2C). Inoltre, il test CFU ha mostrato una maggiore capacità di differenziazione ematopoietica per l’Endo +dox rispetto alla condizione -dox, confermando la loro conversione di successo (Figura 3-figure supplement 2D). Al contrario, le cellule eVSM non hanno mostrato un effetto comparabile, e insieme ai dati della citometria a flusso, questa evidenza suggerisce che anche se gli eVSM hanno ottenuto il fenotipo Pre-HSPCs, probabilmente sono rimasti più immaturi delle cellule Endo +dox (Figura 3-figure supplement 2D). Per caratterizzare ulteriormente l’effetto delle otto TFs sulle popolazioni eVSM ed Endo, abbiamo effettuato un’analisi microarray sulle condizioni i8TFs eVSM ed Endo prima (t0) e 24 ore dopo la differenziazione con o senza trattamento dox (+dox e -dox) (file supplementare 5). La linea vuota ESC eVSM è stata utilizzata come controllo. Come previsto, il trattamento dox di queste cellule ha avuto poco effetto sul trascrittoma, come mostrato dalla PCA (Figura 3-figure supplement 3A). Al contrario, l’espressione delle otto TF ha cambiato radicalmente le cellule Endo ed eVSM. È interessante notare che il gruppo eVSM +dox si è raggruppato strettamente alle condizioni Endo -dox e Endo +dox, ma lontano dal gruppo eVSM -dox. L’analisi dei geni espressi in modo differenziale (DEG) ha evidenziato i geni responsabili di questi cambiamenti (Figura 3-figure supplement 3B e Supplementary file 5). L’analisi dell’ontologia genica (GO) dei DEG ha mostrato che la sovraespressione delle otto TF ha portato allaridotta espressione dei geni coinvolti nello sviluppo della vascolarizzazione e del cuore, mentre c’è stato un aumento dell’espressione dei geni legati al sistema immunitario e allo sviluppo della vascolarizzazione per l’eVSM (compatibile con la doppia identità endoteliale-ematopoietica dei Pre-HSPC) e la disintossicazione cellulare così come le vescicole per l’endo (Figura 3-figure supplement 4A). Sorprendentemente, confrontando questi DEG con i 927 bersagli dell’eptad identificati da ChIP-seq, la sovrapposizione è stata di soli 26 geni (Figura 3-figure supplement 4B e C). Questo suggerirebbe che i DEG che abbiamo osservato non erano una diretta conseguenza del complesso di otto TF che si legano agli elementi regolatori di questi geni.

Per scoprire se l’effetto sorprendente delle otto TF è realmente dovuto all’espressione di diversi di questi geni e non all’effetto di un particolare fattore di trascrizione, abbiamo generato otto linee ESC inducibili per ciascuno dei singoli fattori di trascrizione (i1TF) (Figura 3-figure supplement 5A). L’espressione inducibile di ogni TF è stata confermata utilizzando western blot (Figura 3-figure supplement 5B). Utilizzando lo stesso schema sperimentale utilizzato in precedenza per i8TF e linee ESC vuote, abbiamo eseguito i saggi BL-CFC e le analisi FACS con queste otto nuove linee ESC e studiato l’effetto del trattamento dox su ciascuna di esse. Abbiamo scoperto che nessuna delle linee i1TF era qualitativamente simile alle i8TF (Figura 3-figure supplement 5C e D).

Per distinguere meglio le popolazioni cellulari differenziate, abbiamo ripetuto la cultura BL-CFC con il trattamento -dox / +dox per le dieci linee cellulari seguite da sc-q-RT-PCR dei 95 geni utilizzati in precedenza (Figura 4 e file supplementare 6). In totale, 854 cellule sono state elaborate utilizzando sc-q-RT-PCR e superato il controllo di qualità. Sei cluster di cellule biologicamente rilevanti possono essere identificati utilizzando l’analisi gerarchica di clustering, e sono stati assegnati i nomi in base all’espressione dei geni marcatori specifici (Figura 4A). I gruppi Endo, VSM e Pre-HSPCs sono stati definiti come prima (Figura 1). D’altra parte, gli HSPC sono stati suddivisi in tre gruppi: Cellule Progenitrici Eritroidi I e II (EryPCs_I e EryPCs_II, rispettivamente) e Cellule Progenitrici Mieloidi (MyePC). EryPCs_I ed EryPCs_II erano caratterizzate dall’espressione di geni eritroidi come Gata1 e Hbb-bh1. EryPCs_I sembrava essere più immaturo di EryPCs_II perché le cellule esprimono ancora un alto livello di Itgb3 e Pecam1. I MyePCs erano caratterizzati dall’espressione di marcatori mieloidi come Sfpi1 (o Pu.1) e Itgam e dalla mancanza di geni eritroidi.

Per ogni cluster, il numero di cellule per condizione è stato calcolato e ogni condizione +dox è stato statisticamente confrontato con tutte le condizioni -dox (Figura 4B e Figura 4-figure supplement 1). Questa analisi ha confermato che dopo l’aggiunta di dox, le cellule i8TFs i8TFs formano una popolazione Pre-HSPCs co-espressione dei geni endoteliali ed ematopoietici, come suggerito dai risultati della citometria a flusso. Al contrario, nessuna delle altre linee cellulari ha presentato un cambiamento così drammatico. L’induzione di Gata2 ha aumentato la frequenza della popolazione EryPCs_II di ~ 4 volte (Figura 4B). D’altra parte, la sovraespressione di Erg e Fli1 ha dato luogo a un po ‘più Pre-HSPCs (Figura 4B). Le altre linee i1TF ESC avevano cambiamenti trascurabili al trattamento dox (Figura 4B e Figura 4-figure supplement 1).

I nostri risultati sc-q-RT-PCR suggeriscono che le cellule erano omogenee dopo l’induzione delle otto TF. Per confermare questa osservazione, abbiamo effettuato il sequenziamento di RNA a cella singola (sc-RNA-seq) su i8TFs -dox, i8TFs +dox, Empty -dox e Empty +dox cellule utilizzando la piattaforma iCELL8 (Figura 4-figure supplement 2A). Anche in questo caso, PCA ha mostrato che i8TFs + cellule dox sono stati chiaramente raggruppati separatamente dalle altre cellule (Figura 4-figure supplemento 2B). Sulla base della varianza PC2, abbiamo notato che c’è meno varianza per le cellule i8TFs +dox rispetto alle altre tre condizioni. Nel complesso, questo suggerirebbe che le cellule i8TFs +dox sono relativamente più omogenee rispetto alle cellule di controllo.

I Pre-HSPC generati in vitro condividono le somiglianze con i Pre-HSC AGM di tipo I

Per meglio caratterizzare le cellule i8TFs +dox rispetto alle popolazioni embrionali, abbiamo esaminato il modello di espressione delle proteine CD41, CD43 e CD45 insieme al VE-cad. È stato dimostrato che questi marcatori potrebbero definire in modo più preciso diverse fasi intermedie del processo EHT: Pro-HSCs (VE-Cad+ CD41+ CD43+ CD43-^CD45-^{), Pre-HSCs} tipo I (VE-Cad+ CD41+ CD43+ CD45-) e Pre-HSCs tipo II (VE-Cad+ CD41+ CD43+ CD45+) (Rybtsov et al., 2014). I nostri risultati mostrano che circa il 99% delle cellule VE-cad+ nella condizione i8TFs +dox hanno un fenotipo simile ai Pro-HSC (Figura 5A e B). Per verificare questo risultato, abbiamo isolato da E10 AGM le popolazioni Pro-HSCs e Pre-HSCs tipo I ed eseguito sc-q-RT-PCR con il nostro set di 95 geni (Figura 5-figure supplement 1A e B). È interessante notare che la popolazione Pro-HSCs era eterogenea. Anche se tutte le cellule esprimono un alto livello di geni endoteliali, solo la metà esprime geni del sangue come Runx1, Gfi1, Sfpi1 e Myb. Al contrario, i Pre-HSCs di tipo I sono più omogenei. Tutte le cellule esprimono i geni endoteliali, ma ad un livello più basso rispetto ai Pro-HSC. Inoltre, tutte le cellule esprimono i geni ematopoietici (Figura 5-figure supplement 1B). Quando abbiamo analizzato queste cellule insieme con i dati in vivo dalla Figura 1A e le cellule da i8TFs -dox e +dox culture, abbiamo notato che circa la metà dei Pro-HSCs raggruppati con Endo, mentre l’altra parte raggruppati con il Pre-HSPC (Figura 5C). D’altra parte, i Pre-HSCs tipo I raggruppati con i Pre-HSPC. Sorprendentemente, in opposizione al loro fenotipo Pro-HSCs, abbiamo trovato che gli i8TFs +dox erano molto vicini ai Pre-HSCs tipo I (Figura 5C). Ciò è stato confermato quando l’analisi è stata fatta senza le sette TF (Figura 5-figure supplement 1C) e quando i dati qRT-PCR a singola cella delle 1.660 celle delle Figure 1, 4 e 5 sono stati combinati (Figura 5-figure supplement 2).

In conclusione, anche se le cellule i8TFs +dox avevano un fenotipo simile a quello delle Pro-HSC, il loro profilo trascrizionale era più simile a quello delle Pre-HSC di tipo I.

Identificazione della rete di regolazione genica a partire dai dati di sequenziamento dell’RNA monocellulare

Per determinare come l’induzione delle 8TF da trattamento dox abbia influenzato i GRN con l’utilizzo di monocellule-RNA-seq, abbiamo deciso di concentrarci sulle cellule VSM perché, a differenza della popolazione Endo, non sono naturalmente sottoposte a EHT (Figura 3-figure supplement 2C). Infatti, tra Endo +dox e Endo -dox, c’è stato solo un raddoppio della popolazione VE-Cad+ CD41+. D’altra parte, c’è stato un aumento di dieci volte della popolazione VE-Cad+ CD41+ tra eVSM +dox ed eVSM -dox (Figura 3-figure supplement 2C). Inoltre, questa popolazione mostra il maggior contrasto di espressione genica nei nostri dati microarray al trattamento con dox, facilitando l’identificazione dei GRN controllati dalle otto TF (Figura 3-figure supplement 3B). Come negli esperimenti microarray, le cellule VE-Cad-^CD41-^{sono state} ordinate al giorno 1 della coltura BL-CFC e coltivate in assenza o presenza di dox per 24 ore. Successivamente, le cellule delle condizioni -dox e +dox sono state messe in pool con un rapporto 1:1 e messe su un chip Fluidigm C1. Il sistema Fluidigm ha permesso una sensibilità più elevata rispetto al sistema Wafergen, ma non ha permesso l’elaborazione di diverse condizioni e di un gran numero di cellule allo stesso tempo. Il progetto sperimentale in cui le celle venivano mescolate e caricate su un unico chip minimizzava la variabilità tecnica che sarebbe emersa invariabilmente dall’uso di due chip separati (Figura 6-figure supplement 1A). Abbiamo ottenuto due repliche biologiche, e da ogni chip 96 cellule (192 cellule in totale) sono state isolate e sequenziate insieme. Per determinare quali cellule sono state esposte al dox abbiamo usato l’espressione del transgene (Figura 6-figure supplement 1B). Un PCA dei dati di sequenziamento ha mostrato che le cellule che esprimono alti livelli di trascrizioni 8TFs si sono raggruppate separatamente da quelle che esprimono bassi livelli di queste trascrizioni (Figura 6-figure supplement 1C).

Per identificare le relazioni di regolazione per le otto TF, abbiamo eseguito un’analisi di rete utilizzando la misura di correlazione generalizzata della distanza, dcor statistic (Székely et al., 2007), insieme alla sua versione condizionale pdcor (Székely e Rizzo, 2014). Questa misura ha il vantaggio di poter rilevare sia le relazioni lineari che non lineari tra il trascrittoma e i geni del seme. Tuttavia, quando solo le otto TF sono state utilizzate come semi, la rete risultante era molto piccola, con solo cinque delle otto TF rappresentate (non mostrate). Così, abbiamo ampliato l’insieme dei geni del seme per includere Gata1, Gfi1b, Spi1 (o Pu.1), Ldb1 e Cbfa2t3, che sono noti per giocare ruoli importanti nell’emopoiesi. Utilizzando questo insieme esteso di geni, abbiamo ottenuto una rete che illustra come le otto TF interagiscono indirettamente attraverso un percorso di regolazione comune (Ferreira et al., 2005; Goardon et al., 2006; Imperato et al., 2015; Lancrin et al., 2012; Mylona et al., 2013). La direzionalità delle relazioni, correlazione positiva o correlazione negativa, è stata definita utilizzando il segno di un t-test a due code (le coppie di geni con p>0,05 sono state assegnate ad “altro”). Infine, le interazioni tra i geni del seme sono state identificate condizionando i “bersagli” di ogni gene del seme sull’espressione di ogni altro gene del seme. Un’interazione è stata dedotta se le relazioni tra entrambi i geni del seme e un particolare gene ‘target’ aumentavano di forza quando si condizionava l’altro gene del seme.

Quando abbiamo visualizzato la rete risultante, abbiamo tracciato solo i semi che hanno interagito con almeno un altro seme (linee nere) e il gene bersaglio di almeno due interazioni di semi (Figura 6A). Coerentemente con le evidenze della letteratura, il nostro metodo di ricostruzione della rete riporta una stretta interazione tra i fattori del seme, a parte Lbd1, sono tutti inclusi nella rete risultante. Inoltre, osserviamo una rete centrale composta da Erg, Lyl1, Lmo2, Tal1, Gfi1b, e Gata1 con Fli1 e Runx1 alle estremità opposte della periferia. Molti dei geni che sono stati identificati come bersagli dei geni del seme erano anche noti dalla letteratura; per esempio, Gpr56, che è stato upregulated nel nostro esperimento microarray dopo il trattamento dox (Figura 3-figure supplemento 4C), e Nfe2 (Wilson et al., 2010; Woon Kim et al., 2011). Inoltre, molti dei target erano stati precedentemente identificati come espressi in modo differenziato dopo il trattamento dox (Figura 3-figure supplement 4C, file supplementare 5).

Incoraggiati dai risultati dell’analisi dcor, abbiamo effettuato un’analisi a livello genomico. Poiché Dcor è un metodo di correlazione lenta, era computazionalmente impossibile calcolare la rete globale con esso. Per questo motivo abbiamo utilizzato la correlazione Spearman, un metodo di correlazione molto veloce. Abbiamo combinato i due set di dati e abbiamo mantenuto tutte le correlazioni in cui il valore assoluto della correlazione media era maggiore di 0,25 e in cui il segno era coerente attraverso le normalizzazioni Remove Unwanted Variation (RUV) e Size Factors (SF). Ne è risultata una rete contenente 7.262 geni e 163.474 bordi di cui 123.394 positivi e 40.080 negativi. È importante notare che 11 dei 13 geni dei semi utilizzati nell’analisi precedente sono stati trovati in questa grande rete: Cbfa2t3, Fli1, Gata2, Lmo2, Erg, Tal1, Gfi1b, Gata1, Runx1, Spi1 e Lyl1. Inoltre, tra i 145 geni che contengono picchi di eptad entro 1 kb dal loro TSS, 26 sono stati trovati nella rete, anche se questo non è stato significativamente più di quanto ci si aspettasse per caso (p>0.1, Fisher-exact test).

Per identificare i geni più importanti nella rete, abbiamo calcolato tre diverse misure di centralità (grado, betweenness e eigen) (Figura 6B). Il numero di geni tra gli 11 geni del seme con valori superiori alla mediana era significativamente più alto di quello previsto per tutte e tre le misure (grado p-valore=0,0005, betweenness p-valore=0,006, eigen p-valore=0,03). È interessante notare che, per i 26 obiettivi di eptad, solo il betweenness presentava un numero di obiettivi superiore alla mediana superiore a quello che ci si aspettava per caso (p-valore p=0,04). Questo evidenzia il ruolo centrale atteso dei target di heptad per la loro posizione “nel mezzo” dei principali attori della rete.

Poiché il Grp56 è apparso come uno dei principali candidati nelle nostre due analisi di rete, lo abbiamo scelto per ulteriori esperimenti (Figura 6C). Il Gpr56 ha dimostrato di essere espresso nei cluster ematopoietici dell’aorta (Solaimani Kartalaei et al., 2015) e di essere upregolato lungo l’EHT (Goode et al., 2016). I dati di ChIP-seq (Wilson et al., 2010) mostrano che ci sono due elementi regolatori Gpr56 legati da sette delle otto TF nella linea cellulare HPC7 (Figura 6C). Abbiamo selezionato questi potenziatori putativi e li abbiamo clonati in un plasmide a monte del gene Firefly luciferase reporter. Un test gene reporter nella linea i8TFs ESC ha dimostrato che l’induzione delle otto TF ha portato ad un forte aumento dell’espressione del gene della luciferasi con i due stimolatori Grp56 (Figura 6C). In conclusione, siamo stati in grado di dedurre GRNs sulla base dei dati sc-RNA-seq. Abbiamo identificato gli attori chiave interessati dall’induzione delle otto TF, tra cui il Gpr56 era un importante gene target.

L’analisi della rete di regolazione del gene rivela effetti contrastanti di Runx1 e Fli1

L’espressione simultanea degli otto fattori ha portato alla formazione di una popolazione simile ai Pre-HSPC attraverso la loro azione specifica sui GRN. Non era chiaro, tuttavia, perché le cellule fossero bloccate in questo stadio intermedio normalmente ‘transitorio’ dell’EHT. Per svelare questo, abbiamo applicato la nostra analisi di rete ad un set di dati sc-RNA-seq di cellule endoteliali e HSPC, prima e dopo l’EHT, rispettivamente (Pereira et al., 2016). Abbiamo generato una rete utilizzando gli stessi semi di prima (Figura 6A), e la caratteristica più sorprendente della nuova rete è che Fli1 e Runx1 condividono diversi obiettivi, ma con direzioni opposte di correlazione (Figura 7A). Un’analisi della rete a livello genomico basata sulle correlazioni di Spearman ha mostrato uno schema simile in cui 210 geni sono stati correlati sia a Fli1 che a Runx1 ma in direzioni opposte (Figura 7B e file supplementare 9). Inoltre, l’analisi GO ha rivelato che i geni la cui espressione è positivamente correlata con Fli1 e negativamente correlata con Runx1 (rettangolo giallo) sono arricchiti per i termini sviluppo vascolare, angiogenesi e migrazione cellulare (Figura 7-figure supplemento 1A). D’altra parte, i geni la cui espressione è positivamente correlata con quella di Runx1 e negativamente correlata con quella di Fli1 (rettangolo verde) sono associati al processo del sistema immunitario termine GO (Figura 7-figure supplement 1A). Quindi, Runx1 è più associato con i geni ematopoietici, mentre Fli1 è più associato con i geni vascolari. È interessante notare che i dati di ChIP-seq di Wilson et al. (2010) hanno mostrato che 77 dei 210 sono bersagli diretti sia di Runx1 che di Fli1 (Figura 7-figure supplement 1B e Supplementary file 9). La correlazione osservata opposta potrebbe essere dovuta al fatto che la maggior parte delle cellule endoteliali esprimono solo Fli1 e non Runx1, mentre HSPC co-esprimono Runx1 e Fli1. Vi è infatti un chiaro spostamento nella relativa espressione di Fli1 rispetto a quella di Runx1 tra i due stadi cellulari (Figura 7-figure supplemento 1C). In conclusione, la nostra analisi della rete ha rivelato che Fli1 e Runx1 sono collegati a 210 geni ma con correlazioni opposte, che potrebbero essere legate ai contrastanti schemi di espressione di Fli1 e Runx1 e/o alle opposte proprietà funzionali di queste TF.

L’analisi del guadagno di funzione rivela un equilibrio funzionale tra Gata2/Runx1 e Erg/Fli1 TFs durante la transizione da endoteliale a ematopoietico

Per scoprire se Runx1 e Fli1 hanno effetti funzionali opposti sulle decisioni sul destino delle cellule che si verificano durante l’EHT, abbiamo riesaminato la nostra analisi del guadagno di funzione i1TF (Figura 3-figure supplement 5 e Figura 4B). In base a questi risultati, abbiamo identificato due gruppi principali di TF. Il primo include Fli1 ed Erg mentre il secondo include Runx1 e Gata2. Infatti, in condizione +dox, iFli1 e iErg hanno entrambi mostrato un aumento della popolazione Endo così come della popolazione Pre-HSPCs, anche se ad un livello molto più basso che con i8TFs (Figura 4B). Al contrario, le celle iRunx1 e iGata2 hanno mostrato un aumento della frequenza nella popolazione EryPCs_II e una diminuzione della popolazione MyePCs nella condizione +dox (Figura 4B). Questo risultato è coerente con l’ipotesi che alcune delle otto TF abbiano effetti opposti.

Abbiamo poi valutato le conseguenze funzionali della rimozione di Runx1/Gata2 o Erg/Fli1 dal costrutto 8TFs. Abbiamo ipotizzato che la rimozione di Runx1 e Gata2 aumenterebbe il destino delle cellule endoteliali, mentre la rimozione di Erg e Fli1 aumenterebbe il destino delle cellule ematopoietiche. Di conseguenza abbiamo generato due linee di ESC aggiuntive (Figura 8A). La prima, i6TFs, contiene 6TFs che si trovano anche in i8TFs ma è senza Erg e Fli1. La seconda, i5TFs, manca di Runx1, Gata2 così come Cbfb, partner cruciale di Runx1. Abbiamo eseguito la differenziazione ESC di queste linee cellulari nello stesso modo di prima e abbiamo analizzato le conseguenze della sovraespressione di questi due gruppi di TF. È interessante notare che la sovraespressione delle cinque TF ha in parte ricapitolato l’effetto della sovraespressione delle otto TF e ha portato ad un chiaro aumento della frequenza di VE-cad+ CD41+ (Figura^8B). Notevolmente, anche la frequenza della popolazione di VE-Cad+ CD41- è aumentata significativamente, in netto contrasto con quanto osservato con le otto TF (Figura 3A e Figura 8B). Coerentemente con questo risultato, c’è stata una netta diminuzione del numero di cellule rotonde formatesi durante il saggio BL-CFC (Figura 8C). Al contrario, la sovraespressione delle sei TF ha avuto solo un impatto minore sul modello di espressione di VE-cad e CD41 (Figura 8B). Tuttavia, vi è stato un chiaro aumento delle cellule ematopoietiche rotonde come mostrato dall’analisi delle immagini, suggerendo un miglioramento della formazione delle cellule del sangue (Figura 8C). L’impatto osservato dell’induzione sul numero di cellule rotonde è stato confermato in particolare con cellule endoteliali isolate al giorno 1 BL-CFC e coltivate per due giorni in presenza di doxiciciclina in mezzo HE (Figura 8D e Figura 8-figure supplement 1A). Inoltre, sc-q-RT-PCR eseguita sul i5TFs e i6TFs confermato questa dualità (Figura 8E e Figura 8-figure supplement 1B). L’i5TFs ha mostrato una diminuzione dei progenitori ematopoietici EryPCs_I associata ad un aumento della popolazione Endo e Pre-HSPC, mentre l’i6TFs ha mostrato un aumento della popolazione EryPCs_II di progenitori ematopoietici (Figura 8E e Supplemento 10).

In conclusione, questi risultati suggeriscono che Fli1 e Erg da un lato e Runx1 e Gata2 dall’altro lato hanno effetti opposti sulle decisioni del destino cellulare nell’emopoiesi che portano alla formazione di Pre-HSPC.

Discussione

In questo studio, abbiamo utilizzato la trascrittomica monocellulare per definire tre popolazioni principali nella vascolarizzazione embrionale durante la formazione del sangue: cellule endoteliali, cellule staminali pre-ematopoietiche/progenitrici e cellule staminali ematopoietiche/progenitrici. Mentre questi risultati sono stati inizialmente ottenuti con un singolo lotto di embrioni, tutti i modelli chiave sono stati riprodotti in un lotto separato in un ulteriore studio (Morgan Oatley, risultati non pubblicati). Nonostante le lievi differenze temporali, ci sono state forti somiglianze nell’espressione genica tra il sacco vitellino e l’AGM EHT, suggerendo un processo simile in entrambi i siti. Tuttavia, a causa della circolazione sanguigna, non possiamo escludere lo scambio cellulare tra questi due siti.

Le analisi Bulk ChIP-seq hanno suggerito che Erg, Fli1, Tal1, Lyl1, Lmo2, Runx1 e Gata2 lavorano insieme come heptad (Wilson et al., 2010). Qui, mostriamo per la prima volta che i geni heptad sono specificamente coespresi a livello monocellulare all’interno dei Pre-HSPC, e che questa combinazione non è stata trovata in nessun’altra popolazione lungo la transizione. Questa specifica co-espressione può essere conservata nella specie umana, come è stato dimostrato recentemente nel sistema in vitro del modello EHT umano che la popolazione intermedia tra cellule endoteliali e cellule del sangue co-espressiva Runx1, Lyl1, Tal1, Gata2, Erg e Fli1 (Lmo2 non è stato valutato) a livello monocellulare (Guibentif et al., 2017) in modo simile alla popolazione Pre-HSPC che abbiamo descritto. A differenza di Guibentif et al. (2017), abbiamo indagato il significato funzionale della co-espressione di questi fattori di trascrizione. Abbiamo dimostrato che la loro espressione forzata, insieme a quella del Cbfb, durante la differenziazione ematopoietica ha dato origine ai Pre-HSPC in cultura. Questo suggerisce che la coespressione dei geni heptad è necessaria per le cellule per raggiungere la fase transitoria dei Pre-HSPCs prima di perseguire la transizione.

Questi risultati sono coerenti con l’ipotesi dell’esistenza di un complesso proteico heptad. Sorprendentemente, solo il dieci per cento dei geni espressi differenzialmente sono bersagli heptad e solo il dieci per cento dei bersagli heptad sono espressi differenzialmente. Questo suggerisce che i cambiamenti di espressione genica che abbiamo osservato non erano una diretta conseguenza del legame del complesso delle otto TF agli elementi regolatori di questi geni. Ciò implica che la formazione di Pre-HSPCs è probabilmente dovuta ad una combinazione di funzioni individuali che agiscono sui GRNs piuttosto che alla sola azione di un complesso di otto proteine.

Per definire questi GRN, abbiamo sviluppato una pipeline bioinformatica per i dati sc-RNA-seq. Abbiamo caratterizzato le strette relazioni coinvolte nella formazione di Pre-HSPCs, dando così direzionalità alle interazioni proteina-DNA precedentemente identificate da ChIP-seq (Goode et al., 2016; Wilson et al., 2010). Le analisi di rete del dataset di Pereira (Pereira et al., 2016) insieme ai nostri risultati in vitro hanno rivelato una nuova e inaspettata relazione opposta tra le funzioni Runx1 e Fli1. Inoltre, questa rete suggerisce che Gata2 e Lmo2 potrebbero agire come co-regolatori cooperativi con Runx1 e Fli1, rispettivamente (Figura 7A).

Sulla base dei nostri dati e di quanto è noto in letteratura, proponiamo il seguente modello (Figura 9). Inizialmente, il programma di destino delle cellule endoteliali è guidato da Erg e Fli1, entrambi fattori di trascrizione ETS, che è coerente con le nostre analisi funzionali (Figura 3-figure supplement 5D e Figura 4) e gli studi pubblicati prima (Asano et al., 2010; McLaughlin et al., 2001). Inoltre, Wilson et al. (2010) hanno dimostrato che oltre il 90% dei loci target di Fli1 sono anche target di Erg nella linea cellulare HPC7, suggerendo una ridondanza funzionale. Comincia quindi l’espressione di Runx1 e questo – insieme all’espressione di Gata2, che ha funzione pro-ematopoietica – avvia il programma trascrizionale ematopoietico. I dati precedenti supportano questa interazione funzionale come Runx1+/-^::Gata2+/- embrioni eterozigoti composti non sono vitali a causa dei loro gravi difetti ematopoietici, rafforzando la nozione che le due proteine sono coinvolte nello stesso processo biologico (Wilson et al., 2010). In questa fase intermedia di Pre-HSPCs, i geni endoteliali sono progressivamente ridimensionati, come dimostrano i nostri dati. Come Fli1 e l’espressione del gene Erg rimangono stabili tra le fasi Endo e Pre-HSPCs, questo potrebbe essere spiegato da un cambiamento funzionale per questi fattori a favore del destino delle cellule ematopoietiche e una diminuzione della frazione dedicata al mantenimento del programma endoteliale a livello di singola cellula. In particolare, Fli1 può essere coinvolto sia nell’espressione genica endoteliale che ematopoietica a seconda del contesto cellulare. Infatti, in presenza di Runx1, Fli1 potrebbe potenzialmente attivare geni bersaglio comuni come Gfi1 e Gfi1b, che sono coinvolti nella repressione dell’espressione genica endoteliale (Lancrin et al., 2012; Thambyrajah et al., 2016; Wilson et al., 2010). In alternativa (o in concomitanza), Runx1 e Fli1 potrebbero legarsi insieme sui loci del gene endoteliale come mostrato per Sox17 (Lichtinger et al., 2012) e reprimere la loro espressione. D’altra parte, Fli1 potrebbe cambiare la sua funzione su interazione fisica con Runx1, come mostrato durante la differenziazione megacariocitica dove c’è una attivazione sinergica trascrizionale su interazione Fli1-Runx1 (Huang et al., 2009).

Alla fine dell’EHT, negli HSPC, il programma endoteliale è completamente soppresso insieme all’espressione di Erg. In questa fase di sviluppo, Fli1 è completamente dedicato al programma del destino delle cellule ematopoietiche e lavora con Runx1 per portare avanti lo sviluppo delle cellule del sangue. Questo è supportato dall’osservazione che quasi tutti i geni target di Runx1 specifici per gli HSPC sono anche legati a Fli1 (file supplementare 9).

In conclusione, il nostro lavoro fornisce un’importante intuizione sul passaggio tra i destini delle cellule endoteliali ed ematopoietiche che è necessario per la formazione delle cellule del sangue. Abbiamo identificato i Pre-HSPC come la fase fondamentale di questo processo, in cui si svolge una competizione tra i programmi di sviluppo a livello di singola cellula. L’espressione dell’eptad delle TF è direttamente collegata a questa fase di transizione. L’equilibrio dell’attività di Erg, Fli1, Gata2 e Runx1 sembra avere il ruolo più importante nell’EHT, mentre l’asse Tal1/Lmo2/Lyl1 potrebbe avere un ruolo essenziale nell’adescamento. Infatti, Tal1 agisce come un repressore di programmi cellulari alternativi come il lignaggio cardiaco ed è attivamente necessario per avviare l’EHT (Lancrin et al., 2009; Org et al., 2015). In questo contesto, il nostro approccio alla trascrittomica monocellulare ci ha permesso di far luce su un cambiamento inaspettato dell’attività di Fli1 come conseguenza dell’espressione Runx1. Questo sembra essere un processo critico per il corretto completamento dell’EHT. Le condizioni che rafforzano l’interazione tra Runx1 e Fli1 probabilmente aiuterebbero a inclinare l’equilibrio verso il destino della cellula ematopoietica. Allo stesso modo, prevenire l’interazione Fli1-Runx1 potrebbe potenzialmente compromettere la formazione di cellule del sangue da endotelio.

Più in generale, una doppia funzione concorrente per un fattore di trascrizione unico potrebbe essere un processo chiave per altre transizioni dello sviluppo come l’epitelio alla transizione mesenchimale. L’approccio bioinformatico che abbiamo utilizzato in questo lavoro potrebbe essere facilmente applicabile allo studio di altri processi di sviluppo e potrebbe aiutare ad affrontare questo tipo di domande. Infine, la discrepanza osservata in questo lavoro tra analisi di massa e analisi monocellulare potrebbe esistere anche in altri studi di complessi TF, che potrebbero indurre i ricercatori in diversi campi a rivedere le ipotesi precedenti utilizzando il nostro approccio.

Materiali e metodi

Modello sperimentale e dettagli del soggetto

Animali

C57BL/6 N, Gfi1:GFP (Yücel et al., 2004) e Gfi1b:GFP (Vassen et al., 2007) sono state utilizzate linee di mouse. Gfi1+/GFP e Gfi1b+/GFP sono stati incrociati tra loro per generare animali Gfi1+/GFPGfi1b+/GFP. Questi animali sono stati poi utilizzati per l’accoppiamento a tempo per generare embrioni a doppia uscita Gfi1GFP/GFPGfi1bGFP/GFP/GFP. L’accoppiamento temporizzato è stato impostato e la mattina del rilevamento del tappo vaginale è stato considerato il giorno 0,5. Gli embrioni sono stati messi in scena secondo le proprietà morfologiche. Tutti gli esperimenti sono stati eseguiti in conformità alle linee guida e alle normative definite dalla legislazione europea e italiana (Direttive 2010/63/UE e DLGS 26/2014, rispettivamente). 6. Tutti i topi sono stati allevati e mantenuti presso l’EMBL Rome Mouse Facility in conformità alla legislazione europea e italiana (Direttive UE 634/2010 e DLGS 26/2014, rispettivamente).

Linee cellulari

Generazione di linee di CES inducibili

Tutte le linee ESC inducibili con doxiciclina sono state generate utilizzando il metodo di scambio a cassette inducibili descritto in precedenza (Iacovino et al., 2011; Vargel et al., 2016). Per le linee ESC iCbfb, iRunx1, iLmo2, iGata2 e iFli1, le sequenze di codifica del fattore di trascrizione sono state etichettate in 5′ con un 8His-tag e amplificate mediante PCR da cDNA ESC differenziato. Le sequenze di codifica 8His-tag sono state poi inserite in un pGEM-t-easy prima della clonazione nel plasmide p2lox. Per iTal1, iLyl1 e iErg, le sequenze di codifica 8His-tagged sono state sintetizzate e clonate in un pUC57 Simple dal GenScript Gene Synthesis Service (http://www.genscript.com/ gene_synthesis.html). Le sequenze di codifica 8His-tagged sono state poi clonate dalla pUC57 Simple nel plasmide p2lox. Per ciascuno dei plasmidi p2lox generati, una sequenza Kozak è stata poi aggiunta al codone iniziale mediante clonazione PCR. I plasmidi p2lox successivi sono stati utilizzati per trasfettare la linea ESC A2lox.Cre e per generare la linea ESC a singolo fattore inducibile come descritto in precedenza (Vargel et al., 2016). Per la linea di ESC i8TFs, tre costrutti individuali sono stati sintetizzati e clonati in un plasmide pUC57 dal GenScript Gene Synthesis Service. Il primo costrutto è stato composto dalla sequenza di codifica per V5-Erg-T2A-V5-Lmo2. Construct due era composto dalla sequenza di codifica per HA-Tal1-T2A-cmyc-Fli1-T2A-FLAG-Lyl1-T2A. La costruzione tre era composta dalla sequenza di codifica per FLAG-Runx1-T2A-FLAG-Cbfb-T2A-HA-HA-Gata2-T2A. Tutti e tre i costrutti sono stati affiancati da un codice di avvio e due codici di arresto, insieme ai siti di restrizione adeguati per la clonazione nel plasmide p2lox, al fine di consentirne l’uso individuale. Essi contengono anche siti di restrizione specifici per la loro escissione, l’aggiunta di uno qualsiasi degli altri costrutti, o la rimozione di una qualsiasi delle sequenze di fattori. Ne è stato clonato uno insieme al codice di partenza e due codici di arresto nel plasmide p2lox. Poi, Construct two è stato aggiunto tra il codice di partenza e Construct one per clonazione classica. Infine, Construct three è stato aggiunto tra il codice di partenza e Construct two per ottenere il p2lox-8TFs. Questo plasmide è stato poi trasformato nella linea A2lox.Cre ESC per la generazione degli i8TFs. Per gli i5TFs, il costrutto intermedio p2lox contenente Construct one e Construct two è stato usato per generare la linea ESC. Per gli i6TFs, V5-Erg e cmyc-Fli1 sono stati successivamente eliminati dai p2lox-8TFs mediante clonazione classica per generare i p2lox-6TFs utilizzati per la generazione delle linee di ESC inducibili. La linea di ESC vuota è stata generata utilizzando il plasmide p2lox di base e seguendo la stessa procedura. Per ogni linea di ESC inducibile, è stato selezionato un clone in base all’induzione dell’espressione di trascrizione misurata da qPCR e convalidata dall’analisi western blot.

Identificazione delle linee cellulari

Tutte le linee cellulari utilizzate in questo lavoro erano linee mESC. La linea mESC Runx1+/hCD4 è stata generata nel gruppo di Georges Lacaud dall’autore corrispondente, Christophe Lancrin (Sroczynska et al., 2009a). Tutte le linee mESC di derivazione A2lox.Cre sono state generate dalla linea A2lox.Cre mESC, che è stata regalata da Michael Kyba che l’ha prodotta nel suo laboratorio (Iacovino et al., 2011). Tutte le linee mESC di derivazione A2lox.Cre sono state generate nel nostro laboratorio come descritto nella sezione “Generazione di linee ESC inducibili”. Tutte le linee di CSE avevano una morfologia corretta delle cellule staminali e sono state in grado di dare origine a sangue e cellule endoteliali dopo la differenziazione in vitro (Figura 1D, Figura 3, Figura 3-figure supplementi 1 e 5, Figura 8 e Figura 8-figure supplemento 1A). Tutte le linee mESC inducibili sono state verificate con l’analisi di Western Blot e qPCR (Figura 2, Figura 3-figure supplement 5, Figura 4 e Figura 8-figure supplement 1B).

Tutte le linee cellulari utilizzate in questo manoscritto sono state testate negative per la contaminazione da micoplasma.

Manutenzione e differenziazione delle linee di ESC

La crescita e la differenziazione delle CSE sono state effettuate come descritto in precedenza (Sroczynska et al., 2009b). In breve, le CSE sono state mantenute su alimentatori in un mezzo di coltura di CSE in KnockOut DMEM (GIBCO) (integrato con 1% Pen/Strep [GIBCO], 1% L-Glutammina [GIBCO] e 1% NEAA [GIBCO]), 15% FBS (PAA), 0,0024% 1 mg/ml LIF (The Protein Expression and Purification Core Facility, EMBL-Heidelberg) e 0,24% 50 mM 2-mercaptoetanolo (GIBCO). Per la differenziazione, gli ESC sono stati seminati su piastre rivestite di gelatina (0,1% di gelatina [BDH] in PBS per 20 minuti) per un giorno nel normale terreno di coltura degli ESC e poi per un giorno in un terreno simile a quello degli ESC ma contenente IMDM (Lonza) al posto del KnockOut DMEM e senza supplemento NEAA.

Per ottenere corpi embrionali (EB), le cellule sono state successivamente raccolte e coltivate in scatole di Petri ad una densità di 0,3 × 106 cellule per^scatola da 10 cm2 con un mezzo EB fatto di IMDM (Lonza) (integrato con 1% Pen/Strep [GIBCO] e 1% L-glutammina [GIBCO]), 0,6% transferrina (Roche, Italia), 0,039% MTG (Sigma) e 50 mg / µl di acido ascorbico (Sigma). Dopo 3-3,25 giorni, gli EB sono stati raccolti e le cellule Flk1+ sono state selezionate utilizzando la tecnologia MACS MicroBead Technology (Miltenyi Biotec). Per la differenziazione degli emangioblasti, le cellule Flk1 + sono state poi coltivate su piastre rivestite di gelatina ad una densità di 0,01 × 106 cellule per cm2 in^un mezzo fatto di IMDM (Lonza), 1% Pen/Strep (GIBCO), 1% L-glutammina (GIBCO), 10% FBS (PAA), 0.6% transferrina (Roche), 0,039% MTG (Sigma), 0,5% acido ascorbico (Sigma), 15% D4T supernatante (EMBL-Monterotondo), 0,05% VEGF (10 µg/ml) (R e D) e 0,1% IL-6 (10 µg/ml) (R e D). Durante la differenziazione degli emangioblasti, la popolazione cellulare potrebbe essere ordinata e ulteriormente coltivata in condizioni di coltura emogenica dell’endotelio. A tal fine, le cellule ordinate sono stati seminati su piastre rivestite di gelatina ad una densità di 0,015 × 106 cellule per cm2 in^un mezzo specifico fatto di IMDM (Lonza), 1% Pen / Strep (GIBCO), 1% L-glutammina (GIBCO), 10% FBS (PAA), 0.6% transferrina (Roche), 0,039% MTG (Sigma), 0,5% acido ascorbico (Sigma), 0,0024% LIF (EMBL-Heidelberg), 0,25% SCF (20 µg/ml) (R e D), 0,1% oncostatina M (10 µg/ml) (R e D) e 0,01% bFGF/FGF2 (10 µg/ml) (R e D). Per perseguire la differenziazione con un saggio progenitore ematopoietico, le cellule sono state raccolte tre giorni dopo il tipo Flk1 dal tipo di coltura dell’emangioblasto (o l’endotelio emogeno) e placcato ad una densità di 3.3 × 103 cellule per cm2 in^un mezzo fatto di IMDM (Lonza), 1% Pen/Strep (GIBCO), 1% L-glutammina (GIBCO), 55% di 0,5 g/ml metilcellulosa (VWR), 15% PDS (Antec), 10% PFMH-II (GIBCO), 0.6% transferrina (Roche), 0,039% MTG (Sigma), 0,5% acido ascorbico (Sigma), 0,5% SCF (20 µg/ml) (R e D), 0,1% IL-3 (25 µg/ml) (R e D), 0,1% GM-CSF (25 µg/ml) (R e D), 0.04% IL-11 (12,5 µg/ml) (R e D), 0,2% EPO (10 µg/ml) (R e D), 0,2% IL-6 (5 µg/ml) (R e D), 0,2% TPO (12,5 µg/ml) (R e D) e 0,05% MCSF (10 µg/ml) (R e D). Le colonie sono state contate per tre repliche dopo 10-12 giorni.

Per il trattamento con doxiciclina della linea inducibile ESC, la doxiciclina (Sigma) è stata aggiunta direttamente al terreno di coltura ad una concentrazione finale di 1 µg/ml per 24 o 48 ore.

Dettagli del metodo

Dissezione embrionale

Le dissezioni del sacco vitellino e dell’AGM sono state eseguite come descritto in precedenza (Bertrand et al., 2005) e Robin e Dzierzak, 2005). In breve, i topi gravidi sono stati uccisi da una dislocazione cervicale tra E9.0 e E11 di gestazione. Sono state raccolte corna uterine; i tessuti materni sono stati rimossi così come la placenta per isolare gli embrioni. Il sacco vitellino è stato strappato delicatamente e separato dall’embrione vero e proprio strappando le arterie ombelicali e vitelline. Poi, le coppie somatiche degli embrioni sono state contate per determinare il loro stadio di sviluppo. Per isolare l’AGM, sono stati rimossi la testa, la coda, le gemme degli arti, gli organi ventrali e i somiti. I campioni di sacco vitellino e di AGM dello stesso stadio di sviluppo embrionale sono stati riuniti nello stesso tubo. Per generare sospensione monocellulare dai tessuti isolati, i campioni di sacca di tuorlo e AGM sono stati sottoposti a trattamento con collagenasi (Sigma) per 30 min. a 37°C. AGM e sospensioni cellulari del sacco vitellino sono stati poi utilizzati per la citometria a flusso.

Analisi Western blot

Le CSE sono state coltivate per due passaggi su gelatina per rimuovere i MEF prima di essere trattate con 1 µg/ml di doxiciclina (Sigma) per 24 ore. Per gli estratti di proteine intere, le cellule sono state raccolte utilizzando TrypLE express (GIBCO), lavate con PBS e lisate in buffer RIPA (Thermo Scientific) per 30 minuti a 4°C. I campioni sono stati poi centrifugati per 5 minuti ad alta velocità e i pellet sono stati scartati. Gli estratti nucleari sono stati preparati utilizzando il kit di estrazione nucleare (ActiveMotif) seguendo le istruzioni del produttore. La concentrazione di proteine è stata misurata utilizzando il kit di analisi delle proteine BCA Pierce (Thermo Scientific) e quantità uguali di campioni di proteine -dox e +dox sono stati caricati su NuPAGE Novex 10% o 12% di gel di proteine Bis-Tris (Life Technologies). La migrazione e il trasferimento a umido su una membrana di nitrocellulosa PROTRAN (PerkinElmer) sono stati eseguiti utilizzando il sistema di elettroforesi a mini celle XCell SureLock di Invitrogen. Le membrane sono state colorate con la soluzione Ponceau S (Sigma) per controllare l’efficienza di trasferimento e le quantità di proteine. Le membrane sono state poi lavate con TBST (TBS [20 mM Tris-Base, 154 mM NaCl, pH 7,5], 0,1% Tween 20) e bloccate con TBST +5% di latte per 45 minuti a RT. Le membrane sono state poi incubate ON a 4°C con anticorpi primari diluiti con TBST +1% di latte come segue: 1:2000 anti-FLAG (Sigma), 1:1000 anti-HA (Sigma), 1:2000 anti-V5 (Life Technologies), 1:5000 anti-Runx1 (Abcam), 1:5000 anti-Cbfb (Abcam), 1:2000 anti-Gata2 (Abcam), 1:2000 anti-Tal1 (Abcam), 1:2500 anti-Fli1 (Abcam), 1:5000 anti-Lyl1 (Abcam), 1:5000 anti-Erg (Abcam), 1:1000 anti-Lmo2 (Abcam), 1:2000 anti-His tag (Abcam), e 1:10000 anti-alfa-tubulina (Sigma) (l’ultimo usato come controllo del carico). Dopo l’incubazione degli anticorpi primari, le membrane sono state lavate tre volte con TBST e incubate per 45 minuti con anticorpi secondari coniugati con HRP diluito in TBST +1% nilk come segue: 1:10000 anti-Mouse HRP (GE Healthcare Life Sciences), 1:10000 anti-Rabbit HRP (Jackson) e 1:10000 anti-Rat HRP (GE Healthcare Life Sciences). Le membrane sono state sviluppate utilizzando l’ECL Prime Western Blotting Reagent di Amersham (GE Healthcare Life Sciences).

Fotografia time-lapse

Le colture di differenziazione cellulare sono state immaginate a partire dal momento dell’aggiunta di doxiciciclina. Le immagini a contrasto di fase sono state scattate con l’IncuCyte HD (Essen Biosciences) all’interno dell’incubatore, ogni 15 minuti, tre aree per pozzetto. I video time-lapse sono stati generati con il software delle Fiji (http://fiji.sc/Fiji) (Schindelin et al., 2012) utilizzando 10 fotogrammi al secondo. Le immagini sono state analizzate dal software CellProfiler (http://www.cellprofiler.org) (Kamentsky et al., 2011) per quantificare il numero di cellule rotonde con una pipeline personalizzata scritta da Christian Tischer dell’EMBL Heidelberg Advanced Light Microscopy Facility. Per ogni punto temporale, la media e la deviazione standard dei conteggi da tutti e tre i punti sono state calcolate per realizzare dei grafici con il software Microsoft Office Excel. Una spiegazione dettagliata su come sono state eseguite la fotografia time-lapse e l’analisi delle immagini è disponibile su Bio-protocollo (Bergiers et al., 2019)

Citometria a flusso e selezione delle cellule

La colorazione è stata effettuata come descritto in precedenza (Sroczynska et al., 2009b) e le analisi sono state eseguite con un FACSCanto (Becton Dickinson) o un FACSAria (Becton Dickinson). I tipi di cellule sono state eseguite con un FACSAria (Becton Dickinson) o utilizzando la selezione magnetica (MACS MicroBead Technology, Miltenyi Biotec) e anti-APC MicroBeads (Miltenyi Biotech). Gli anticorpi monoclonali anti-topo di ratto utilizzati sono stati anti-Topo CD309 (FLK1) APC (Avas12a1, eBioscience), anti-Topo CD41 PE (MWReg30, eBioscience), anti-Topo cKit APC (2B8, eBioscience) e anti-Topo CD144 (VE-Cadherin) eFluor 660 (eBioBV13, eBioscience). I dati FACS sono stati analizzati utilizzando il software FlowJo (Tree Star, Inc.).

Saggio del ciclo cellulare

I test del ciclo cellulare sono stati eseguiti utilizzando il kit Click-iT Plus EdU Alexa Fluor 488 Flow Cytometry Assay di Sonde Molecolari seguendo le istruzioni del produttore. In breve, le cellule dell’emangioblasto, o endotelio emogenico, sono state trattate con 10 µM di EdU per 1 ora. Le cellule sono state poi raccolte e colorate con Ghost Dye Red 780 (Tonbo Biosciences) per la colorazione dal vivo / morto prima della colorazione con anticorpi marcatori di superficie cellulare (anti-Mouse CD41 PE [MWReg30, eBioscience] e anti-Mouse CD144 [VE-Cadherin] eFluor 660 [eBioBV13, eBioscience]). Le cellule macchiate sono state fissate e permeabilizzate e la reazione Click-IT è stata eseguita seguendo le istruzioni del produttore. Infine, le cellule sono state colorate con Hoechst per l’etichettatura del DNA e analizzate con il FACSAria (Becton Dickinson). I dati FACS sono stati analizzati utilizzando il software FlowJo (Tree Star, Inc.).

Saggio di apoptosi

Le cellule provenienti da colture di emangioblasto sono state raccolte e colorate con anti-topo CD41 PE (MWReg30, eBioscience), anti-topo CD144 (VE-Cadherin) eFluor 660 (eBioBV13, eBioscience) e AnnexinV (eBioscience). Infine, le cellule sono state colorate con Sytox Blue per l’etichettatura del DNA e analizzate con il FACSAria (Becton Dickinson). I dati FACS sono stati analizzati con il software FlowJo (Tree Star, Inc.).

Saggio Luciferasi

Le sequenze dei due picchi di eptad trovati nel locus Gpr56 (Wilson et al., 2010) sono state sintetizzate e clonate dal GenScript Gene Synthesis Service in un pGL4.10[luc2] reporter plasmid (Promega), con ulteriori sequenze di 50 bp a monte e a valle per garantire una corretta copertura dei picchi. Il plasmide pGL4.74[hRluc/TK] Renilla reporter plasmid che è stato utilizzato per il controllo dell’efficienza della trasfezione è stato ottenuto da Promega. Gli ESC sono stati placcati su piastre rivestite di gelatina (0,1% di gelatina [BDH] in PBS per 20 minuti) e passati due volte per rimuovere gli alimentatori. Le cellule sono state poi seminate in piastre rivestite di gelatina a 96 pozzetti ad una densità di 5.000 cellule per pozzetto. Il giorno dopo, il mezzo è stato cambiato e le cellule sono state trasfettate con i plasmidi Firefly luciferasi reporter plasmidi insieme con il plasmide Renilla luciferasi reporter utilizzando il kit NanoJuice Transfection (Merck Millipore). Dopo 24 ore, le cellule sono state trattate con doxiciclina (Sigma) per 24 ore e il saggio luciferasi è stato eseguito utilizzando il Dual-Luciferase Reporter Assay System (Promega) e il dispositivo POLARstar Omega (BMG Labtech) seguendo le istruzioni del produttore.

microarray mRNA

Le cellule sono state raccolte e lavate una volta con PBS. L’RNA totale è stato estratto con RNAeasy Plus Micro kit (Qiagen). I campioni sono stati poi testati per la qualità con BioAnalyzer (Agilent) e le loro concentrazioni misurate con Qubit (Life Technologies). Sono stati ibridati su un Affymetrix GeneChip Mouse Gene 2.0 ST Array.

RT-PCR quantitativa monocellulare

Un massimo di 1 giorno prima dell’esperimento, piastre a 96 pozzetti (BioRad) sono state riempite con 5 µl di 2x mix di reazione dal kit CellsDirect One-Step qRT-PCR (Invitrogen). Il giorno dell’esperimento, le cellule sono state raccolte e colorate per l’analisi FACS. Le cellule da Anti-Mouse CD41 PE (MWReg30, eBioscience)/Anti Mouse CD144 (VE-caderina) eFluor 660 (eBioBV13, eBioscience) colorazione sono stati selezionati a cella singola nelle piastre pre-riempite a 96 pozzetti (BioRad) utilizzando il sistema FACSAria (Becton Dickinson). Le piastre sono state congelate a scatto su ghiaccio secco subito dopo la cernita e conservate a -80°C per una settimana al massimo. Per eseguire RT/Specific Target Amplification (RT/STA), 4 µl di una miscela di reazione – composta da 2,8 µl di buffer di risospensione, 0.2 µl di SuperScript III e Platinum Taq polimerasi dal kit CellsDirect One-Step qRT-PCR (Invitrogen) e 1 µl di 500 nM outer primer mix (lista delle sequenze di primer, vedi tabella sotto) – è stato aggiunto ad ogni pozzetto. Le piastre sono stati prima incubati a 50 ° C per 15 min. seguita da incubazione a 95 ° C per 2 min. Poi, sono stati incubati a 95 ° C per 15 s. seguita da incubazione a 60 ° C per 4 min. per 20 cicli. Per preparare le miscele di campioni, 1/5x cDNA diluiti sono stati miscelati con il reagente di carico (Fluidigm) e SsoFastTM EvaGreen Supermix (Bio-Rad). In parallelo, le singole miscele di dosaggio sono state preparate come 5 μM di miscela interna di primer, con tampone di sospensione del DNA e il reagente di carico del dosaggio (Fluidigm). Dopo il priming della matrice dinamica 96,96 IFC (Fluidigm), le miscele del campione e le miscele del saggio sono state messe insieme negli ingressi corrispondenti e caricate nel chip. Infine, il chip è stato eseguito nel sistema Fluidigm Biomark HD utilizzando il software di raccolta dati Biomark e il programma GE96 ×96PCR + Meltv2.pcl.

Per controllare la variazione tecnica delle nostre esecuzioni sc-qRT-PCR, abbiamo utilizzato il reverse cDNA universale trascritto da Random Hexamer: Tessuti normali del mouse (BioChain). Ci ha permesso di rilevare costantemente 93 dei nostri 95 geni di interesse. Un campione senza modello di DNA è stato anche eseguito ogni volta per testare per l’amplificazione PCR non specifica.

La lista dei primer è la seguente:


Nome del gene	Esterno in avanti	Inversione esterna	Interno in avanti	Inversione interna
Acta2	aggcaccactgaaccctaag	cacagcctgaatagccccacat	ccaaccaccgggagaaaatgac	atggcggggacattgaag
Acvr1	cgagtgctaatgatgatgatgatggctttttttccccc	cgtttcacagtggttttttttttttttttoo	cgattccccggagtgtggaagatga	cgattccccggagtgtggaagatga
Acvr1b	atgctggcggccatgaaaacatc	tcgtgatagtcagagacaagccaca	ttggctttttattgctgctgaca	tgggtccccccccccattatc
Acvr2a	gctggcaagtctgccaggtgtga	tcagaaatgctttttttgga	acccatggggcaggttttttta	tttatagcaccccccccaactttttoo
Acvr2b	gaagggctgctggctagatga	agttgccttttttcgccagcagcagca	tcaattgctactacgacaggaggcagga	aagtacacctggggggggggtttttttttttttc
Acvrl1	cgaattgcccccatcgtgacctcaa	cgtggttttgttggggatatccatccaggta	cgaagtcggcaatgtggctggtcaa	cgaagtcggcaatgtggctggtcaa
Adcy4	cgatggtggcatttttttttttttcccta		cgacattcccaccccacgcctggtggggtc	cgacattcccaccccacgcctggtggggtc
Atp2a3	cgaccattgtgtggggcagagtagaa	cgtcccagaattgctgtgaggaa	cgagagagggcagggccatctaca	cgagagagggcagggccatctaca
Bmp4	cagccgagccaacactgtga	tgggatgatgctgctgaggttttttga	agtttccatcatcacgaagaacatctgg	gaggaaacgaaaagagcagagagagagc
Bmpr1a	acgttcaaagccgaaagccccagccagta	tcgcggatgatgctgccatcaaagaa	acgccggcaggacaatagaatgttgg	acgccggcaggacaatagaatgttgg
Bmpr2	cagacggggggcatggagtat	atgagccagagacggcaagagc	tgcttgtgtgatggatggatttatttatcccaatg	tacccaatcacttttttgtgtggagactca
Cacna2d1	acgccaatggttttagctggtgaca	cgtgattggggggagtgacgttttgaa	acgagcaagttcaatggacaaatgtg	acgagcaagttcaatggacaaatgtg
Cdh2	atcaacaatgagactggacatca	cttccccatgtgtgtggcttttgaa	cactgtgtggcagctggttttttgg	attaacgtatactgttttgcactttttttctctcg
Cdh5	cgacaccatcatcgccaaaagagagagagac	cgtcttagcattattttttttttcggggttcac	cgaggatttggaatggaatcaaatgcacatcacatcg	cgaggatttggaatggaatcaaatgcacatcacatcg
Cldn5	tggccaggtgactgccttttttttt	tgcatgtggcccggggtactg	accacaacatcatcgtgacggcgcccaga	accacggcacgacatccacatccacag
Col4a2	cgaccctggaagccccctggattta	cgtttttttttttttaagtttaagtcccccaaca	cgatggcagggatggatgccttttggt	cgatggcagggatggatgccttttggt
Col4a5	cgaggaggactctctgtgtggattggcta	cgtatgaagggagcggaacgaa	cgattcatgatgatgcatacaagtgcagga	cgattcatgatgatgcatacaagtgcagga
Ctnnb1	aactcctgcacccaccatccatccca	gttccccggcaaaggcatga	tggccttttttgataaaggcaactg	tgctgggggcaaagagggcaag
Dcaf12l1	cgaaggcctccatggggcaactac	cgtggtggggagacccagaaaa	cgagcaggctttttttttaggagcta	cgagcaggctttttttttaggagcta
Dpysl3	cgaccccattgggaaggacaacttccac	cgtcggccccacaaactttttttttca	cgaccatttttgaaggcaccaat	cgaccatttttgaaggcaccaat
Eng	gcctgacttttttttggggactccagc	tgctgaccacatgggggctgtcac	gccaggctgaagacacactgacg	tcatgccccgcagctggagtag
Enpp1	cgaccatgaaaggaacggcatca	cgtaattttttttcctggcttcggatgac	cgatcagccggtcccccttttttttt	cgatcagccggtcccccttttttttt
Epo	ggttgtgggcagaaggtcccaga	gggacaggttttgccaaact	ctgagtgaaaatattacagtcccaga	tatggggttttttttttccacctcca
Epor	tgaagtggacgtgtctcggcag	acagcgaaggtggtagcggcccgt	caaccggggcaggagagggaca	ccgcccccccccggggttttttgcagaa
Eps8	cgaaggctgccatgccatgtttttttcaa	tcgtgtgctgttttttttcctcgccacaaa	acgctcctaatcaatcaccaagtagataggaattatg	acgctcctaatcaatcaccaagtagataggaattatg
Erg	tcccgaagctactacggcaaagaa	tttggactgagtgaggtgtgaggtggg	tacaactaactaggccagatttaccttatga	tgtggggggtccccccaggttgat
Esam	cgaagttatgtatgtgcaaggggttcaa	cgtcccaacaaaagtgcccacaa	cgacagagtggggggtttgccaagt	cgacagagtggggggtttgccaagt
Fam122b	cgaagtttttttttttttttttttoo	cgtaaatgtctcttttggattgagaacaggacac	cgacaaccaccagaggatttttggaaagcaatg	cgacaaccaccagaggatttttggaaagcaatg
Fbn1	acgtggcggggaatgtacaaaca	cgtcagagctgtggtagcagtaacca	cgactgtcagcagcagctacttttttgcaaat	cgactgtcagcagcagctacttttttgcaaat
Fli1	tgctgttttggtcgcaccccccccagttàààà	ttccttgacattcagtcgtgagga	ctcagggaaagttcactgctggccta	tggtctgtatgggggaggttttttgg
Flrt2	cgatgccccctttttttttttttoo	cgtagtgtagagagcagcccctaggaa	cgaccggaccacccttttttttggatt	cgaccggaccacccttttttttggatt
Fmo1	cgaaaccaccacgtgaattacggggta		cgagctccagaagagacaggactca	cgagctccagaagagacaggactca
Gata1	cctgtgtgcaatgccttttttttttttoo	tgcctgccccctttttttgctgacaa	gtatcacaagatgaatgaatggtcagaacc	cattcgcttttttttttgggggccccatg
Gata2	aagcaagggggggtttttoo	cacaggcattgcacaggtagt	cagaaggaggggagtgtgtc	gcccgtggccatctcgt
Gdpd5	cgaacttttgacaactcccatacc	cgttggggatgatgatgaggaggctgaa	cgatttttttttttttttttttcca	cgatttttttttttttttttttcca
Gfi1	cgagagatgtggcggcaagacc	cgtagcgtgtggatgacctcttttgaa	cgagtgagcctggagagcaacacaa	cgagtgagcctggagagcaacacaa
Gfi1b	cgatggacacttaccacttaccactgtgtca		cgaagtgcaacaacaaggtgtgttttttttcc	cgaagtgcaacaacaaggtgtgttttttttcc
Gpr126	cgactgtgtggcagccacttttcactca	cgtggcagatattccggcacccaata	cgatggagttttgatggatggatttttttcc	cgatggagttttgatggatggatttttttcc
Gria4	cgacgcccccatggggacgaaacta	cgtggccattaccaagacaccatcatcgta	acgatggatccgctggaagaagaaactaga	acgatggatccgctggaagaagaaactaga
Hbb-bh1	gagctgcactgtgacaagcttca	ggggtgtgaattccttttggcaaaa	tggatcctgagaacttcaaggggiiioo ddii tggattttaaggllii	gagtagaaaggacaatcaccaaca
Itga2b	ttccaaccaccagccgcttttcacct	tgctcggatccccatccatcaaac	cgacaacagcaaccccagtgttt	gcccacggggctaccgaatatc
Itgam	agcaggggtcattcggcctacg	cagctggcttagatgatgcgatgg		gtcggagctctctgcggggact
Itgb3	tcctccccagctcattgttgatgatgc	aggcaggtggcattgaagga	acgggaaaatccggctctaaa	agtgacttttttttttccccggcggcaggt
Kdr	tgtggggcttgatttgatttcacctg	tcgccccacagtcccaggaaag	cactctccaccttttcaaagtttaaagtattttoo	tttcacatccccctttaattttacaattttoo
Kit	ctggctctctggacctggatga	cctggctgccaaatctgtgtg	tgctgagcttttttttcctacctaccaggtg	atacaattcttttggaggaggcgaggaa
Ragazzo1	cgacctctttgagaagggagctgtca	cgtcctggggtctcttttggatcca	cgaggccagaaccggcacacagaac	cgaggccagaaccggcacacagaac
Lat	cgatgatgctgcctgacagagtagtcc	cgttcactctcaggaacattcacgta	cgactgcccccctttttttttttttoo	cgactgcccccctttttttttttttoo
Lgr5	cgagcaacaacatcatcaggtcaatacc	cgtcaggcaaatgctgaaaagcaaaagca	cgaggagccggggttttcgtagg	cgaggagcgagcggttttcgtagg
Lmo2	tcggccccatcgaaaggaaggaaggggii	gcggtcctattttttatgtttttoo	ctggacccgtgtgaggaacc	gcagccaccacatgtcagca
Lyl1	gctgaagcggcagaccaagccat	gctcacggggttttttttggtgaacact	gtgagctggacttttttttgacg	ccggagccacccctttttttttoo
Meis2	cgacccggtacccttcttcagaagaacagaa	cgttttggtcaatcatcatggggctgcacta	cgagaaacagttagcgcaagagacacac	cgagaaacagttagcgcaagagacacac
Incontrato	cgagatcatttgcggggtttttcaa	tcgactcttttgggcatagcatagcgaac	cgagtagttttttttttttatccccggggggggtttttttttttttoo	cgagtagttttttttttttatccccggggggggtttttttttttttoo
Mpo	tggcccctagacctgctgaagagag	ttgacacggacaacagattcagattcagc	aagctggccagcccccctgtgtgtgg	gagcaggtgtcaacacatctgtaa
Myb	cgagtggcagaaagtgctgaacc	cgttgcttttggggcaataacagaccaac	cgacatcaaaggtccccctggaccaaa	cgacatcaaaggtccccctggaccaaa
Myom1	cgattccccgtgtacgtgtgtgtgtgtgtgtcaa	cgttttccggtcatcatcatccacactcac	acgccccaggcaggcaggttttttggaaag	acgccccaggcaggcaggttttttggaaag
Tacca1	cgaccaaccctgtcaacggcaaa	cgtatttgcctgcgtgtggctcacaa	cgatgcccccctctcggggtaca	cgatgcccccctctcggggtaca
Npr1		cgtcgaaacatccatccagtccagggta	cgagaccaccacccaacatttttttattttoo	cgagaccaccacccaacatttttttattttoo
Palld		cgtttttttttttcctggtggatgatttgaa	cgacttctgaacaatggccaacc	cgacttttttgaacaatggccaacc
Pcdh12	cgatggggttttttttggcttgcggaac	tcgtgttttttttttggtgggggctggaa	cgaggaacccccggtggagga	cgaggaacccccggtggagga
Pdzd2	cgacaacttttggaaagccccaaac	cgtgtccccatttcggtaccatca	cgaagggggcaacagagtaaaatgaaactcaag	cgaagggggcaacagagtaaaatgaaactcaag
Pecam1	tgcggtggttttttgtcattggag	ctggacatctccacggggttt	gtcatccgccaccccaatttttggcag	tgtttggggtttttttttttttttttttttttttttttttttttc
Plcd1	cgatggcttttttttccagtcctagca	cgtccccacgttatggcggcggacaa	cgatctggcaggcaggcattattatgagatgagatgg	cgatctggcaggcaggcattattatgagatgagatgg
Ppia	cgaccgactgtgtggacacagctctaa	cgtagtggagagagagagagattacaggac	cgatttttttttgacttgacttgggcggcatt	cgatttttttttgacttgacttgggcggcatt
Ppp1r16b	cgagcgtgtgtggatgtgaaggac	cgtgatgtcctggtggcactgagacta	cgaatggctgggagcctct	cgaatggctgggagcctct
Ptprb	acgccaagagcggcaattatatgca	cgttgggcacccccaggacacctttaa	cgaccactccttttcaccgaggaa	cgaccactccttttcaccgaggaa
Ptprc	ggcttcaaggaacccaggaaata	tgacaataactgtgtggccttttttttttgc	attgctgcacaaggggggggggatg	cagatcatcatcctccagaagtcatcaa
Ptprm	cgacagtcctccaacacatca	tcgtgtcctttttttttttagcagtagtcc	cgatcagatgaagtgcgggctgag	cgatcagatgaagtgcgggctgag
Rampa 2	tccccactgaggaggacagtttoo	tccttggacagagtccatgatgcaa	tcaaaagggaagatggaagatggaagactacga	tcttggtacttactcataccagcaaggtaggaca
Correrex1	cgaactactccggcagaactgagaa	cgtactgattgattcagagtgaa	cgaatgctaccctaccggcggggatg	cgaatgctaccctaccggcggggatg
Samd4	cgaacagctccgtccagaagac	cgtactccagcctattgttttgattgatgtca	acgtcgctgccccccgtggcata	acgtcgctgccccccgtggcata
Fusciacca1	cgattgattgatctcactgaggagcccta	tcggccatgttttttggtggcaacatcc	cgactgataagcatggggggggtttttttoo	cgactgataagcatggggggggtttttttoo
Serpina1	aaaaccccggcggcagatcca	cttgttttttccacggccccatga	gatgctatgggattgattcaaagtcaa	ccttttggagagggggcggcggcatga
Sfpi1	gtggggcagcgatggagaaag	tgcagctgtgtgaagtggtttttttttoo	atagcgatcactactattttttotttttttoo	gggaagttttttcaaactcgttggttggttttgg
Lei	cgaacatggaaccgtacgatgatgatgca	tcgtctcacagttttttttttttoo	acgtaacagaaatcagagacgccccgtgtggtt	acgtaacagaaatcagagacgccccgtgtggtt
Sla	cgacgaatttttttttttcccccccaac	tcgggtggagcacacacacatagcatagac	cgaactggtactactacatctcaccaagg	cgaactggtactactacatctcaccaagg
Smad1	tctcagcccatggacacgaa	caccagtgtttttttttttttttttttttttttoo	atgatggcgcctcctccccactgc	gcaactgcctgaacatctcctc
Smad2	tgctctccaacgttaaccgaaa	tcagcaaacttttttccccaattoo	gccactgtagaaatgacaagaagaca	tgtaatacaagcggcccactccccttttc
Smad3	ccaatgtcaaccggaatgcag	tgaggcactccggcaaagacc	cgtggaacttacaaggcgaca	cccctccgatggtagtagagc
Smad4	ttgcctcaccaccaaaacg	tggaatgcaagctcattgtgtga	ccatttcttcagcaccacccgcccgta	tggccagtaatgtccaggatg
Smad5	aaccatggattcgaggaggctgtg	tgacgtgtcctgtctcggtggtactc	tgagctcaccaagatgtgtacc	gctccccagcccttgacaaa
Smad6	ttctcggttttttttttttttcctccttgac	ttcaccccggagcagtgatga	gtacaagccccactggatctgtccgatt	ggagtttttttggggggggttttt
Smad7	ggaagatcaaccccccggagctg	tgagaaaatccccattgggtatttttatgga	tgtggctgcaacccccccatcac	aaggaggaggagggagagactcta
Smad9	gcacgattcggattcggatgagtttttg	tgccagcggtccatgaagatg	gaagggggggagagcagagt	tctccgatccatccagcagggggtgct
Snai1	cgatctgcacgaccgacctgtgtggaaa	cgtggagcggtcagcaaaagca	cgactctaggccccctggttttgctttt	cgactctaggccccctggttttgctttt
Snai2	cgagcacattcgaacccacaca	cgttgggcagtgagggcaagagaaa	cgattgccttttgtgtgtgtgcaaga	cgattgccttttgtgtgtgtgcaaga
Sox7	agaacccggaccaccacctgcacaac	ccgctctgcctctcatccacat	cggagctcagcaagatgc	ggtctcttttttttgggacagtgactgtcagc
Tal1	accggatgccttttttttccatgatgtt	gcgccggcactactactttttggttttttt	ccaacaacaacaaccgggtgaaga	aggaccaccatcagaaatttccatctccatctca
Tek	tccaaaggagaatggcggcagg	tccggattgtttttttttggggttttc	ttccagaacgtgagagaagaacca
Tgfb1	accccccactgatacggcctga	gcagtgagccggctgaatcgaa	tggctgtctcttttttgacgactcactg	gccctgtgtattccttttttttttttttgg
Tgfb2	ggcatgcccatatctatttatggagttc	cagatccttgggacacacacacagca	gacactcaacacaacacaaagtccaaagtcctca	gggaagcggaagcttttcgggattta
Tgfb3	catgtcactttttcagcccccaat	ctccacggggatggatggattcatct	gagacatactggaaaatgttcatgaggtgtg	cattgtccccactcctttgaatttgaatttga
Tgfbr1	gcagacttggggacttgacttgctgtgtga	catctagaacttcagggggatgt	catgattctgccacagatacaa	ccttttagtgtgcccctacttttttttttttggtgg
Tgfbr2	tggccggctgcatatatcgtcct	gcatttttttttttttttttttccatttcca	tggacggcgccatccgccccagca	atccgacttttgggaacgtg
Thpo	ccggacgtcgaccctttttttttttttoo	tgcccctagaatgtcctgtgtgtgc		tgctctgtttttttttttttttttttttttoo
Upp1	cgagaaggaagagacgtggctctacca	cgtatgaaggtgttttcatccccgggaa	cgattcaaccccccacacacacactagcacacacacac cgattcaacccacacacacacacacacacao	cgattcaaccccccacacacacactagcacacacacac cgattcaacccacacacacacacacacacao

Sequenziamento RNA a cella singola C1

Dopo aver ottenuto 6.500 cellule in 13 µl di PBS con l’arricchimento FACS, è stato aggiunto Fluidigm Suspension Reagent in rapporto 3:2 e delicatamente miscelato con pipettaggio. Un Fluidigm C1 10-17 uM IFC Chip è stato innescato, 5 µl di miscela di sospensione cellulare è stato aggiunto all’ingresso della cella, e il chip è stato caricato nello strumento C1. L’annotazione della cattura delle cellule è stata effettuata su un microscopio a campo luminoso con ingrandimento 40x e ogni sito catturato è stato notato per avere la cattura di una singola cellula, la cattura di doppiette o detriti. Lisi, trascrizione inversa e reagenti PCR (Clontech Takara) sono stati poi caricati in ingressi appropriati come da layout Fluidigm. I controlli ERCC spike-in (Ambion) sono stati aggiunti ad una diluizione di 1:4000 all’interno della miscela di lisi per ottenere il limite di rilevazione e la normalizzazione nelle analisi a valle. L’IFC è stato caricato nello strumento C1 durante la notte utilizzando l’mRNA-Seq RT e lo script Amp, e ~3 µl di cDNA sono stati raccolti e diluiti in 5 µl di tampone di diluizione del DNA Fluidigm C1. La distribuzione dimensionale e la quantificazione dei singoli campioni di cDNA è stata ottenuta utilizzando un AATI Fragment Analyzer (AATI) e la concentrazione di cDNA è stata diluita a 100 pg/µl in 10 mM Tris HCl pH 8,0 per la preparazione della libreria. La preparazione della biblioteca Illumina è stata effettuata utilizzando il sistema Nextera XT DNA (Illumina), ma i volumi sono stati ridotti secondo il protocollo modificato Fluidigm C1. La tagmentazione è stata eseguita su tutti i 96 campioni utilizzando 1,25 µl di cDNA (125 pg di concentrazione totale) combinato con 2,5 µl di tampone di tagmentazione (TD) e 1,25 µl di Amplicon Tagment Mix (ATM), e incubato per 10 minuti a 55 gradi. Dopo l’incubazione, sono stati aggiunti 1,25 µl di Neutrilize Tagment Mix (NT). Illumina PCR indici di codici a barre sono stati combinati per ottenere 96 combinazioni distinte di codici a barre i7 e i5, e 2,5 µl di indice combinato è stato aggiunto insieme a 3,75 µl di Nextera PCR Mix (NPM). I campioni sono stati poi sottoposti a 12 cicli di PCR secondo il protocollo Illumina. Ogni colonna è stata poi raggruppata in una provetta di PCR a 8 strisce da 0,2 mL e la purificazione di Ampure XP è stata eseguita, dopo di che ogni piscina è stata combinata per ottenere un singolo 96-campione multiplexato pool di 96-campioni di libreria con codice a barre. La libreria di sequenziamento finale è stata quantificata da Qubit (Life Technologies) e la distribuzione delle dimensioni è stata misurata su un BioAnalizzatore Agilent. I campioni sono stati sequenziati con l’Illumina HiSeq 2000.

Wafergen sequenziamento RNA monocellulare

Le cellule sono state colorate con il Cell Viability Imaging kit (Sonde Molecolari), che contiene Hoechst 33342 e ioduro di propidio, e successivamente sono state contate con il Moxi Z Mini Automated Cell Counter (ORFLO). La soluzione cellulare macchiata è stata diluita in una miscela con diluente e inibitore della RNasi (New England Biolabs) a 1 cella/50 nl per l’erogazione sul ICell8-chip (Wafergen) con il MultiSample NanoDispenser (Wafergen). I controlli positivi e negativi sono stati preparati secondo il protocollo ICell8 e dispensati con il MSND nei rispettivi pozzetti del chip. Tutti i pozzetti del chip ICell8 sono stati ripresi con un microscopio a fluorescenza (Olympus). Le immagini sono state analizzate con il software CellSelect (Wafergen). Le singole cellule vive, che sono Hoechst-33342-positive e propidio-iodide negativo, sono state selezionate per la lisi e la trascrizione inversa all’interno del chip ICell8 (200 cellule i8TFs + dox, 150 cellule i8TFs -dox, 150 Empty -dox e 150 Empty +dox). La miscela di reazione RT contenente 5X RT buffer RT, dNTPs, RT e5-oligo (Wafergen), acqua priva di nucleasi, Maxima H Minus RT (Thermo Scientific) e Triton X-100 è stata preparata ed erogata nei nanovalori precedentemente selezionati con singole cellule all’interno. Il chip è stato inserito all’interno di uno SmartChip Cycler (Bio-Rad) modificato per la reazione RT (42°C per 90 min, 85°C per 5 min, 4°C per sempre).

Il cDNA di tutte le singole cellule è stato raccolto insieme e ulteriormente concentrato con il DNA Clean and Concentrator-5 kit (Zymo Research). La reazione dell’esonucleasi I (New England Biolabs) del cDNA (37°C per 30 min, 80°C per 20 min, 4°C per sempre) è stata eseguita all’interno di un termociclatore convenzionale. Successivamente, il cDNA è stato amplificato con l’Advantage 2 PCR Kit (Clontech Takara) contenente tampone, dNTPs, Amp Primer (Wafergen), mix di polimerasi e acqua priva di nucleasi (95°C per 1 min, 18 cicli di 95°C per 15 s, 65°C per 30 s e 68°C per 6 min, seguito da 72°C per 10 min e 4°C per sempre). Il cDNA amplificato è stato purificato con Ampure XP Beads (Beckmann Coulter). La distribuzione della dimensione del cDNA è stata ottenuta con il BioAnalizzatore del DNA ad Alta Sensibilità (Agilent) e la quantificazione è stata eseguita con il Qubit (Life Technologies). La preparazione della libreria Illumina è stata effettuata utilizzando Nextera XT DNA (Illumina). La tagmentazione è stata eseguita in tagment DNA buffer, Amplicon Tagment Mix e 1 ng di cDNA purificato (55°C per 5 min e 10°C per sempre), è stato aggiunto Nextera Tagment Buffer Neutralizza Tagment Buffer (temperatura ambiente per 5 min). Dopo l’incubazione, la miscela di reazione NexteraXT PCR è stata preparata con Nextera PCR Mastermix, i7 Index Primer del Nextera Index Kit (Illumina), Nextera Primer P5 e Tagmented cDNA-NT buffer mix tampone (72°).C per 3 min, 95°C per 30 s, 12 cicli di 95°C per 10 s, 55°C per 30 s e 72°C per 30 s, finale 72°C per 5 min e 10°C per sempre). La purificazione di Ampure XP è stata eseguita con la biblioteca finita. La distribuzione delle dimensioni è stata controllata su un BioAnalizzatore Agilent. I campioni sono stati sequenziati con l’Illumina NextSeq.

Quantificazione e analisi statistica

Analisi dell’arricchimento del termine GO

Tutte le analisi di arricchimento dei termini GO sono state effettuate utilizzando il server web g:Profiler (Reimand et al., 2016).

Analisi citometrica a flusso

Tutti gli esperimenti di citometria a flusso sono stati ripetuti indipendentemente tre volte. Per la Figura 3C e la Figura 3D, il t-test accoppiato è stato eseguito sulle frequenze delle cellule. Per la Figura 3-figure supplement 5D, le frequenze per ogni popolazione sono state tracciate utilizzando il software JMP (SAS). Le barre di errore corrispondono alle deviazioni standard.

Analisi quantitativa dei dati RT-PCR a cella singola

I dati quantitativi monocellulari RT-PCR sono stati prima elaborati con il software Fluidigm Real Time PCR Analysis (soglia di qualità, 0,65; soglia Ct, Auto (Global); e metodo di correzione della linea di base, lineare [derivato]). Il clustering gerarchico e le PCA sono stati eseguiti utilizzando il pacchetto SINGuLAR Analysis toolset (Fluidigm versione 3.5) in R (R Core Team , 2016). Utilizzando questo set di strumenti, i valori Ct sono stati convertiti in log2ex. Il valore Ct è un valore relativo di espressione genica nel dominio log2 (supponendo che l’efficienza della PCR sia uguale a 1). La conversione da Ct a log2ex si basa sulle seguenti formule:

Log2ex = LOD – Ct, se Ct è inferiore al limite di rilevazione (LOD)

Log2ex = 0, se Ct è uguale o superiore a LOD.

Dove il valore predefinito è 24 (il tipico valore Ct per una singola copia di input nel chip Fluidigm). Nel nostro caso, il valore Ct è un’espressione relativa e non ha unità. Quindi, dopo la conversione nel dominio Log2ex, abbiamo etichettato i valori risultanti come ‘Log2 Gene Expression’.

Le analisi gerarchiche di clustering e PCA sono state eseguite con le funzioni HC() e PCA() di questo pacchetto. La funzione HC raggruppa i geni dei cluster con il metodo Pearson Correlation, cioè i geni co-profilati sono raggruppati insieme e i campioni sono raggruppati per distanza euclidea normalizzata (distanza/numero di geni), che rappresenta il cambiamento di piega media. L’analisi HC utilizza il metodo del “collegamento completo” (un metodo dal basso verso l’alto) per trovare cluster simili. L’opzione di visualizzazione ‘global_z_score’ normalizza il valore dell’espressione utilizzando la media globale e la deviazione standard globale.

La media di espressione genica dei geni ematopoietici ed endoteliali è mostrato per ogni singola cellula nella figura 1-figure supplement 3. La media ematopoietica è basata sui geni Epo, Epor, Gata1, Gata2, Gfi1, Gfi1b, Hbb-bh1, Itga2b, Itgam, Itgb3, Kit, Lmo2, Lyl1, Mpo, Myb, Ptprc, Runx1, Sfpi1, Sla, Tal1 e Thpo e la media endoteliale su Cdh5, Cldn5, Eng, Esam, Fbn1, Gpr126, Kdr, Npr1, Pcdh12, Pecam1, Ptprb, Ptprm, Ramp2, Sox7 e Tek.

Un prototipo è stato calcolato per ogni gruppo di cluster di singole celle determinato dal risultato di clustering gerarchico mostrato in Figura 1-figure supplementi 1 e 2. Il prototipo è definito dalla media di tutte le cellule appartenenti al suo cluster. Il coefficiente di correlazione Pearson tra tutti i prototipi a coppie è visualizzato in Figura 1-figure supplemento 4A. Il pacchetto R ComplexHeatmap ComplexHeatmap è stato utilizzato (Gu et al., 2016).

Un modello lineare generalizzato con distribuzione Quasi-Poisson e logaritmo come funzione di collegamento è stato applicato per modellare i dati della tabella di conteggio come mostrato nella Figura 4B. Sono stati definiti sei gruppi di controllo, uno per ogni categoria di cluster di celle come Endo o VSM. Ogni gruppo di controllo comprende 10 campioni e comprende tutte le condizioni -dox. Per ogni categoria di cluster e per ciascuna delle linee cellulari di sovraespressione, il conteggio della condizione +dox è stato confrontato con i conteggi del rispettivo gruppo di controllo. Di questi 60 contrasti statistici (sei categorie di cluster per nove linee di celle di sovraespressione più la linea di cella che porta un vettore vuoto), cinque sono stati identificati per essere significativamente diversi con un valore p corretto<0,05. Il metodo di Benjamini-Hochberg è stato utilizzato per la correzione dei test multipli. Inoltre, il modello lineare generalizzato comprendeva un offset a tassi di modello invece di conteggi. I tassi rappresentano piccole differenze nel numero totale di celle misurate su ciascuna delle piastre del pozzo elaborato. Tutte e cinque le cinque condizioni significativamente diverse sono contrassegnate con una stella nella Figura 4B (vedi file supplementare 6 per i valori p).

analisi dei dati di microarray di mRNA

I dati del microarray mRNA sono stati analizzati utilizzando oligo, filobasi, metodi, biobase, statistiche, ggplot2, gplot, matrixstats, grafici, annotationdbi e pacchetti limma in R (R Core Team , 2016).

C1 analisi dei dati RNAseq monocellulare

Ogni biblioteca è stata messa in sequenza generando 426.065.795 e 440.774.932 paired-end di lettura (di 125 pb). Le letture sono state assegnate al pozzo con il codice a barre corrispondente. All’interno del codice a barre del pozzo sono tollerati fino a due disallineamenti se l’assegnazione è rimasta non ambigua. STAR, versione 2.4.0 (Dobin et al., 2013), ha allineato le letture al genoma del mouse build mm10/GRCm38. Le letture duplicate sono state rimosse usando samtools, versione 0.1.18 (Li et al., 2009). I pozzi con meno di 1 milione di letture sono stati considerati come pozzi vuoti ed esclusi da ulteriori analisi (2 e 1, rispettivamente). Le letture con una qualità di mappatura minima di 30, che mappate su un gene unico, sono state contate utilizzando la versione 1.4.6 di featureCounts (Liao et al., 2014).

I conteggi delle letture sono stati normalizzati utilizzando RUVg, versione 1.0.0 (Risso et al., 2014), utilizzando i controlli ERCC spike-in e i fattori di dimensione (SF) come definiti in DESeq (Anders e Huber, 2010). Sono state escluse le celle con >7% di letture mappate su rRNA (tre in ogni piastra) e che erano outliers sulla base del primo componente principale dopo la normalizzazione del fattore di dimensione. Le restanti cellule contenevano tutte >7.000 geni rilevati e sono state utilizzate in tutte le analisi successive.

Abbiamo effettuato un’analisi di rete utilizzando la misura di correlazione generalizzata della distanza, dcor statistic (Székely et al., 2007), insieme alla sua versione condizionale, pdcor (Székely e Rizzo, 2014). Per ogni chip e per ogni metodo di normalizzazione (quattro configurazioni), tutte le relazioni significative tra il trascrittoma e i geni del seme sono state identificate utilizzando la statistica dcor. I geni del seme utilizzati per questa analisi includevano le 8 TF così come Gata1, Gfi1b, Spi1, Spi1, Ldb1 e Cbfa2t3. I geni dei semi aggiuntivi sono stati selezionati se sono apparsi in reti pubblicate da almeno due diversi autori (Beck et al., 2013; Bonzanni et al., 2013; Moignard et al., 2013; Moignard et al., 2013; Moignard et al., 2015; Tanaka et al., 2012). La direzionalità delle relazioni (correlazione positiva, correlazione negativa o ‘altro’) è stata definita utilizzando un test t a due code, diretto è stato basato sul segno del test e ‘altro’ è stato assegnato a tutti i geni con valore p non corretto>0,05. Per garantire la robustezza, abbiamo incluso solo le relazioni che sono state identificate in almeno due delle quattro configurazioni, e qualsiasi relazione con direzioni contrastanti è stata assegnata ad ‘altro’. Infine, le interazioni tra i geni del seme sono state identificate condizionando i “bersagli” di ogni gene del seme sull’espressione di ogni altro gene del seme. Un’interazione è stata dedotta se le relazioni tra entrambi i geni del seme e un particolare gene ‘target’ aumentavano di forza quando condizionati sull’altro gene del seme.

Per l’analisi della rete Spearman, abbiamo combinato Exp1 ed Exp2 in un’unica matrice di espressione per ogni normalizzazione (SF e RUV). Abbiamo calcolato le correlazioni di Spearman utilizzando la funzione R di base per ogni normalizzazione e abbiamo fatto la media delle correlazioni tra le due normalizzazioni. Abbiamo cambiato tutte le correlazioni con valore assoluto <0.25 (cioè <0.25 e >-0.25) a 0. Abbiamo creato una rete con bordi ponderati tra i geni, correlazioni di 0 = nessun bordo. Abbiamo calcolato la centralità di eigen utilizzando eigen_centrality dal pacchetto igraph R (Bonacich, 1987). Abbiamo preso il valore assoluto di tutti i bordi (trasforma tutte le relazioni in positive) e calcolato la centralità di betweenness (numero di percorsi più brevi che passano attraverso un nodo) usando la betweenness dal pacchetto igraph R (Brandes, 2001). Abbiamo calcolato il grado (numero di bordi attaccati ad un nodo) usando il grado dal pacchetto igraph R. Poi, abbiamo calcolato il valore mediano di ogni misura attraverso tutti i geni della rete. Abbiamo contato il numero di geni nella lista che sono al di sopra della mediana e ne abbiamo testato il significato utilizzando un test binomiale (per definizione il 50% dei geni è al di sopra della mediana).

Analisi dei dati RNAseq monocellulari Wafergen

673 pozzi sul chip Wafergen hanno superato l’ispezione microscopica. Il pooling, la costruzione della biblioteca e il sequenziamento hanno generato 179 milioni di sequenze di paired-end utilizzando il protocollo Illumina Nextera. Si noti che questo sequenziamento più basso riduce notevolmente il tasso di rilevamento delle TF, ma il maggior numero di cellule ha facilitato la valutazione dell’eterogeneità all’interno e tra le popolazioni. La prima lettura della coppia codifica il codice a barre del pozzo e il codice a barre UMI (identificatore molecolare unico), la seconda codifica la fine 3′ della trascrizione. Le letture sono state assegnate al pozzetto con il codice a barre corrispondente. All’interno del codice a barre del pozzo sono tollerati fino a due errori di corrispondenza se l’assegnazione è rimasta non ambigua. Cutadapt ha tagliato le sequenze poly-A, poly-G e adattatore e STAR ha allineato le letture alla costruzione del genoma del mouse mm10 (Dobin et al., 2013; Martin, 2011). FeatureCounts ha determinato tutte le letture in modo specifico in modo che si sovrappongano esattamente con un gene (Liao et al., 2014). I livelli di espressione genica sono calcolati contando il numero di UMI distinte di tutte le letture specifiche del gene (“UMI per gene”), come determinato dai FeatureCounts. Sono state contate solo le letture allineate in modo univoco. Per ridurre ulteriormente l’impatto degli errori di mappatura e di sequenziamento sulla quantificazione, è stata introdotta una fase di correzione e di filtraggio degli errori di codice a barre UMI. Se due o più UMI distinti per gene condividono un codice a barre simile, che differiscono al massimo di uno o due errori di allineamento, allora possono avere origine dallo stesso codice a barre UMI. Il codice a barre UMI viene corretto solo se ha meno del 10% di letture rispetto a quello più abbondante. Questa procedura di correzione inizia con il codice a barre UMI, che è supportato dal maggior numero di letture specifiche del genere, e che determina tutti i codici a barre simili e li corregge, se applicabile. Si riavvia con tutti i codici a barre UMI che non sono stati considerati in una precedente iterazione fino a quando non ne rimane nessuno. In una fase di filtraggio separata, qualsiasi UMI distinto per gene che sia supportato solo da una o due letture allineate viene completamente omesso dal conteggio. Dalla tabella di conteggio risultante, tutti i conteggi provenienti dai 23 pozzetti di controllo sono stati rimossi per la successiva analisi esplorativa. Tutti i pozzetti rimanenti corrispondono a singole cellule. Filtraggio supplementare ha ridotto la sparsità trovato in questo gene per matrice cellulare di UMI conteggi UMI. Solo le cellule con 1000 o più geni con almeno un conteggio UMI e i geni con almeno un conteggio UMI in 10 o più cellule sono stati selezionati, lasciando una matrice di 478 singole cellule e 10.238 geni. Questa matrice è stata ridimensionata e normalizzata con il pacchetto Bioconductor scater (McCarthy et al., 2017). I componenti principali sono stati calcolati per i 400 geni che hanno mostrato la più alta varianza dopo aver sottratto l’andamento della varianza media di tutti i geni. L’analisi esplorativa è stata effettuata utilizzando R (R Core Team , 2016).

Dati e disponibilità del software

Software

Tutti i software sono disponibili gratuitamente o in commercio e sono elencati nella descrizione dei metodi e nella tabella di riferimento del prodotto.

Risorse di dati

Il numero di adesione per tutti i dati sc-RNA-seq e microarray riportati in questo documento è GEO: GSE96986.

Tabella di riferimento del prodotto


Prodotto o risorsa	Fornitore	^{Numero di} riferimento
Anticorpi
Anti-6X Il suo anticorpo [HIS.H8].	Abcam	ab18184
Anti-alfa-Tubulina-Antibody (mouse)	Sigma	T9026
Microsfere anti-APC	Miltenyi Biotec	130-090-855
Anti-Cbfb Anticorpo	Abcam	ab133600
Anti-Erg Anticorpo	Abcam	ab92513
Anticorpo M2 anti-FLAG	Sigma	F1804
Anticorpo anti-FLI1 [EPR464646].	Abcam	ab133485
Anticorpo anti-GATA2 [EPR2822(2)	Abcam	ab109241
Anticorpo anti-HA prodotto nel coniglio	Sigma	H6908
Anti-Lmo2 Anticorpo	Abcam	ab91652
Anticorpo anti-Lyl1 [KT43]	Abcam	ab53354
Anti-Mouse CD144 (VE-Cadherin) eFluor 660, eBioBV13	eBioscienza	50-1441-80
Anti-Topo CD309 (FLK1) APC, Avas12a1	eBioscienza	17-5821-81
Anti-Mouse CD41 PE, MWReg30	eBioscienza	12-0411-81
Anti-Topo cKit APC Anticorpo	eBioscienza	17-1171-82
Anti-Mouse HRP	GE Healthcare Life Sciences	NA931V
Anti-Rat HRP	GE Healthcare Life Sciences	NA935V
Anti-Runx1 Anticorpo	Abcam	ab92336
Anti-Tal1 Anticorpo	Abcam	ab119754
Anticorpo Anti-V5	Tecnologie per la vita	46–0705
Perossidasi AffiniPure Capra Anti-coniglio IgG (H + L)	Jackson	111-035-144
Prodotti chimici
2-mercaptoetanolo	GIBCO	31350–010
Acido ascorbico	Sigma	A4544
Collagenasi di tipo IA da Clostridium histolyticum liofilizzato in polvere (da soluzione sterile-filtrata), 0,5-5,0 unità FALGPA/mg solido, coltura cellulare testata	Sigma	C9722-50MG
D4T surnatante	EMBL-Roma	N/A
Doxiciclina	Sigma	D9891
UEB	R e D	959-ME-010
ERCC RNA Spike-In Mix	Ambion	4456740
Esonucleasi I	New England Biolabs	M0293L
Siero fetale bovino plasma-derivato da plasma povero di piastrine (PDS)	Antech	N/A
Siero fetale bovino (FBS)	PAA	A15-102
Fluidigm C1 Tampone di diluizione del DNA	Fluidigm	100–5317
Fluidigm Reagente di sospensione	Fluidigm	100–6201
Gelatina	BDH	440454B
Colorante fantasma rosso 780	Bioscienze Tonbo	13–0865
GM-CSF	R e D	425 ML
FGF umano di base	R e D	233-FB-025
IL-11	R e D	418 ML
IL-3	R e D	403 ML
IL-6	R e D	406 ML
IMDM	Lonza	BE12-726F
KnockOut DMEM	GIBCO	10829–018
L-glutammina	GIBCO	25030–024
LIF	EMBL Heidelberg	N/A
Massima H meno trascrittasi inversa	Termo Scientifico	EP0752
MCSF	R e D	416 ML-010
MEM Soluzione di amminoacidi non essenziali	GIBCO	11140–035
Metilcellulosa	VWR	9004-67-5
Monotioglicerolo (MTG)	Sigma	M6145
Oncostatina M	R e D	495-MO
Penicillina-streptomicina	GIBCO	15140–122
PFMH-II	GIBCO	12040–077
Buffer RIPA Pierce	Termo Scientifico	89900
Soluzione Ponceau S	Sigma	P7170
Inibitore RNase	New England Biolabs	M0314S
SCF	R e D	455-MC
TPO	R e D	488-TO-005
Transferrin	Roche (Italia)	10652202001
TrypLE express	GIBCO	12605–036
VEGF	R e D	293-VE
Saggi commerciali
Vantaggio 2 Kit PCR	Clontech Takara	639207
Amersham ECL Prime Western Blotting Reagent per il rilevamento delle macchie occidentali	GE Healthcare Life Sciences	RPN2232
Allegatoin V-FITC Kit di rilevamento dell’apoptosi	eBioscienza	88-8005-72
Kit di imaging per la viabilità delle cellule	Sonde molecolari	R37610
CellsDirect One-Step qRT-PCR kit	Invitrogen	11753100
Kit per il test citometrico a flusso Click-iT Plus EdU Alexa Fluor 488	Sonde molecolari	C10633
Kit DNA Clean e Concentratore-5	Ricerca Zymo	D4013
Sistema di analisi del reporter a doppia lievitazione	Promega	E1910
ICell8-chip e kit reagente	Wafergen	430–000233
Kit di trasfezione NanoJuice	Merck Millipore	71902
Kit indice Nextera	Illumina	FC-131-1001
Nextera XT DNA Library Prep kit di preparazione della biblioteca del DNA – 24 campioni (esperimento Wafergen)	Illumina	FC-131-1024
Nextera XT DNA Library Prep kit per la preparazione di 96 campioni (esperimento C1)	Illumina	FC-131-1096
Kit di estrazione nucleare	ActiveMotif	40010
Kit per il dosaggio delle proteine BCA Pierce	Termo Scientifico	23225
Kit RNAeasy Plus Micro	Qiagen	74034
Kit SMARTer Ultra Low RNA per il sistema Fluidigm C1, 10 IFC	Clontech Takara	634833
Dati depositati
Dati grezzi e analizzati di sequenziamento e microarray	Questo documento	GEO: GSE96986
Dati di sequenziamento grezzi e analizzati	(Goode et al., 2016)	GEO: GSE69101
Dati di sequenziamento grezzi e analizzati	(Pereira et al., 2016)	GEO: GSE54574
Linee cellulari
Linea A2lox.Cre mESC	(Iacovino et al., 2011)	A2lox.Cre
Linea mESC A2lox.empty	Questo documento	Vuoto
Linea A2lox.i8TFs mESC	Questo documento	i8TFs
Linea A2lox.iCbfb mESC	Questo documento	iCbfb
Linea A2lox.iErg mESC	Questo documento	iErg
Linea A2lox.iFli1 mESC	Questo documento	iFli1
Linea A2lox.iGata2 mESC	Questo documento	iGata2
Linea A2lox.iLmo2 mESC	Questo documento	iLmo2
Linea A2lox.iLyl1 mESC	Questo documento	iLyl1
Linea A2lox.iRunx1 mESC	Questo documento	iRunx1
Linea A2lox.iTal1 mESC	Questo documento	iTal1
Runx1+/hCD4	(Sroczynska et al., 2009a)	Runx1+/hCD4
Topi
C57BL/6N	EMBL Roma
Gfi1b:GFP topi knock-in	(Vassen et al., 2007)
Gfi1:GFP topi knock-in	(Yücel et al., 2004)
DNA ricombinante
Plasmide: p2lox_5TFs	Questo documento	p2lox_5TFs
Plasmide: p2lox_6TFs	Questo documento	p2lox_6TFs
Plasmide: p2lox_8TFs	Questo documento	p2lox_8TFs
Plasmide: p2lox_vuoto	(Vargel et al., 2016)	p2lox_vuoto
Plasmide: p2lox_K_Cbfb	Questo documento	p2lox_K_Cbfb
Plasmide: p2lox_K_Erg	Questo documento	p2lox_K_Erg
Plasmide: p2lox_K_Fli1	Questo documento	p2lox_K_Fli1
Plasmide: p2lox_K_Gata2	Questo documento	p2lox_K_Gata2
Plasmide: p2lox_K_Lmo2	Questo documento	p2lox_K_Lmo2
Plasmide: p2lox_K_Lyl1	Questo documento	p2lox_K_Lyl1
Plasmide: p2lox_K_Runx1	Questo documento	p2lox_K_Runx1
Plasmide: p2lox_K_Tal1	Questo documento	p2lox_K_Tal1
Plasmide: pGL4.10[luc2]	Promega	E6651
Plasmide: pGL4.74[hRluc/TK]	Promega	E6921
Software e algoritmi
CellProfiler	(Kamentsky et al., 2011)	http://www.cellprofiler.org
Software CellSelect	Wafergen	N/A
Figi	(Schindelin et al., 2012)	http://fiji.sc/Fiji
FlowJo	Tree Star, Inc.	N/A
Software JMP	SAS	N/A
Altri
96,96 array dinamico IFC	Fluidigm	BMK-M-96,96
Analizzatore di frammenti AATI	AATI	DNF-474
Perline Ampure XP	Beckmann coltro	B23319
BioAnalyzer	Agilent	N/A
Sistema Biomark HD	Fluidigm	N/A
FACSAria	Becton Dickinson	N/A
FACSCanto	Becton Dickinson	N/A
Fluidigm C1 10-17 uM Chip IFC	Fluidigm	100–5760
Microscopio a fluorescenza per l’imaging dei chip Wafergen	Olympus	BX43F
Piastre PCR a guscio duro	Bio-Rad	HSP9611
HiSeq 2000	Illumina	N/A
Sistema ICell8	Wafergen	N/A
IncuCyte HD	Essen Bioscienze	N/A
Tecnologia MACS MicroBead	Miltenyi Biotec	N/A
Moxi Z Mini contacellule automatizzato	ORFLO	MXZ001
NanoDispenser MultiSample	Wafergen	N/A
NextSeq	Illumina	N/A
NuPAGE 12% Gel Proteici Bis-Tris	Tecnologie per la vita	NP0343BOX
Indici con codice a barre PCR	Illumina	FC-131-200
Dispositivo POLARstar Omega	BMG Labtech	N/A
Membrana di nitrocellulosa PROTRAN	PerkinElmer	NBA085C
Qubit	Tecnologie per la vita	N/A
SmartChip Cycler	Bio-Rad	T-100
Universal cDNA Reverse Trascritto da Random Hexamer: Tessuti normali per mouse	BioChain	C4334566-R
Sistema di elettroforesi a mini celle XCell SureLock	Invitrogen	N/A

References

Anders S, Huber W. Differential expression analysis for sequence count data. Genome Biology. 2010; 11DOI | PubMed
Asano Y, Stawski L, Hant F, Highland K, Silver R, Szalai G, Watson DK, Trojanowska M. Endothelial Fli1 deficiency impairs vascular homeostasis: a role in scleroderma vasculopathy. The American Journal of Pathology. 2010; 176:1983-1998. DOI | PubMed
Beck D, Thoms JA, Perera D, Schütte J, Unnikrishnan A, Knezevic K, Kinston SJ, Wilson NK, O’Brien TA, Göttgens B, Wong JW, Pimanda JE. Genome-wide analysis of transcriptional regulators in human HSPCs reveals a densely interconnected network of coding and noncoding genes. Blood. 2013; 122:e12-e22. DOI | PubMed
Bergiers I, Tischer C, Vargel Bölükbaşı Ö, Lancrin C. Quantification of mouse hematopoietic progenitors’ Formation using Time-lapse microscopy and image analysis. Bio-Protocol. 2019; 9DOI | PubMed
Bertrand JY, Giroux S, Cumano A, Godin I. Hematopoietic stem cell development during mouse embryogenesis. Methods in Molecular Medicine. 2005; 105:273-288. PubMed
Boisset JC, van Cappellen W, Andrieu-Soler C, Galjart N, Dzierzak E, Robin C. In vivo imaging of haematopoietic cells emerging from the mouse aortic endothelium. Nature. 2010; 464:116-120. DOI | PubMed
Bonacich P. Power and centrality: a family of measures. American Journal of Sociology. 1987; 92:1170-1182. DOI
Bonzanni N, Garg A, Feenstra KA, Schütte J, Kinston S, Miranda-Saavedra D, Heringa J, Xenarios I, Göttgens B. Hard-wired heterogeneity in blood stem cells revealed using a dynamic regulatory network model. Bioinformatics. 2013; 29:i80-i88. DOI | PubMed
Brandes U. A faster algorithm for betweenness centrality*. The Journal of Mathematical Sociology. 2001; 25:163-177. DOI
Choi K, Kennedy M, Kazarov A, Papadimitriou JC, Keller G. A common precursor for hematopoietic and endothelial cells. Development. 1998; 125:725-732. PubMed
Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013; 29:15-21. DOI | PubMed
Donnelly ML, Luke G, Mehrotra A, Li X, Hughes LE, Gani D, Ryan MD. Analysis of the aphthovirus 2A/2B polyprotein ‘cleavage’ mechanism indicates not a proteolytic reaction, but a novel translational effect: a putative ribosomal ‘skip’. Journal of General Virology. 2001; 82:1013-1025. DOI | PubMed
Dunn SJ, Martello G, Yordanov B, Emmott S, Smith AG. Defining an essential transcription factor program for naïve pluripotency. Science. 2014; 344:1156-1160. DOI | PubMed
Dzierzak E, de Pater E. Regulation of Blood Stem Cell Development. Current Topics in Developmental Biology. 2016; 118:1-20. DOI | PubMed
Eilken HM, Nishikawa S, Schroeder T. Continuous single-cell imaging of blood generation from haemogenic endothelium. Nature. 2009; 457:896-900. DOI | PubMed
Ferreira R, Ohneda K, Yamamoto M, Philipsen S. GATA1 function, a paradigm for transcription factors in hematopoiesis. Molecular and Cellular Biology. 2005; 25:1215-1227. DOI | PubMed
Goardon N, Lambert JA, Rodriguez P, Nissaire P, Herblot S, Thibault P, Dumenil D, Strouboulis J, Romeo PH, Hoang T. ETO2 coordinates cellular proliferation and differentiation during erythropoiesis. The EMBO Journal. 2006; 25:357-366. DOI | PubMed
Goode DK, Obier N, Vijayabaskar MS, Lie-A-Ling M, Lilly AJ, Hannah R, Lichtinger M, Batta K, Florkowska M, Patel R, Challinor M, Wallace K, Gilmour J, Assi SA, Cauchy P, Hoogenkamp M, Westhead DR, Lacaud G, Kouskoff V, Göttgens B, Bonifer C. Dynamic gene regulatory networks drive hematopoietic specification and differentiation. Developmental Cell. 2016; 36:572-587. DOI | PubMed
Gu Z, Eils R, Schlesner M. Complex heatmaps reveal patterns and correlations in multidimensional genomic data. Bioinformatics. 2016; 32:2847-2849. DOI | PubMed
Guibentif C, Rönn RE, Böiers C, Lang S, Saxena S, Soneji S, Enver T, Karlsson G, Woods NB. Single-cell analysis identifies distinct stages of human endothelial-to-hematopoietic transition. Cell Reports. 2017; 19:10-19. DOI | PubMed
Huang H, Yu M, Akie TE, Moran TB, Woo AJ, Tu N, Waldon Z, Lin YY, Steen H, Cantor AB. Differentiation-dependent interactions between RUNX-1 and FLI-1 during megakaryocyte development. Molecular and Cellular Biology. 2009; 29:4103-4115. DOI | PubMed
Huber TL. Dissecting hematopoietic differentiation using the embryonic stem cell differentiation model. The International Journal of Developmental Biology. 2010; 54:991-1002. DOI | PubMed
Iacovino M, Bosnakovski D, Fey H, Rux D, Bajwa G, Mahen E, Mitanoska A, Xu Z, Kyba M. Inducible cassette exchange: a rapid and efficient system enabling conditional gene expression in embryonic stem and primary cells. Stem Cells. 2011; 29:1580-1588. DOI | PubMed
Imperato MR, Cauchy P, Obier N, Bonifer C. The RUNX1-PU.1 axis in the control of hematopoiesis. International Journal of Hematology. 2015; 101:319-329. DOI | PubMed
Iwafuchi-Doi M, Zaret KS. Cell fate control by pioneer transcription factors. Development. 2016; 143:1833-1837. DOI | PubMed
Kamentsky L, Jones TR, Fraser A, Bray MA, Logan DJ, Madden KL, Ljosa V, Rueden C, Eliceiri KW, Carpenter AE. Improved structure, function and compatibility for CellProfiler: modular high-throughput image analysis software. Bioinformatics. 2011; 27:1179-1180. DOI | PubMed
Kolodziejczyk AA, Kim JK, Tsang JC, Ilicic T, Henriksson J, Natarajan KN, Tuck AC, Gao X, Bühler M, Liu P, Marioni JC, Teichmann SA. Single cell RNA-Sequencing of pluripotent states unlocks modular transcriptional variation. Cell Stem Cell. 2015; 17:471-485. DOI | PubMed
Lancrin C, Sroczynska P, Stephenson C, Allen T, Kouskoff V, Lacaud G. The haemangioblast generates haematopoietic cells through a haemogenic endothelium stage. Nature. 2009; 457:892-895. DOI | PubMed
Lancrin C, Mazan M, Stefanska M, Patel R, Lichtinger M, Costa G, Vargel O, Wilson NK, Möröy T, Bonifer C, Göttgens B, Kouskoff V, Lacaud G. GFI1 and GFI1B control the loss of endothelial identity of hemogenic endothelium during hematopoietic commitment. Blood. 2012; 120:314-322. DOI | PubMed
Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genome Project Data Processing Subgroup. The sequence alignment/map format and SAMtools. Bioinformatics. 2009; 25:2078-2079. DOI | PubMed
Liao Y, Smyth GK, Shi W. featureCounts: an efficient general purpose program for assigning sequence reads to genomic features. Bioinformatics. 2014; 30:923-930. DOI | PubMed
Lichtinger M, Ingram R, Hannah R, Müller D, Clarke D, Assi SA, Lie-A-Ling M, Noailles L, Vijayabaskar MS, Wu M, Tenen DG, Westhead DR, Kouskoff V, Lacaud G, Göttgens B, Bonifer C. RUNX1 reshapes the epigenetic landscape at the onset of haematopoiesis. The EMBO Journal. 2012; 31:4318-4333. DOI | PubMed
Martin M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 2011; 17:10-12. DOI
McCarthy DJ, Campbell KR, Lun ATL, Wills QF. Scater: pre-processing, quality control, normalization and visualization of single-cell RNA-seq data in R. Bioinformatics. 2017; 247DOI
McLaughlin F, Ludbrook VJ, Cox J, von Carlowitz I, Brown S, Randi AM. Combined genomic and antisense analysis reveals that the transcription factor Erg is implicated in endothelial cell differentiation. Blood. 2001; 98:3332-3339. DOI | PubMed
Moignard V, Macaulay IC, Swiers G, Buettner F, Schütte J, Calero-Nieto FJ, Kinston S, Joshi A, Hannah R, Theis FJ, Jacobsen SE, de Bruijn MF, Göttgens B. Characterization of transcriptional networks in blood stem and progenitor cells using high-throughput single-cell gene expression analysis. Nature Cell Biology. 2013; 15:363-372. DOI | PubMed
Moignard V, Woodhouse S, Haghverdi L, Lilly AJ, Tanaka Y, Wilkinson AC, Buettner F, Macaulay IC, Jawaid W, Diamanti E, Nishikawa SI, Piterman N, Kouskoff V, Theis FJ, Fisher J, Göttgens B. Decoding the regulatory network of early blood development from single-cell gene expression measurements. Nature Biotechnology. 2015; 33:269-276. DOI | PubMed
Mullen AC, Orlando DA, Newman JJ, Lovén J, Kumar RM, Bilodeau S, Reddy J, Guenther MG, DeKoter RP, Young RA. Master transcription factors determine cell-type-specific responses to TGF-β signaling. Cell. 2011; 147:565-576. DOI | PubMed
Mylona A, Andrieu-Soler C, Thongjuea S, Martella A, Soler E, Jorna R, Hou J, Kockx C, van Ijcken W, Lenhard B, Grosveld F. Genome-wide analysis shows that Ldb1 controls essential hematopoietic genes/pathways in mouse early development and reveals novel players in hematopoiesis. Blood. 2013; 121:2902-2913. DOI | PubMed
Org T, Duan D, Ferrari R, Montel-Hagen A, Van Handel B, Kerényi MA, Sasidharan R, Rubbi L, Fujiwara Y, Pellegrini M, Orkin SH, Kurdistani SK, Mikkola HK. Scl binds to primed enhancers in mesoderm to regulate hematopoietic and cardiac fate divergence. The EMBO Journal. 2015; 34:759-777. DOI | PubMed
Padrón-Barthe L, Temiño S, Villa del Campo C, Carramolino L, Isern J, Torres M. Clonal analysis identifies hemogenic endothelium as the source of the blood-endothelial common lineage in the mouse embryo. Blood. 2014; 124:2523-2532. DOI | PubMed
Pereira CF, Chang B, Gomes A, Bernitz J, Papatsenko D, Niu X, Swiers G, Azzoni E, de Bruijn MF, Schaniel C, Lemischka IR, Moore KA. Hematopoietic reprogramming in vitro informs in vivo identification of hemogenic precursors to definitive hematopoietic stem cells. Developmental Cell. 2016; 36:525-539. DOI | PubMed
R Core Team . R Foundation for Statistical Computing. 2016.
Reimand J, Arak T, Adler P, Kolberg L, Reisberg S, Peterson H, Vilo J. g:Profiler-a web server for functional interpretation of gene lists (2016 update). Nucleic Acids Research. 2016; 44:W83-W89. DOI | PubMed
Risso D, Ngai J, Speed TP, Dudoit S. Normalization of RNA-seq data using factor analysis of control genes or samples. Nature Biotechnology. 2014; 32:896-902. DOI | PubMed
Robin C, Dzierzak E. Hematopoietic stem cell enrichment from the AGM region of the mouse embryo. Methods in Molecular Medicine. 2005; 105:257-272. PubMed
Rybtsov S, Batsivari A, Bilotkach K, Paruzina D, Senserrich J, Nerushev O, Medvinsky A. Tracing the origin of the HSC hierarchy reveals an SCF-dependent, IL-3-independent CD43(-) embryonic precursor. Stem Cell Reports. 2014; 3:489-501. DOI | PubMed
Schindelin J, Arganda-Carreras I, Frise E, Kaynig V, Longair M, Pietzsch T, Preibisch S, Rueden C, Saalfeld S, Schmid B, Tinevez JY, White DJ, Hartenstein V, Eliceiri K, Tomancak P, Cardona A. Fiji: an open-source platform for biological-image analysis. Nature Methods. 2012; 9:676-682. DOI | PubMed
Scialdone A, Tanaka Y, Jawaid W, Moignard V, Wilson NK, Macaulay IC, Marioni JC, Göttgens B. Resolving early mesoderm diversification through single-cell expression profiling. Nature. 2016; 535:289-293. DOI | PubMed
Solaimani Kartalaei P, Yamada-Inagawa T, Vink CS, de Pater E, van der Linden R, Marks-Bluth J, van der Sloot A, van den Hout M, Yokomizo T, van Schaick-Solernó ML, Delwel R, Pimanda JE, van IJcken WF, Dzierzak E. Whole-transcriptome analysis of endothelial to hematopoietic stem cell transition reveals a requirement for Gpr56 in HSC generation. The Journal of Experimental Medicine. 2015; 212:93-106. DOI | PubMed
Sroczynska P, Lancrin C, Kouskoff V, Lacaud G. The differential activities of Runx1 promoters define milestones during embryonic hematopoiesis. Blood. 2009a; 114:5279-5289. DOI | PubMed
Sroczynska P, Lancrin C, Pearson S, Kouskoff V, Lacaud G. In vitro differentiation of mouse embryonic stem cells as a model of early hematopoietic development. Methods in Molecular Biology. 2009b; 538:317-334. DOI | PubMed
Székely GJ, Rizzo ML, Bakirov NK. Measuring and testing dependence by correlation of distances. The Annals of Statistics. 2007; 35:2769-2794. DOI
Székely GJ, Rizzo ML. Partial distance correlation with methods for dissimilarities. The Annals of Statistics. 2014; 42:2382-2412. DOI
Tahirov TH, Inoue-Bungo T, Morii H, Fujikawa A, Sasaki M, Kimura K, Shiina M, Sato K, Kumasaka T, Yamamoto M, Ishii S, Ogata K. Structural analyses of DNA recognition by the AML1/Runx-1 Runt domain and its allosteric control by CBFbeta. Cell. 2001; 104:755-767. DOI | PubMed
Tanaka Y, Joshi A, Wilson NK, Kinston S, Nishikawa S, Göttgens B. The transcriptional programme controlled by Runx1 during early embryonic blood development. Developmental Biology. 2012; 366:404-419. DOI | PubMed
Taoudi S, Gonneau C, Moore K, Sheridan JM, Blackburn CC, Taylor E, Medvinsky A. Extensive hematopoietic stem cell generation in the AGM region via maturation of VE-cadherin+CD45+ pre-definitive HSCs. Cell Stem Cell. 2008; 3:99-108. DOI | PubMed
Thambyrajah R, Mazan M, Patel R, Moignard V, Stefanska M, Marinopoulou E, Li Y, Lancrin C, Clapes T, Möröy T, Robin C, Miller C, Cowley S, Göttgens B, Kouskoff V, Lacaud G. GFI1 proteins orchestrate the emergence of haematopoietic stem cells through recruitment of LSD1. Nature Cell Biology. 2016; 18:21-32. DOI | PubMed
Vargel Ö, Zhang Y, Kosim K, Ganter K, Foehr S, Mardenborough Y, Shvartsman M, Enright AJ, Krijgsveld J, Lancrin C. Activation of the TGFβ pathway impairs endothelial to haematopoietic transition. Scientific Reports. 2016; 6DOI | PubMed
Vassen L, Okayama T, Möröy T. Gfi1b:green fluorescent protein knock-in mice reveal a dynamic expression pattern of Gfi1b during hematopoiesis that is largely complementary to Gfi1. Blood. 2007; 109:2356-2364. DOI | PubMed
Wang Q, Stacy T, Miller JD, Lewis AF, Gu TL, Huang X, Bushweller JH, Bories JC, Alt FW, Ryan G, Liu PP, Wynshaw-Boris A, Binder M, Marín-Padilla M, Sharpe AH, Speck NA. The CBFβ subunit is essential for CBFalpha2 (AML1) function in vivo. Cell. 1996; 87:697-708. DOI | PubMed
Wilson NK, Foster SD, Wang X, Knezevic K, Schütte J, Kaimakis P, Chilarska PM, Kinston S, Ouwehand WH, Dzierzak E, Pimanda JE, de Bruijn MF, Göttgens B. Combinatorial transcriptional control in blood stem/progenitor cells: genome-wide analysis of ten major transcriptional regulators. Cell Stem Cell. 2010; 7:532-544. DOI | PubMed
Woon Kim Y, Kim S, Geun Kim C, Kim A. The distinctive roles of erythroid specific activator GATA-1 and NF-E2 in transcription of the human fetal γ-globin genes. Nucleic Acids Research. 2011; 39:6944-6955. DOI | PubMed
Yücel R, Kosan C, Heyd F, Möröy T. Gfi1:green fluorescent protein knock-in mutant reveals differential expression and autoregulation of the growth factor independence 1 (Gfi1) gene during lymphocyte development. Journal of Biological Chemistry. 2004; 279:40906-40917. DOI | PubMed
Zovein AC, Hofmann JJ, Lynch M, French WJ, Turlo KA, Yang Y, Becker MS, Zanetta L, Dejana E, Gasson JC, Tallquist MD, Iruela-Arispe ML. Fate tracing reveals the endothelial origin of hematopoietic stem cells. Cell Stem Cell. 2008; 3:625-636. DOI | PubMed

Fonte

Bergiers I, Andrews T, Vargel Bölükbaşı , Buness A, Janosz E, et al. () Single-cell transcriptomics reveals a new dynamical function of transcription factors during embryonic hematopoiesis. eLife 7e29312. https://doi.org/10.7554/eLife.29312