See this page in english

Entente préalable au projet

Document établi entre le collaborateur et la plateforme transcriptomique POPS

Équipements -//- Applications disponibles -//- Entente préalable -//- Tarification

Informations générales et conditions d'accès

Télécharger le pdf

1. Accès

L’accès au séquençage mRNA-seq pour des projets d’analyse du transcriptome est possible dans le cadre de  partenariats entre la Plateforme transcriptOmique de l’iPS2 (POPS) et d’autres laboratoires, dans la mesure des ressources produites à l’IPS2.

  

Pour bénéficier de cette prise en charge, les équipes intéressées peuvent contacter Ludivine Soubigou-Taconnat (Ludivine.Soubigou-Taconnat @ u-psud.fr), (IPS2) par mail  ou par téléphone 01 69 15 77 19.

Les expérimentations seront effectuées par les membres de la plateforme. L’équipe apporte son expertise et son savoir-faire sur les analyses du transcriptome et sa main d’œuvre dans cette collaboration.

Une réunion téléphonique ou sur site pour définir le(s) objectif(s) et question(s) biologique(s) du projet afin d’établir entre autre le plan d’expérience sera systématiquement réalisée. Les participants à cette réunion seront le(s) collaborateur(s), les membres concernés de plateforme Transcriptome et les membres concernés  de l’équipe de « Réseaux Génomiques ».

 

2. Bon de commande et paiement

Un devis pourra être réalisé et envoyé sur simple demande du collaborateur à Ludivine Soubigou-Taconnat (Ludivine.Soubigou-Taconnat @ u-psud.fr).

Le collaborateur devra éditer un bon de commande correspondant au montant des expérimentations réalisées et l’envoyer à recettes.ips2 @ u-psud.fr. Le paiement sera réalisé après émission d'une facture par l'IPS2. Pour plus d’information ou si ce schéma ne correspondrait pas à votre échéancier financier, veuillez écrire à recettes.ips2 @ u-psud.fr.

 

3. Préparation des échantillons

Il est important de noter que de nombreux facteurs influent sur le niveau d’expression des gènes d’une plante. Le contrôle des conditions expérimentales est donc crucial si l’on veut relier une différence d’expression à la fonction étudiée. Ainsi une plante témoin comparée à une plante ayant subi un traitement spécifique devra être cultivée dans le même environnement nutritionnel et lumineux que cette dernière. Par exemple, un décalage de récolte en cours de journée révèlera des différences dues à l’expression circadienne de nombreux gènes. Un défaut d’homogénéité d’arrosage ou de traitement phytosanitaire peut être source de variabilité sans rapport avec le processus étudié. Ces considérations sont à prendre en compte pour assurer la reproductibilité des échantillonnages.

 

3.a  Répétitions

Il est essentiel de faire la différence entre une répétition technique et une répétition biologique.

 

Répétitions techniques :

Les répétitions d’un échantillon sont préparées au même moment (semis, prélèvements, extractions …).

Permet l'observation et la quantification des biais techniques (variabilité technique).

Contrôle de la reproductibilité des études.

Contrôle de la qualité des données obtenues.

Les conclusions ne sont valables que pour l'individu.

 

Répétitions biologiques :

Les répétitions d’un échantillon sont préparées à des moments différés dans le temps (semis, prélèvement, extraction …) avec au minimum 24h de décalage (attention au cycle circadien).

Permet l'observation de la variabilité inter-individus.

Les conclusions sont généralisables aux populations étudiées.

 

En tout état de cause, il est nécessaire de prévoir au moins deux répétitions biologiques, c’est-à-dire 3 fois l’ensemble de l’expérience. L’objectif étant de caractériser la variabilité biologique entre les répétitions,  et de « l’éliminer » afin d’identifier les gènes dont la différence d’expression est liée au seul facteur étudié.

 

3.b  Quantité et qualité du matériel nécessaire aux expériences.

Une quantité de 4µg d’ARN total (concentration minimale de 200ng/µl) par échantillon est requise. Contactez la plateforme si vous n’étiez pas en mesure d’obtenir cette quantité. La pureté des ARN étant un des facteurs les plus importants pour la réussite de l’expérience, il est préférable d’utiliser un protocole d’extraction sur colonne (type RNeasy) en incluant l’étape de DNase I.

Pour les échantillons « difficiles » comme les graines et les racines, l’ajout de PVP s’avère très utile. Contactez-nous si  besoin.

Les ARN totaux sont à envoyer en carboglace dans la solution d’élution. Leur qualité sera estimée sur puce Bioanalyseur Agilent et ils seront dosés au « Ribogreen » après leur arrivée sur la plateforme.

 

 

L’envoi des ARN par les collaborateurs sera accompagné du tableau d’informations dument rempli (à imprimer en dernière page).

Les échantillons d’ARN peuvent être renvoyés au collaborateur sur simple demande et à ses frais.

 

 

4.  Caractéristiques des runs de séquençage et délais

Les runs de séquençage sont réalisés sur le NextSeq500 (Illumina) de la plateforme, sur le séquenceur HiSeq2000 ou HiSeq4000 (Illumina) via l’Institut de Génomique-CNS à Evry.

Le nombre de reads par échantillon est à ajuster en fonction de votre question biologique de départ.

 

Un délai pour la construction des librairies et le séquençage  vous sera donné à partir de la réception des ARN de qualité et quantité satisfaisante. Suivant les options choisis pour les analyses bioinformatiques et statistiques un délai supplémentaire sera donné. Ce délai tiendra compte notamment :

  • Des analyses bioinformatiques suivant l’option choisie.
  • Des analyses statistiques : normalisation et analyse différentielle des données.
  • De l’intégration des données dans CATdb et envoi GEO (NCBI).

 

Options d’analyses

Option B1 : Mapping sur transcriptome de référence, analyse différentielle 2 à 2 et participation aux frais de maintenance des serveurs et de stockage des données (durée du projet + 1 an)

Option B2 : Analyses bioinformatiques nécessitant des outils ou paramètres particuliers adaptés à la question biologique  (assemblage de novo RNAseq, traitement des smallRNA, détection de nouveaux gènes …), analyse différentielle et la participation aux frais de maintenance des serveurs et de stockage des données

Option B3 : Stockage des données brutes sans analyses pendant 6 mois (dans la limite de 1 Terra).

 

5.  Processus opérationnel

  • Contrôle qualité des ARN (Bioanalyser Agilent) et quantification (Ribogreen).
  • Construction des librairies (RNA-seq, Small-RNA, directionnel-RNA-seq, UltraLow …) : protocoles Illumina ou Clontech
  • Contrôle qualité des banques sur puce Bioanalyzer (Agilent)
  • Séquençage ou NextSeq500 ou sur HiSeq2000/4000
  • Assemblage si nécessaire
  • Contigs si nécessaire
  • Mapping
  • Comptage
  • Normalisation avec TMM
  • Analyse différentielle 2 à 2 avec EdgeR

 

Après analyse statistique des résultats bruts, une liste de gènes par comparaison est produite sous forme de fichier Excel. Elle comprend le comptage moyen de la condition 1, le comptage moyen de la condition  2, le ratio et une p_value brute et ajustée pour permettre un contrôle des faux-positifs.

 

6.  Format d’échange des données 

L’ensemble des résultats (comptages, fichier Excel, ACP …) sera envoyé via Renater.

Les données brutes (fastq), contigs (si réalisés), seront disponibles en chargement via un cloud ou un site sécurisé. Le laboratoire partenaire s’engage à rapatrier les données brutes sur leur propre serveur dès la réception dans un délai d’1 mois maximum après la mise à disposition des séquences.

 

Le Stockage des données et les analyses bioinformatiques et statistiques sont faites à l’IPS2.

L’IPS2 s’engage à garder les données brutes (archivage des fastq, pas les images) 1 an  après la mise à disposition des données au collaborateur. Passé ce délai, les données seront détruites.

 

7.  Bases de données

Il est prévu que les  résultats des expériences soient intégrés dans la base de données CATdb, Gagnot et al. Nucleic Acids Res. 2008 and Zaag et al. NAR 2015 (compatible avec le standard MIAME : Brazma et al, 2001. Nat Genet. 29(4):365-71) et transmis à la base de données Geomnibus (GEO) du NCBI. GEO délivrera un numéro d’accession conseillée pour toute publication des résultats transcriptome.

Pour ce faire la plateforme vous fera parvenir un fichier de soumission pour recueillir les informations nécessaires à ces soumissions (conditions de culture, traitement, …).

Attention, si vous ne comptez pas publier toutes les données en même temps, remplissez 2 fichiers différents pour avoir 2 numéros d’accession (si besoin nous contacter pour plus d’information).

Seuls les projets pour lesquels nous réalisons les analyses (Option B1 ou B2) seront soumis dans les 2 bases de données citées ci-dessus.

 

8.  Release des données 

Les données seront rendues publiques 2 ans après la fin du projet. Il y a néanmoins des exceptions qui seront discutées au cas par cas :

  1. Si le projet est dans le cadre d'un partenariat avec un industriel
  2. Si le projet est dans le cadre d'un projet ANR/KBBE; les résultats sont mis dans le public 1 an après la fin du projet en lui-même seulement.
  3. Si les résultats transcriptome sont en cours de publication ou de valorisation pour dépôt de Brevet.

 

9.  Publication des résultats

Il s’agit de collaborations scientifiques entre l’IPS2 et le partenaire, dans laquelle la plateforme apporte son expertise. Seul le coût des consommables est pris en charge par le laboratoire partenaire. A ce titre, un membre de la plateforme Transcriptome et un membre de l’équipe de « Réseaux Génomiques » de l’IPS2 seront cosignataires de la première publication dans laquelle les données de transcriptome seront présentées/exploitées. La même convention sera appliquée pour le dépôt de Brevet à l'initiative du collaborateur et dans lequel les résultats transcriptome seront exploités.

Il vous sera également demandé de cité dans le texte de description des données, la base de données CATdb (par exemple : “Microarray data from this article were deposited at Gene Expression Omnibus (Edgard 2002): http://www.ncbi.nlm.nih.gov/geo/; accession no. GSEXXXXX and at CATdb (Gagnot 2007): http://urgv.evry.inra.fr/CATdb/; Project: XXXX according to the “Minimum Information About a Microarray Experiment” standards.”).

 

Affiliation IPS2 :

  1. Institute of Plant Sciences Paris-Saclay (IPS2), CNRS, INRA, Université Paris-Sud, Université d'Evry, Université Paris-Saclay, Bâtiment 630, Plateau de Moulon, 91192 Gif sur Yvette, France.
  2. Institute of Plant Sciences Paris-Saclay (IPS2), CNRS, INRA Université Paris-Diderot, Sorbonne Paris-Cité, Bâtiment 630, Plateau de Moulon, 91192 Gif sur Yvette, France.

Description du projet

Nous vous demandons de décrire votre projet en complétant ces rubriques avant de nous renvoyer ce document :

 

1. Titre du projet.

2. Nom et coordonnées du responsable du projet.

3. Nom et coordonnées de la personne chargée du suivi du projet en liaison avec la plateforme POPS (si différente du responsable du projet).

4. Objectifs scientifiques (à renseigner les plus précisément possible et notamment).

Question biologique :

Annotation, quantification RNA/Small-RNA, … :

5. Plan d’expérience avec notamment

  • Nombre de reads par échantillon :
  • Type de banques : orientée ou non, Small, UltraLow etc… :
  • Nombre de lignes de Hiseq2000 / NextSeq500:
  • Échantillons multiplexés et taux de multiplexage :
  • Séquençage Pair End ou Single End :
  • Longueur de séquençage 75pb, 100bp, 150pb, 300pb :
  • Option « Analyses Bioinformatique/statistiques » choisie (voir partie 4) :

Comparaisons à réaliser dans le cadre des analyses :

  • Y a –t-il un génome de référence ou un set UniGene (transcriptome) disponible : oui/non :
  • Si oui, lequel ?

 

6. Nombre de librairies – description des échantillons (organe, stade de prélèvement selon Boyes et al . Plant Cell 2001, traitement…) 

La nomenclature à suivre pour les noms des échantillons est la suivante : condition X_Y

  •  X : Il y a au minimum 1 condition (exemple 1 : génotype et exemple 2 : traitement) ou plusieurs conditions (exemple 3 : génotype_traitement1_traitement2 et exemple 4 : génotype_traitement1, dans ce cas ils seront séparés par un _.
  • Y : numéro de réplica, séparé des conditions par un _.

 

Exemples:

1)  XP17_1

Condition_réplicat

2)  N2_2    

Condition_réplicat

3)  WT_N10_24h_3    

Condition_traitement1_traitement2_réplicat

4)  Mut_light_1  

Condition_traitement_réplicat

            

7.  Date prévue de fourniture des échantillons à l’IPS2

8.  Tableau à joindre aux échantillons d’ARN lors de l’envoi 

Nom sur les tubes

Nom nomenclature PF (condition X _Y)

Concentration en µg/µl

Méthode d’extraction