Méthodes moléculaires en écologie microbienne

Méthodes moléculaires en écologie microbienne U5lisa5on et interpréta5on des données séquençage ADN haut débit Loïs Maignien Lab. Microbiologie des Environnements Extrêmes – IUEM Lois_maignien@univ-­‐brest.fr 1. Exemples d’u5lisa5on des NGS •  preNGS: Banque de clones. Sylvan et al., 2012 %&#
Sylvan et. al. Supplementary Information
• 
« Time-­‐series analysis of two hydrothermal plumes at 9°50ʹ′N East Pacific Rise reveals disAnct, heterogeneous bacterial populaAons » 60
1-13
2-8
OTUs (3% Cutoff)
50
1-8
40
2-13
1-21
30
2-21
20
10
0
0
20
40
60
# Clones Sequenced
80
1. Exemples d’u5lisa5on des NGS •  NGS: 454 Huber et al., Science 2007 « Microbial PopulaAon Structures in the Deep Marine Biosphere » 1. Exemples d’u5lisa5on des NGS •  NGS: Ilumina Webster et al. 2013 ISME Journal. « ‘Sponge-­‐specific’ bacteria are widespread (but rare) in diverse marine environments » 1. Exemples d’u5lisa5on des NGS •  NGS: Ilumina Quin et al. Nature 2010 « A human gut microbial gene catalogue established by metagenomic sequencing » 1. Exemples d’u5lisa5on des NGS •  NGS: Sanger + 454 Arumugam et al. Nature 2011 « Enterotypes of the human gut microbiome» 1. Exemples d’u5lisa5on des NGS •  Microbiome vaginal et Bacteriose vaginal (B.V.) Diapo J. Ravel – IGS – University of Maryland 2. Problème scien5fique: comment décrire les communautés microbiennes? •  AcAvité et rôle dans un écosystème 2. Problème scien5fique: comment décrire les communautés microbiennes? •  AcAvité et rôle dans un écosystème Lophelia pertusa (corail profond) Se nourrit de par5cules en suspension... M. Roberts ocean.si.edu …construit des structure 3D type récif pour d’autres espèces S. Ross et al., UNCW, NOAA/USGS DISCOVRE Cruise 2. Problème scien5fique: comment décrire les communautés microbiennes? • 
Comment décrire la diversité microbienne – 
– 
– 
– 
Phénotype peu u5lisable <1% cul5vable. Culture sur plaque non-­‐représenta5ve de la diversité réelle Très grande diversité Très grand nombre CLASI-­‐FISH Valm et al. 2011 PNAS 2. Problème scien5fique: comment décrire les communautés microbiennes? s.org on September 19, 2013
•  FoncAon et rôle dans un écosystème –  Problème pour relier iden5té, nombre et fonc5on en écologie microbienne C H 4 CONCENTRATION
ml S T P / k g
0
o
100
200
100
200
300
Anaerobic Oxida5on of Methane (AOM) Q_ 3 0 0
UJ
Q
400
500
Figure 1. Profiles of methane concentration versus depth in
Santa Barbara Basin sediment. Station locations are lat 34°16.8'N, long
Barnes and Goldberg, 1976, Geology 1 2 0 ° 0 2 . 4 ' W for S e p t e m b e r 1 9 7 3 and lat 3 4 ° 1 5 . 6 ' N , long 1 2 0 ° 0 2 . 6 ' W
for May 1974. Relative positions of pore-water samples in sediment are a
function of filter positions on a rigid probe. Absolute depth of samples
below 150 cm may be uncertain by ±25 cm owing to uncertainty in
determining depth of probe penetration into sediment.
Boe5us et al, 2000, Nature Milucka et al. 2012 Nature 2. Problème scien5fique: comment décrire les communautés microbiennes? •  Banques d’ADN, excellent moyen d’obtenir un recensement de la diversité taxonomique et fonc5onnelle microbienne. •  Indica5on sur l’ac5vité poten5elle des microorganismes (pour les gènes dont la fonc5on est connue) •  Deux types d’approche –  Séquençage ciblé après par PCR => Amplicon –  Séquençage aléatoire de fragments génomiques •  D’une souche isolée => Génomique •  D’ADN environnemental => Metagénomique 2. Problème scien5fique: comment décrire les communautés microbiennes? Recensement des 105 microbes dans 1 mL d’eau de mer 2005: 50.000 euros (Sanger) 2013: 5 euros (MiSeq) Nouveaux possibles! Comparaison à grande échelle des -­‐  Gènes -­‐  Génomes -­‐  Transcriptomes -­‐  Popula5ons -­‐  Communautés 3. Gène de l’ARNr 16S pour étudier la diversité des microorganismes Présent dans toute les cellules de Bactéries et Archées (18S pour les Eukaryotes) Atomic structure of the 30S Subunit from Thermus thermophilus. Proteins are shown in blue and the single RNA strand in orange. htp://en.wikipedia.org/wiki/16S_ribosomal_RNA 3. Gène de l’ARNr 16S pour étudier la esign primers to a region of interest
Hilary Morrison, Thurs pm
diversité d
es m
icroorganismes Usually SSU rRNA (“16S”)
conserved primers flanking variable
regions(s)
length dependent on sequencing
platform
Con5ent des régions xtract DNA (RNA)
conservées (déterminé structure 3D et Createpar cDNA
from RNA)
ac5vité bio) et des mplify DNA
régions hypervariables these steps introduce biases!
equence
H.Morison, www.jbpc.mbl.edu 3. Gène de l’ARNr 16S pour étudier la Which)variable)regions)to)target?)
diversité des microorganismes V1%
8F%
V2%
V4%
V3%
341%
518%
V5%
V6%
806% 926% 967% 1064%
V6%%%%%%%%(967F;1046R)%%%%%%%%%60%bp%
V4%%%%%%%%(518F;806R)%%%%%%%%%%%288%bp%
V4V5%%%(518F;1064R)%%%%%%%%%550%bp%
V9%%%%%%%%(1380/1389;1513)%for%eukaryotes%
)
H.Morison, www.jbpc.mbl.edu V7%
V8%
V9%
1380%1513%
4. Approches moléculaires de la diversité microbienne DNA,
Sampling,
Extrac)on,
PCR,
Pyrosequencing,
High@
throughput,
CLASSIFICATION, CLUSTERING,
Amplifica)on,
Diapo: [email protected] Environmental,
ATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATATCGA%
TCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATATCGATCGAT%
ATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATATCGT%
4#
TCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATATTCGATCGATGGT%
4. Approches moléculaires de la diversité microbienne Regrouper les séquences similaires 1. Classifica5on Regrouper des séquences en fonc5on de leur ressemblance avec des séquences d’une base de donnée. (chaque seq. reçoit la même taxonomie que le meilleurs résultat) OU 2. Agréga5on (clustering) Regrouper des séquences en fonc5on de leur ressemblance entre elles 4.1 Classifica5on •  Bases de données de l’ADNr 16S Au centre des base de donnée se trouve un alignement de toutes les séquences de 16s pour pouvoir les comparer entre elles. SILVA : 50.000 posi5ons GreenGenes: 7682 posi5ons www.arb-­‐silva.de www.greengenes.lbl.gov 4.1 Classifica5on 1/ Soumetre chaque séquence à la base de donnée (en ligne ou local) 2/ récupérer la taxonomie associé a la séquence p.ex. Bacteria;Proteobacteria;Betaproteobacteria;Nitrosomo
nadales;Nitrosomonadaceae;Nitrosomonas;!
3/ Regrouper les séquences qui ont la même taxonomie 4.1 Classifica5on Résultat: matrice d’observa5on Echan5llon1 Echan5llon2 Echan5llon3 Taxon1 200 480 30 Echan5llon4 0 Taxon2 100 220 100 0 Taxon3 50 100 200 200 Taxon4 10 50 200 50 Taxon5 2 1 2 50 362 851 532 300 4.2 Agréga5on (clustering) Regrouper des séquences en fonc5on de leur ressemblance entre elles Nécessaire pour aténuer les erreurs de séquençage PCR: ~10-­‐4 -­‐ 10-­‐6 (nt) / Séquencage: 0.4% des nt ou 25% des seq Groupe arbitraires: OTU (Opera5onal Taxonomic Unit) Distance de 97% ou 98% Effets des erreurs de séquençage sur la diversité Séquence principale Séquence principale Erreurs ou bactéries phylogéné5quement proches? 1 unité biologique (OTU) 13 unités biologiques (OTUs) 4.2 Agréga5on des séquences 1/ aligner les séquences entre elles en u5lisant une Base 16S (silva-­‐greengenes-­‐RDP) 4.2 Agréga5on des séquences 2/ Calcul de distance entre les séquences => matrice de distance généAque seq1 seq2 seq3 seq4 seq5 seq1 1 seq2 0.05 1 seq3 seq4 seq5 0.02 0.03 1 0.01 0.15 0.3 1 0.05 0.08 0.09 0.5 1 4.2 Agréga5on des séquences 3/ forma5on d’OTUs OTU1 Seq 1 Seq 2 Seq 3 OTU3 Seq 5 OTU2 Seq 4 4.3 Matrice d’observa5on 900 Taxon1 Taxon2 Taxon3 Taxon4 Taxon5 Echan5llon Echan5llon Echan5llon Echan5llon
1 2 3 4 200 480 30 0 100 220 100 0 50 100 200 200 10 50 200 50 2 1 2 50 362 851 532 300 800 700 600 Taxon5 500 Taxon4 400 Taxon3 300 Taxon2 200 Taxon1 100 0 Echan5llon1 (a.k.a. Matrice de communauté, table OTU, …) Echan5llon2 Echan5llon3 Echan5llon4 5. Comparaison des échan5llons •  Normalisa5on des matrices d’observa5on! Comment éviter que des échan5llons apparaissent différents en raison de leur taille absolue? 5. Comparaison des échan5llons •  Normalisa5on par sous-­‐échan5llonnage: 350 Taxon1 Taxon2 Taxon3 Taxon4 Taxon5 Echan5llon Echan5llon Echan5llon Echan5llon
1 2 3 4 166 169 17 0 83 78 56 0 43 35 114 200 8 18 113 50 0 0 0 50 300 300 300 300 300 250 Taxon5 200 Taxon4 Taxon3 150 Taxon2 100 Taxon1 50 0 Echan5llon1 Echan5llon2 Echan5llon3 Echan5llon4 5. Comparaison des échan5llons •  Normalisa5on par frac5on: 1.20 1.00 Taxon1 Taxon2 Taxon3 Taxon4 Taxon5 Echan5llon Echan5llon Echan5llon Echan5llon
1 2 3 4 0.55 0.56 0.06 0.00 0.28 0.26 0.19 0.00 0.14 0.12 0.38 0.67 0.03 0.06 0.38 0.17 0.01 0.00 0.00 0.17 1.00 1.00 1.00 1.00 Taxon5 0.80 Taxon4 0.60 Taxon3 Taxon2 0.40 Taxon1 0.20 0.00 Echan5llon1 Echan5llon2 Echan5llon3 Echan5llon4 5. Comparaison des échan5llons α-­‐diversité (richesse) observée Courbe rang abondance pino-­‐bodas et al. The Lichenologist 2012 Sobs = 32 5. Comparaison des échan5llons α-­‐diversité (richesse) non-­‐paramétrique es5mée Comment es5mer le nombre d’OTU présent dans la popula5on a par5r de l’échan5llon? Courbe rang abondance pino-­‐bodas et al. The Lichenologist 2012 5. Comparaison des échan5llons α-­‐diversité (richesse) non-­‐paramétrique es5mée Es5mateur Chao1 Schao1=59 pino-­‐bodas et al. The Lichenologist 2012 5. Comparaison des échan5llons α-­‐diversité (richesse) es5mée, méthode paramétrique e 1: Best discounted model, stepping down from order 3 to order 2; component 1 is deleted
4000 3500
Graph fréquence observa5on Suppose que les fréquences de chaque OTU suivent une 3000
distribu5on sta5s5que (type 2500 Component 3
binomiale …) Components 2 + 3
2000
Le meilleur model Components 1 + 2 + 3
1500
Observed
1000
500
0
1
350
300
10
100
correspondant aux observa5on donne les paramètres de cete communauté microbienne, inclue la richesse. CatchAll (Bunge et al. 2011) 5. Comparaison des échan5llons β-­‐diversité: mesure de la distance rela5ve entre des communautés microbiennes U5lisa5on d’indices de (di)similarité •  0 < Indice < 1 •  IA,B=0 => communautés A et B sont iden5ques •  IA,B=1 => communautés A et B sont « infiniment » différentes 5. Comparaison des échan5llons β-­‐diversité: mesure de la distance rela5ve entre des communautés microbiennes ABONDANCE RELATIVE: exemple indice Morisita-­‐Horn Echan5llon Echan5llon Echan5llon
Echan5llon
1 2 3 4 Taxon1 169 17 0 Taxon2 166 83 78 56 0 Taxon3 43 35 114 200 Taxon4 8 18 113 50 Taxon5 0 0 0 50 300 300 300 300 htp://www.mothur.org/wiki/Morisitahorn Comparaison des échan5llons β-­‐diversité: mesure de la distance rela5ve entre des communautés microbiennes Echan5llon1 Echan5llon2 Echan5llon3 Echan5llon4 Echan5llon1 0 Echan5llon2 0.000000 0 Echan5llon3 0.5958953 0.5934003 0 Echan5llon4 0.7826372 0.8036867 0.2327174 0 Matrice de distance entre échan5llon basée sur l’abondance rela5ve des OTUs con5ent des indices de diversité M-­‐H 5. Comparaison des échan5llons β-­‐diversité: mesure de la distance rela5ve entre des communautés microbiennes INCIDENCE (Présence / Absence des OTUs): Index Jaccard Echan5llon Echan5llon Echan5llon
Echan5llon
1 2 3 4 166 169 17 0 Taxon1 Taxon2 83 78 56 0 Taxon3 43 35 114 200 Taxon4 8 18 113 50 Taxon5 0 0 0 50 300 300 300 300 htp://www.mothur.org/wiki/Jclass 5. Comparaison des échan5llons β-­‐diversité: mesure de la distance rela5ve entre des communautés microbiennes INCIDENCE (Présence / Absence des OTUs): Seule la présence ou Echan5llon1 Echan5llon2 Echan5llon3 Echan5llon4 l’absence compte dans le Taxon1 1 1 1 0 Taxon2 1 1 1 0 calcul de l’indice de Taxon3 1 1 1 1 diversité Taxon4 1 1 1 1 Taxon5 0 0 0 1 htp://www.mothur.org/wiki/Jclass Comparaison des échan5llons β-­‐diversité: mesure de la distance relaAve entre des communautés microbiennes Echan5llon1 Echan5llon2 Echan5llon3 Echan5llon4 Echan5llon1 0 Echan5llon2 0.000000 0 Echan5llon3 0.5958953 0.5934003 0 Echan5llon4 0.7826372 0.8036867 0.2327174 0 Matrice de distance entre échan5llon basée sur l’abundance des OTUs Con5ent des indices de diversité MORISITA-­‐HORN 6. Retour a l’écologie… Visualisa5on •  Cladogramme (u5lisa5on d’algorithmes de clustering UPGMA,…) 6. Retour a l’écologie… Visualisa5on •  PCoA (Principal coordinate analysis) htp://ordina5on.okstate.edu/overview.htm#Figure_5 6. Retour a l’écologie… Visualisa5on •  PCoA (Principal coordinate analysis) 7. Méthodes de séquençage •  Sanger htp://www.youtube.com/watch?v=bEFLBf5WEtc 7. Méthodes de séquençage Which)variable)regions)to)target?)
•  Sanger Max 96 séquences de 2x 800 pb 800 pb V1%
8F%
V2%
V4%
V3%
341%
518%
V5%
~100 pb V6%
806% 926% 967% 1064%
V7%
V8%
V9%
800 pb 1380%1513%
1500 pb V6%%%%%%%%(967F;1046R)%%%%%%%%%60%bp%
Taille de la séquence correspond a la longueur de l’ADNr 16S! V4%%%%%%%%(518F;806R)%%%%%%%%%%%288%bp%
96 sequences en parallele V4V5%%%(518F;1064R)%%%%%%%%%550%bp%
V9%%%%%%%%(1380/1389;1513)%for%eukaryotes%
Appliedbiosystems.com )
7. Méthodes de séquençage •  454 (aka pyrosequencage) a.  Ajout d’adaptateurs b.  PCR en émulsion (clonage in vitro) c.  Dénatura5on de l’ADN et distribu5on des microbilles sur une microplaque d. DNApol immobilisée pour PCR e.  Plaque PicoTiter f.  Flow successifs de ATCG. Emission de lumière a chaque incorpora5on Jonathan M Rothberg & John H Leamon Nature Biotechnology 26, 1117 -­‐ 1124 (2008 7. Méthodes de séquençages Which)variable)regions)to)target?)
•  454: 1 x 500 pb 500 pb V1%
V2%
V4%
V3%
V5%
V6%
V7%
V8%
V9%
MID 8F%
341%
518%
806% 926% 967% 1064%
1380%1513%
500 pb 1.800.000 séquences en parallèle V6%%%%%%%%(967F;1046R)%%%%%%%%%60%bp%
Plusieurs librairies sur une même plaque (mul5plexage) V4%%%%%%%%(518F;806R)%%%%%%%%%%%288%bp%
Démul5plexage in silico avec les MID V4V5%%%(518F;1064R)%%%%%%%%%550%bp%
V9%%%%%%%%(1380/1389;1513)%for%eukaryotes%
454 GS flx 5tanium www.roche.com )
7. Méthodes de séquençages •  454 Flowgram .sff File Standard Flow File .FastQ file Lysholm et al. BMC Bioinforma5cs 2011 12:293 @SEQ_ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAA + !''*((((***+))%%%++)(%%%%).1***-­‐+*''))**55CCF>>>>>>CCCCCCC65 htp://fr.wikipedia.org/wiki/FASTQ 7. Méthodes de séquençages •  454 Problème des homopolymères: 2 ou 3 G ??? T C A G AT C G T G - G T G
T C A G AT C G T G G G T G
7. Méthodes de séquençages •  Illumina htp://seqanswers.com/forums/showthread.php?t=21 7. Méthodes de séquençages •  Illumina htp://seqanswers.com/forums/showthread.php?t=21 7. Méthodes de séquençages •  Illumina htp://seqanswers.com/forums/showthread.php?t=21 7. Méthodes de séquençages •  Illumina htp://seqanswers.com/forums/showthread.php?t=21 7. Méthodes de séquençages Which)variable)regions)to)target?)
•  Illumina HiSeq R1 100 pb V1%
V2%
V4%
V3%
V5%
V7%
V6%
V8%
V9%
R2 100 pb 8F%
341%
518%
~100 pb 806% 926% 967% 1064%
1380%1513%
100 pb 150.000.000 séquences en parallèle V6%%%%%%%%(967F;1046R)%%%%%%%%%60%bp%
Plusieurs librairies sur une même plaque (mul5plexage) V4%%%%%%%%(518F;806R)%%%%%%%%%%%288%bp%
Démul5plexage in silico avec MID et BarCode V4V5%%%(518F;1064R)%%%%%%%%%550%bp%
V9%%%%%%%%(1380/1389;1513)%for%eukaryotes%
)
7. Méthodes de séquençages Which)variable)regions)to)target?)
•  Illumina MiSeq R1 250 pb V1%
8F%
V2%
V4%
V3%
341%
518%
V5%
V6%
R2 250 pb 806% 926% 967% 1064%
400 pb V7%
V8%
V9%
1380%1513%
V6%%%%%%%%(967F;1046R)%%%%%%%%%60%bp%
30.000.000 séquences en parallèle V4%%%%%%%%(518F;806R)%%%%%%%%%%%288%bp%
Plusieurs librairies sur une même plaque (mul5plexage) V4V5%%%(518F;1064R)%%%%%%%%%550%bp%
Démul5plexage in silico avec MID et BarCode V9%%%%%%%%(1380/1389;1513)%for%eukaryotes%
)
7. Méthodes de séquençages •  PacBio Eid et al. Science 2009 Vol. 323 no. 5910 pp.133-­‐138 Séquençage d’une seule molécule de 5000 pb dans 10-­‐21 litre. Mul5plexage de 50.000 molécules 8. Ou5ls bioinforma5ques •  Bases de données de l’ADNr 16S Toutes les bases de donnée vont régulièrement collecter les séquences de 16S sur NCBI ou EMBL Source: Silva.de 8. Ou5ls bioinforma5ques •  Bases de données de l’ADNr 16S Ribosomal Database Project rdp.cme.msu.edu/ Chaque séquence a une taxonomie en 6 rangs Browser: naviguer dans l’arbre phylogéné5que des bactéries Classifier: permet de déterminer la taxonomie d’une séquence requête SeqMatch: permet de voire les séquences proches de la requête … 8. Ou5ls bioinforma5ques •  Bases de données de l’ADNr 16S SILVA www.arb-­‐silva.de/ Nombre de rang taxonomique ad hoc. Browser: naviguer dans l’arbre phylogéné5que des bactéries Search: permet de voire chercher des séquences par metadonnées Aligner: ………. 8. Ou5ls bioinforma5ques •  Bases de données de l’ADNr 16S GreenGenes htp://greengenes.lbl.gov Similaire a Silva et RDP Programmes a u5liser •  NCBI ?? The NCBI taxonomy database is not a primary source for taxonomic or phylogeneAc informaAon. Furthermore, the database does not follow a single taxonomic trea5se but rather atempts to incorporate phylogene5c and taxonomic knowledge from a variety of sources, including the published literature, web-­‐based databases, and the advice of sequence submiters and outside taxonomy experts. Consequently, the NCBI taxonomy database is not a phylogeneAc or taxonomic authority and should not be cited as such. htp://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/index.cgi?chapter=howcite 8. Ou5ls bioinforma5ques •  Bases de données de l’ADNr 16S Au centre des base de donnée se trouve un alignement de toute les séquences de 16s pour pouvoir les comparer entre elles. SILVA : 50.000 posi5ons GreenGenes: 7682 posi5ons 8. Ou5ls bioinforma5ques ARB + Silva 8. Ou5ls bioinforma5ques Programmes pour la créa5on de pipeline d’analyse de NGS 16S Mothur htp://www.mothur.org/wiki/Main_Page Excellent tutorial « Standard Opera5ng Procedure » 8. Ou5ls bioinforma5ques Programmes pour la créa5on de pipeline d’analyse de NGS 16S Mothur Exemple de script Mothur # REMOVE OLIGO AND TAGS, DISCARD SEQ BELOW QUALITY VALUE trim.seqs(fasta=Sam.fasta, oligos=Sam.oligos, qfile=Sam.qual, maxambig=0, maxhomop=8, pdiffs=2, qwindowaverage=35, qwindowsize=50) summary.seqs(fasta=Sam.trim.fasta) # DEREPLICATE THE DATASET: KEEP ONLY THE UNIQUE SEQ FOR DOWNSTREAM ANALYSIS unique.seqs(fasta=Sam.trim.fasta) summary.seqs(fasta=Sam.trim.unique.fasta) #ALIGN SEQS AGAINST A REFERENCE SILVA ALIGNMENT align.seqs(candidate=Sam.trim.unique.fasta, template=silva.bacteria.fasta, processors=4) Etc… 8. Ou5ls bioinforma5ques Programmes pour la créa5on de pipeline d’analyse de NGS 16S Qiime htp://qiime.org/tutorials/tutorial.html Excellent tutorial (bis) 8. Ou5ls bioinforma5ques Qiime: Exemple de script Qiime align_seqs.py -­‐i otu_$Id/otus-­‐numbered.fasta -­‐o otu_$Id/qiime/pynast_aligned -­‐t /xraid2-­‐2/simmonslab/lois/qiime_reference_files/
Silva_108/core_ aligned/Silva_108_core_aligned_seqs.fasta -­‐v filter_alignment.py -­‐i otu_$Id/qiime/pynast_aligned/otus-­‐numbered_aligned.fasta -­‐o otu_$Id/qiime/pynast_aligned/ -­‐e 0.10 make_phylogeny.py -­‐i otu_$Id//qiime/pynast_aligned/otus-­‐numbered_aligned_pfiltered.fasta -­‐o otu_$Id/qiime/pynast_aligned/otu_
$Id.tre per_library_stats.py -­‐i otu_$Id/otu_table.biom >otu_$Id/lib_counts.txt #grep Min <otu_$Id/lib_counts.txt | awk 'BEGIN {FS=": "} {print $2}' sed 's/;size=[0-­‐9]*;//g' <otu_$Id/qiime/pynast_aligned/otu_$Id.tre >otu_$Id/qiime/pynast_aligned/otu_$Id.tre-­‐RENAMED . pipe_scripts/rename_sample_with_tray_2.sh $Id qiime_tables/mapping_filtered_V6.txt beta_diversity_through_plots.py -­‐i otu_$Id/otu_table.biom -­‐o otu_$Id/qiime/bdiv -­‐t otu_$Id/qiime/pynast_aligned/otu_$Id.tre-­‐RENAMED -­‐f -­‐m qiime _tables/mapping_filtered_V6.txt-­‐RENAMED -­‐p /xraid2-­‐2/simmonslab/lois/qiime_reference_files/qiime_parameters.txt -­‐v -­‐f -­‐a -­‐O 50