PMC
3. Discussion
Le DT de la plupart des bactéries dans leur environnement naturel n’est pas connu. Nous avons utilisé des estimations de la vitesse à laquelle les bactéries accumulent des mutations dans leur environnement naturel et des estimations de la vitesse à laquelle elles mutent en laboratoire pour estimer le DT de plusieurs bactéries et en déduire la distribution des DT entre les bactéries. Nous estimons que les DT sont généralement plus longs dans la nature qu’en laboratoire, mais de façon critique, nous déduisons également que les DT varient de plusieurs ordres de grandeur entre les espèces bactériennes et que de nombreuses bactéries ont des DT très lents dans leur environnement naturel.
La méthode, par laquelle nous avons déduit le DT dans la nature, repose sur trois hypothèses importantes. Nous supposons que le taux de mutation par génération est le même en laboratoire et dans la nature. Cependant, il semble probable que les bactéries dans la nature auront un taux de mutation par génération plus élevé que celles du laboratoire pour deux raisons. Premièrement, les bactéries dans la nature sont susceptibles d’être stressées, ce qui devrait augmenter le taux de mutation. Deuxièmement, si nous supposons que les DT sont plus longs dans la nature qu’en laboratoire, nous nous attendons à ce que le taux de mutation par génération soit plus élevé dans la nature qu’en laboratoire, car certains processus de mutation ne dépendent pas de la réplication de l’ADN. La contribution relative des mécanismes de mutation dépendants et indépendants de la réplication au taux de mutation global est inconnue. Les taux de substitution sont plus élevés chez les Firmicutes qui ne subissent pas de sporulation, ce qui suggère que la réplication est une source de mutations dans ce groupe de bactéries. Cependant, les taux d’accumulation de mutations semblent être similaires dans les infections latentes par rapport aux infections actives de Mycobacterium tuberculosis, suggérant que les mutations indépendantes de la réplication pourraient dominer dans cette bactérie .
La deuxième hypothèse majeure est que le taux d’accumulation des mutations dans la nature est égal au taux de mutation par an ; en effet, nous supposons que toutes les mutations sont effectivement neutres, au moins sur la période pendant laquelle elles sont testées (ou que certaines sont inviables, mais que la même proportion est inviable dans la nature et au laboratoire). Dans les études sur le taux d’accumulation, dans lesquelles elles ont été étudiées séparément, les mutations non synonymes s’accumulent plus lentement que les mutations synonymes ; les taux relatifs varient de 0,13 à 0,8, avec une moyenne de 0,57 (matériel supplémentaire électronique, tableau S3). Il n’y a pas de corrélation entre la période sur laquelle l’estimation a été faite et le rapport des taux d’accumulation des non-synonymes et des synonymes (r = 0,2, p = 0,53). Nous n’avons pas essayé de contrôler la sélection car les taux relatifs d’accumulation de synonymes et de non-synonymes ne sont disponibles que pour quelques espèces, et les taux relatifs varient entre les espèces. Cependant, nous pouvons estimer le degré auquel une sélection plus importante contre les accumulations non-synonymes délétères dans la nature entraîne une sous-estimation du DT comme suit. Le taux observé auquel les mutations s’accumulent dans une lignée bactérienne est
où α est la proportion du génome qui est non codante et β est la proportion de mutations dans la séquence codante des protéines qui sont non synonymes. δx est la proportion de mutations de la classe x (i est intergénique, s est synonyme et n est non synonyme) qui sont effectivement neutres. α et β sont approximativement 0,15 et 0,7, respectivement, dans notre ensemble de données. Bien qu’il y ait une sélection sur l’utilisation des codons synonymes dans de nombreuses bactéries, la sélection semble être faible, nous supposons donc que δs = 1. Cela implique, à partir du taux auquel les mutations non synonymes s’accumulent par rapport aux mutations synonymes, que δn = 0,6. Une analyse récente des régions intergéniques de plusieurs espèces de bactéries a conclu que la sélection est plus faible dans les régions intergéniques que dans les sites non synonymes ; nous supposons donc que δi = 0,8 . L’utilisation de ces estimations suggère que la sélection nous amène à sous-estimer le véritable taux de mutation par an dans la nature d’environ 27 % ; cela signifie à son tour que nous avons surestimé le DT d’environ 37 %, un effet relativement faible. Pour étudier la sensibilité de cette estimation aux paramètres de l’équation 1, nous avons fait varier chacun d’entre eux à tour de rôle (matériel électronique supplémentaire, tableau S4). Nous constatons que le taux de mutation observé est le plus sensible à la sélection sur l’utilisation des codons synonymes, car s’il existe une sélection sur l’utilisation des codons synonymes, cela affecte également nos estimations de la sélection sur les sites non synonymes et dans l’intergénérique. Par exemple, si la sélection sur l’utilisation des codons synonymes déprimait le taux d’accumulation des synonymes de 0,5, cela conduirait à une sous-estimation du taux de mutation de 63%, ce qui aurait à son tour conduit à une surestimation du DT de 2,7 fois.
Enfin, bien que chaque étude ait tenté d’éliminer les polymorphismes nucléotidiques simples (SNP) qui étaient apparus par recombinaison, il est possible que certains soient encore présents dans les données. Les SNP recombinés peuvent avoir deux effets. Premièrement, s’ils se sont recombinés depuis l’extérieur du clade, ils gonflent l’estimation du taux d’accumulation et conduisent donc à une sous-estimation du DT. Deuxièmement, s’il y a recombinaison à l’intérieur d’un clade, ils affectent la phylogénie et conduisent potentiellement à ce que la racine de l’arbre soit estimée plus jeune qu’elle ne devrait l’être. Cela conduira à une surestimation du DT.
Il est important de comprendre que notre méthode estime un DT moyen dans un environnement particulier où les bactéries ont été échantillonnées. La bactérie peut passer par des périodes de quiescence entrecoupées de périodes de croissance.
Malgré les hypothèses que nous avons formulées dans notre méthode, notre estimation du DT de Pseudomonas aruginosa de 2,3 h chez un patient atteint de FK est très similaire à celle estimée indépendamment à l’aide du contenu ribosomal des cellules, entre 1,9 et 2,4 h . Il existe également des preuves indépendantes que certaines bactéries se divisent lentement dans leur environnement naturel. On estime que le symbiote de puceron Buchnera aphidicola double toutes les 175 à 292 heures chez son hôte, et que Mycobacterium leprae double toutes les 300 à 600 heures sur les coussinets de souris, qui ne sont pas son environnement naturel, mais qui sont probablement similaires à la peau humaine. En outre, lors d’une récente expérience de sélection, Avrani et al. ont constaté que plusieurs populations d’E. coli, privées de ressources, ont accumulé des mutations dans le gène central de l’ARN polymérase. En raison de ces mutations, ces souches se divisaient plus lentement que les souches non mutées lorsque les ressources étaient abondantes. Il est intéressant de noter que ces mêmes mutations se retrouvent à une fréquence élevée chez les bactéries non cultivables, ce qui suggère qu’il existe dans l’environnement une classe de bactéries à croissance lente qui sont adaptées à la famine.
Korem et al. ont récemment proposé une méthode générale par laquelle le DT peut être potentiellement estimé. Ils notent que les cellules bactériennes à réplication active ont deux ou plusieurs copies du chromosome près de l’origine de la réplication, mais une seule copie près du terminus, si la division cellulaire se produit rapidement après l’achèvement de la réplication de l’ADN. En utilisant le séquençage de nouvelle génération, ils montrent qu’il est possible de tester ce signal et que le rapport de la profondeur de séquençage près de l’origine et du terminus est corrélé aux taux de croissance bactérienne in vivo. Brown et al. ont étendu la méthode aux bactéries sans génome de référence et/ou à celles sans origine et terminus de réplication connus. En principe, ces mesures des cellules effectuant la réplication de l’ADN pourraient être utilisées pour estimer la DT des bactéries dans la nature. Cependant, il n’est pas clair comment ou si les méthodes peuvent être calibrées. Korem et al. (2015) et Brown et al. (2016) constatent que leurs mesures de réplication ont une médiane d’environ 1,3 pour les bactéries de l’intestin humain. Cependant, une valeur de 1,3 se traduit par des valeurs relatives et absolues différentes du DT dans les deux études. Brown et al. montrent que leur mesure de réplication, iRep, est fortement corrélée à la mesure de Korem et al., PTR, pour les données de Lactobacillus gasseri ; l’équation reliant les deux statistiques est iRep = -0,75 + 2 PTR. Par conséquent, lorsque PTR = 1,3, iRep = 1,85 et lorsque iRep = 1,3, PTR = 1,03. Les deux méthodes ne sont pas cohérentes. Elles donnent également des estimations très différentes pour le DT absolu. Korem et al. montrent que le PTR est fortement corrélé au taux de croissance d’E. coli cultivé dans un chemostat. Si nous supposons que la relation entre le PTR et le taux de croissance est la même pour les bactéries in vivo et in vitro, cela implique que le DT médian pour le microbiome humain est d’environ 2,5 h. En revanche, Brown et al. estiment que le taux de croissance de Klebsiella oxytoca est de 19,7 h chez un nouveau-né en utilisant des comptages fécaux et trouvent que cette population a une valeur iRep d’environ 1,77. Cette valeur est supérieure à celle de la grande majorité des bactéries du microbiome humain et des bactéries de la radiation Candidate Phyla, ce qui suggère que la plupart des bactéries de ces deux communautés se répliquent très lentement. Ces divergences entre les deux méthodes suggèrent qu’il n’est peut-être pas facile de calibrer les méthodes PTR et iRep pour donner des estimations du DT entre les bactéries.
Enfin, comment devons-nous interpréter nos résultats pour les cinq espèces focales dans le contexte de ce que l’on sait de leur écologie ? Vibrio cholerae affiche le DT le plus court de 1,1 h. Les espèces Vibrio sont omniprésentes dans les environnements estuariens et marins . Elles sont connues pour avoir des temps de génération très courts en culture, le plus court étant celui de Vibrio natriegens de seulement 9,8 minutes. Dans la nature, ils peuvent exploiter un large éventail de sources de carbone et d’énergie, ce qui leur vaut d’être qualifiés d' »opportunitrophes ». Les communautés naturelles de Vibrio ne se développent pas continuellement à un rythme accéléré, mais peuvent exister pendant de longues périodes dans un état semi-dormant ponctué par des impulsions rapides de taux de croissance élevés, ou blooms, lorsque les conditions sont favorables. Il a également été avancé que la division inhabituelle des génomes de Vibrio en deux chromosomes facilite une croissance plus rapide. En mettant en évidence un DT très court chez V. cholerae, notre analyse est, par conséquent, cohérente avec ce que l’on sait de l’écologie de cette espèce.
Staphylococcus aureus se trouve principalement sur les animaux et les humains et habite diverses parties du corps, y compris la peau et les voies respiratoires supérieures . Il peut provoquer des infections de la peau et des tissus mous ainsi que des bactériémies . Staphylococcus aureus présente une série de modes de croissance, dont certains peuvent lui permettre de survivre au stress et aux antimicrobiens lorsqu’il est dans son hôte. Par exemple, de petites sous-populations peuvent adopter un mode de vie à croissance lente, quasi-dormant, soit dans un biofilm multicellulaire, soit sous forme de petites variantes de colonies (SCV) ou de cellules persistantes. Notre court DT de 1,8 h suggère que ce n’est pas l’état typique de S. aureus dans la nature, ce qui n’est pas surprenant si l’on considère que l’incidence des SCV dans les échantillons cliniques est assez faible, entre 1 et 30% .
Pseudomonas aeruginosa peut habiter une grande variété d’environnements, y compris le sol, l’eau, les plantes et les animaux. Comme nos autres espèces focales, c’est un pathogène opportuniste qui peut également infecter les humains, en particulier ceux dont le système immunitaire est compromis, comme les patients atteints de FK. Dans ce contexte, l’infection est chronique. L’évolution parallèle, la régulation différentielle des gènes qui lui permettent d’échapper au système immunitaire de l’hôte et de résister aux traitements antibiotiques pendant l’infection, ainsi que des preuves de sélection positive suggèrent que P. aeruginosa peut s’adapter aux poumons des personnes atteintes de FK pour sa survie à long terme. On sait que P. aeruginosa se développe activement dans les expectorations, où il utilise la nourriture disponible, ce qui lui permet d’atteindre des densités de population élevées. Sa capacité à s’adapter et à se développer activement dans les expectorations de FK est cohérente avec son DT relativement court de 2,3 h, surtout si l’on considère que c’est l’environnement dans lequel le taux d’accumulation a été mesuré et correspond à celui estimé par Yang et al. .
Escherichia coli et S. enterica résident principalement dans l’intestin inférieur des humains et des animaux, mais peuvent également survivre dans l’environnement. Bien que E. coli soit couramment récupéré dans des échantillons environnementaux, on ne pense pas qu’il soit capable de se développer ou de survivre pendant des périodes prolongées en dehors des entrailles des animaux à sang chaud, sauf dans les régions tropicales où les conditions sont plus favorables , bien que certaines souches phylogénétiquement distinctes semblent se reproduire et survivre bien dans l’environnement . En revanche, Salmonella est également un colonisateur entérique des animaux à sang froid, en particulier les reptiles, et est mieux adaptée que E. coli pour survivre et se développer dans des niches environnementales. Par exemple, Salmonella peut survivre et se développer pendant au moins un an dans le sol, alors que E. coli ne peut survivre que quelques jours. Bien que ces niches secondaires puissent jouer un rôle plus important chez Salmonella que chez E. coli, il n’en reste pas moins que les taux de croissance dans l’environnement seront beaucoup plus faibles que ceux dans un intestin. Par conséquent, la ténacité accrue de Salmonella dans les environnements non hôtes par rapport à E. coli pourrait contribuer à expliquer le DT plus lent chez cette espèce.
En résumé, la disponibilité des estimations des taux d’accumulation et de mutation nous permet de déduire le DT des bactéries dans la nature, et la distribution des DT sauvages entre les espèces bactériennes. Ces estimations de DT sont susceptibles d’être sous-estimées car le taux de mutation par génération devrait être plus élevé dans la nature qu’en laboratoire, et certaines mutations ne sont pas générées par la réplication de l’ADN. Notre analyse suggère donc que les DT dans la nature sont généralement plus longs que ceux du laboratoire, qu’ils varient considérablement entre les espèces bactériennes et qu’une proportion substantielle d’espèces ont des DT très longs dans la nature.