Comment le séquençage de l’ADN a commencé la révolution du microbiome
… Et ce que cela signifie pour l’avenir.
- D’énormes réductions du coût du séquençage de l’ADN sont responsables de la croissance exponentielle des entreprises liées au microbiome. Le coût du séquençage de l’ADN est aujourd’hui inférieur à 0,1% par rapport à l’an 2000.
- L’automatisation des laboratoires, l’amélioration de la microfluidique et le financement public de la science (y compris le projet du génome humain) ont contribué à ces réductions de coûts et continuent de permettre la recherche sur le microbiome.
- Aujourd’hui, les sociétés de microbiome utilisent un large éventail de technologies de séquençage d’ADN appelées technologies de séquençage de nouvelle génération (NGS).
- Certaines technologies NGS comme «16S» sont relativement bon marché et donnent des informations de haut niveau sur les microbes présents. Autre séquençage en lecture longue les méthodes sont plus chères mais donnent des informations plus détaillées.
- Les progrès de la puissance de calcul, de la science des données et de l’apprentissage automatique permettent une nouvelle vague d’entreprises de microbiome. Étant donné que ceux-ci ont le potentiel de «lever tous les bateaux», mon opinion actuelle est que la capacité d’une équipe à exécuter son modèle commercial, à accéder aux données et à la chance sera le moteur du succès dans cet espace.
Dans notre premier article sur le microbiome humain, nous avons appris que notre santé est intimement liée aux milliers de milliards de microbes qui habitent également notre corps. Aujourd’hui, plus de 200 startups du microbiome tentent de transformer ces auto-stoppeurs en produits bénéfiques et de grande valeur, selon un site d’actualités de l’industrie. Pourquoi vivons-nous cette renaissance microbienne et qu’est-ce que cela signifie pour l’avenir? Pour prédire où vont les produits et les thérapies du microbiome, il est important de comprendre comment nous en sommes arrivés là.
Dans ce cas, l’explosion de la recherche, des produits et des entreprises ciblant le microbiome a été débloquée par des avancées massives dans plusieurs domaines:
- Séquençage d’ADN (et d’ARN)
- Automatisation de laboratoire
- Coût de l’informatique
- Science des données
- Grands efforts de recherche en collaboration
Les technologies de séquençage de l’ADN sont si essentielles à la recherche sur le microbiome et à l’industrie biotechnologique au sens large qu’il vaut la peine d’apprécier l’ampleur des progrès dans ce domaine.
Dans le passé, l’identification d’un seul microbe était un processus ardu. Les bactéries d’un échantillon seraient collectées, transférées dans une boîte de Pétri et laissées se multiplier pendant plusieurs jours, une méthode appelée «culture». [1] Le médecin / scientifique / chercheur regardait ensuite les bactéries avec des microscopes, les colorait avec des produits chimiques et utilisait d’autres techniques pour essayer de comprendre de quoi il s’agissait – en jouant effectivement à un jeu de «Devinez qui».
Cela a changé lorsque nous avons appris à lire rapidement et à moindre coût le génome d’un organisme, son schéma d’ADN. Tous les êtres vivants – des cellules humaines aux microbes – utilisent les mêmes quatre bases d’ADN (A, T, G et C) dans différentes séquences pour coder comment se reproduire, fabriquer des protéines et tout le reste nécessaire à la vie.
La première technologie de séquençage de l’ADN a été développée dans les années 1970 par Frederick Sanger et toujours connue sous le nom de Séquençage Sanger. Des années 1980 au milieu des années 2000, les séquenceurs d’ADN basés sur la méthode de Sanger sont devenus meilleurs, plus rapides et moins chers à mesure que l’automatisation en laboratoire augmentait et que de nouvelles façons d’identifier les différentes lettres étaient trouvées. [2] Chose incroyable, les coûts de séquençage de l’ADN au début des années 2000 baissaient déjà à un rythme comparable à la loi de Moore pour les coûts de calcul (Mardis 2013).
Cependant, le séquençage de Sanger a des limites – il lit un seul morceau d’ADN à la fois. Au milieu des années 2000, de nouvelles techniques de séquençage d’ADN ont été développées qui lisent des centaines ou des milliers de segments d’ADN simultanément. Celles-ci Technologies de «séquençage de nouvelle génération» ou NGS a permis de lire les génomes en une fraction du temps et a créé un point d’inflexion dans le prix du séquençage de l’ADN (Hayden 2014). En 2007, le coût du séquençage de l’équivalent de l’ADN d’un humain (3 milliards de lettres) était d’environ 10 millions de dollars. En 2019, il était tombé en dessous de 1000 $. Centrale de séquençage Illumina a affirmé que le «génome de 100 $» était en vue.
De 2000 à 2015, le coût de séquençage de la quantité d’ADN constituant le génome humain a diminué de PLUS DE QUATRE ORDRES DE MAGNITUDE.
Le séquençage de Sanger était une route de campagne à voie unique à travers le nouveau paysage génomique; Le séquençage NGS a effectivement créé une autoroute à 12 voies à grande vitesse. Le faible coût du séquençage a permis aux scientifiques de séquencer et d’identifier un nombre incroyable de microbes de toutes sortes d’habitats, y compris le corps humain. Il n’a pas fallu longtemps pour que les scientifiques découvrent que l’écosystème microbien humain était bien plus vaste que ce que nous pensions, et qu’il existait des tendances avec lesquelles les microbes étaient présents chez les personnes souffrant de différents problèmes de santé.
Ces percées ont été stimulées par d’importants efforts de recherche en collaboration et financés par l’État. le Projet du génome humain s’est déroulé de 1990 à 2003 lorsque la victoire a été déclarée – le génome humain a été séquencé avec succès pour la première fois, révélant tout le code ADN spécifiant un humain. Cet incroyable effort de recherche international – qui a rendu toutes les données et les résultats accessibles au public – a accéléré la recherche et le développement en génomique et a contribué à rendre le séquençage de l’ADN accessible. Je ne peux pas m’empêcher de souligner que cet investissement du gouvernement dans les «grandes sciences» – 3,5 milliards de dollars sur la durée du projet – a également généré un retour sur investissement massif dans la production économique américaine, les emplois et les recettes fiscales fédérales. [3]
Inspiré par le projet du génome humain, l’Institut national de la santé (NIH) a lancé le Projet de microbiome humain (HMP) en 2007. Il a été spécialement conçu comme un programme de ressources communautaires pour développer des outils informatiques et statistiques largement disponibles, des protocoles de mesure et des ensembles de données de référence pour aider à faire avancer le domaine émergent du microbiome. Lorsque les kits de tests de santé intestinale ont commencé à apparaître au début des années 2010, ils ont fait référence au HMP et à d’autres procédures examinées par les NIH. En établissant la validité et les meilleures pratiques initiales pour mesurer les espèces de microbiomes, ils ont créé la confiance dans la capacité des startups à fournir des informations / produits significatifs dans cet espace.
Les technologies de séquençage de l’ADN ont lancé la révolution du microbiome au début des années 2000. Les progrès de la puissance de calcul, de la science des données et de l’apprentissage automatique permettent de progresser davantage. Cela est dû en partie à la façon dont les séquences d’ADN sont lues.
Les séquenceurs sont uniquement conçus pour «lire» un certain nombre de lettres avant de s’arrêter, donc l’ADN microbien doit être coupé en plus petits morceaux avant le séquençage (c’est un art en soi). Pour obtenir la séquence complète, les fragments doivent être réassemblés – cela se fait en recherchant des bouts de lettres qui se chevauchent et en les assemblant. Aujourd’hui, les nombreux types de technologies NGS se divisent en deux catégories: séquençage à lecture courte et séquençage à lecture longue. Le séquençage à lecture courte lit l’ADN en morceaux de 50 à 700 lettres, tandis que le séquençage à lecture longue génère des «lectures» de 15 000 lettres ou plus.
Le séquençage à lecture courte est moins coûteux et peut être plus précis dans chaque bloc, mais les informations obtenues sont limitées. Une technique de lecture courte appelée Séquençage de l’ARNr 16S est devenu la norme pour les grandes études et les caractérisations initiales. [4] Des techniques comme le séquençage 16S peuvent identifier le genre et parfois les espèces de bactéries (par exemple, il y a Salmonella ou Listeria). Cependant, il ne peut pas vous donner d’informations sur des souches individuelles (par exemple, il existe un coronavirus, mais il ne peut pas vous dire s’il s’agit du SRAS1, du COVID-19 ou de tout autre élément).
Les techniques de séquençage à lecture longue sont beaucoup plus chères, mais sont mieux adaptées pour séquencer de nouveaux microbes, identifier les rares et obtenir des informations plus approfondies sur le génome. Dans les milieux de recherche, les experts conçoivent leurs expériences de séquençage pour extraire les informations les plus utiles du moins d’expériences au coût global le plus bas – un problème d’optimisation poilu. [5]
La science des données et les méthodes d’analyse comme l’apprentissage automatique sont essentielles car, à mesure que les échantillons deviennent plus complexes et que les méthodes NGS produisent de plus grands ensembles de données, le réassemblage des fragments devient plus difficile. Parce que les séquences d’ADN ne sont composées que de 4 lettres (A, T, C et G), il peut y avoir de nombreux endroits où un motif peut se répéter. Pour les fragments d’ADN d’un microbe inconnu, ou même un cocktail de nombreux microbes différents, la méthode utilisée pour analyser les données détermine souvent la valeur de ces données. Enfin, le cloud computing est devenu essentiel pour gérer les quantités incroyables de données générées.
Aujourd’hui, nous sommes assez bons pour cataloguer les microbes – répondant à la question «Qui est là?». Les sociétés de microbiome ont été universellement activées par le séquençage d’ADN à faible coût disponible. Certaines sociétés de microbiome se concentrent encore sur cette question pour le moment, ciblant des régions moins étudiées, notamment des environnements cutanés variés, le système respiratoire et même le microbiome associé aux tumeurs. Malgré son importance établie pour la santé des femmes et des nourrissons, peu de startups semblent se concentrer sur le microbiome vaginal. Le coût «par lettre» du séquençage de l’ADN continuera de diminuer à mesure que l’industrie biotechnologique continue de croître et que des quantités croissantes d’ADN doivent être séquencées.
Beaucoup estiment qu’en plus de «qui est là», nous devons comprendre «que font les microbes» pour développer des traitements de santé efficaces. Pour répondre à cette question, des chercheurs et des entreprises étudient quels gènes sont activés (transcriptomique), et les protéines et autres molécules que les microbes fabriquent et consomment (métabolomique). Les deux sont très gourmands en équipements et en données, et bénéficient à la fois d’une expertise en science des données et en analyse. L’alternative est un jeu de devinettes long et coûteux: la présence d’un microbe peut ne pas signifier qu’il est la cause du problème, et le déterminer cliniquement serait un énorme gaspillage de ressources.
Pour l’avenir, il existe plusieurs façons pour les entreprises de microbiome de gagner un avantage:
- Créez de grandes bases de données privées pour accéder à des informations uniques. Les données médicales anonymes sont particulièrement précieuses et difficiles à obtenir – le partenariat avec les centres médicaux est la clé de cette approche.
- Développez des algorithmes AI / ML avancés ou d’autres algorithmes pour trouver les connexions qui manquent aux autres.
- Pipelines de criblage à haut débit (HTS) utilisant une combinaison de -omiques pour tester de nombreux bogues ou molécules candidats et espérons avoir de la chance.
- Fournir un nouvel instrument ou diagnostic qui permettra la recherche des autres.
La plupart de ces approches bénéficient de tendances technologiques plus vastes: progrès de l’informatique (cloud) et de la science des données, IA / ML, et amélioration continue du dépistage de l’ADN (génomique) et autres -omiques. Les facteurs qui ont permis l’explosion des sociétés de microbiome – séquençage d’ADN, automatisation de laboratoire et progrès informatiques – sont suffisamment larges pour permettre la concurrence. À l’heure actuelle, il n’y a pas de gagnant clair. L’avantage du premier arrivant semble avoir été perdu ou atténué par de nouvelles avancées technologiques et des réductions de coûts. Étant donné que d’autres technologies habilitantes lèveront tous les bateaux (dépistage de l’ADN et autres -omiques, science des données, apprentissage automatique et IA), mon opinion actuelle est que la chance et la capacité d’exécution de l’équipe sont susceptibles de déterminer le succès dans cet espace.
Merci aux scientifiques, chercheurs et amis dont les connaissances ont contribué à informer ce post. Comme toujours, toutes les erreurs sont les miennes et je serais ravi de pouvoir les corriger!
Restez à l’écoute pour le prochain post, où nous explorerons l’utilisation des microbes dans un contexte clinique (médical) à la fois actuellement et à l’avenir. Répondre aux besoins médicaux est à la fois le facteur de motivation le plus puissant et le plus grand marché pour les produits liés au microbiome. le premier post sur le microbiome humain a introduit cet espace fascinant.
- Bien que les cultures bactériennes soient toujours un outil médical important, ce processus est assez long, coûteux et a une sensibilité limitée. Les échantillons ne contiennent initialement pas suffisamment de cellules bactériennes pour détecter. La plupart des bactéries pathogènes se développent suffisamment pour être observées dans un délai d’un à deux jours, mais certains organismes peuvent prendre cinq jours ou plus. (La source)
- Exemples d’améliorations de la technologie originale de séquençage d’ADN de Sanger: la capacité de marquer et de détecter par fluorescence des bases d’ADN (les lettres A T G et C); l’électrophorèse capillaire, un moyen de séparer les molécules avec différentes charges électriques sur une petite échelle; et l’automatisation générale.
- Un rapport complet décrivant comment la valeur économique du projet du génome humain a été évaluée est disponible auprès du Battele Memorial Institute ici.
- Le séquençage 16S cible un seul gène bactérien (une section d’ADN). Cette ARNr 16S Le gène fait environ 1 500 lettres, mais souvent le gène entier ne sera pas lu pour réduire les coûts. Il contient des motifs de lettres qui sont présents dans presque toutes les bactéries, permettant de cibler des parties spécifiques pour la lecture. D’autres régions de ce gène varient de manière connue, ce qui permet d’identifier rapidement le type de bactérie dans de nombreux cas.
- J’ai passé sous silence une grande complexité. Par exemple, l’une des parties les plus délicates du séquençage de l’ADN consiste à obtenir l’ADN dans un format que le séquenceur lira, ou «préparation de bibliothèque». La préparation de la bibliothèque représente souvent la majeure partie du coût de séquençage et sera spécifique à une technologie de séquençage d’ADN (par ex. Illumina’s MiSeq, ou SMRT de PacBio Séquençage).