Technologie

Exploration de 16 000 frontières en neuroscience – Vers la science des données

Exploration de 16 000 frontières en neuroscience - Vers la science des données


Photo de jesse orrico sur Unsplash

Récemment, j'ai beaucoup travaillé sur les applications vocales. Ce qui me frappe vraiment, c’est à quel point une interface de conversation est naturelle. Si la technologie progresse suffisamment, nous pourrons effectuer des tâches plus facilement, car nous pouvons simplement dire ce que nous voulons faire. Cependant, quelle que soit l'efficacité avec laquelle un appareil fait la surface des informations, votre capacité à digérer les informations sera toujours limitée par la vitesse à laquelle vous pouvez lire, écouter ou regarder.

C’est ce qui rend l’idée d’interfaces cerveau-ordinateur (BCI) avancées si intéressante. Ils permettraient aux gens d'apprendre, de conserver des connaissances et de communiquer plus efficacement que jamais auparavant. Elon Musk a expliqué comment sa mystérieuse start-up Neuralink développait des BCI à large bande passante pour connecter les humains et les ordinateurs. L'idée derrière Neuralink est que si le cerveau peut être interprété et manipulé à la fois en temps réel, vous pouvez «étendre» le cerveau. Cela pourrait ajouter une nouvelle couche de capacité, de compréhension et de communication. Les personnes pourront transférer des idées directement à une autre personne sans avoir besoin de communiquer avec un langage écrit ou verbal. Cependant, les BCI font l'objet de recherches depuis un certain temps et de nombreuses applications se concentrent sur l'aide aux personnes souffrant de paralysie.

Le battage médiatique récent derrière Neuralink est l’inspiration de cette analyse. Je voulais explorer les tendances en matière de recherche sur les interfaces cerveau-ordinateur. Donc, après avoir fixé mes objectifs, je me suis préparé à passer la journée à lutter contre Pandas et Matplotlib pour voir si je pouvais obtenir des informations intéressantes de mon jeu de données.

Préparation du jeu de données

Frontiers Media est un éditeur universitaire de revues scientifiques à accès libre, évaluées par des pairs. Ils ont de nombreuses revues scientifiques, technologiques et médicales. Pour mon analyse, j’ai utilisé des articles de la série de revues Frontiers in Neuroscience, qui contient certaines des meilleures revues de neuroscience au monde en termes d’influence et de qualité. Certaines de ces revues incluent Frontiers in Neuroscience, Frontiers in Neuroinformatics et Frontiers in Cellular Neuroscience.

Ma première étape consistait à collecter les données. Dans ce cas, j'ai écrit un script Python pour supprimer tous les articles sur les neurosciences. Le scraper Web a sauvegardé le texte de l'article ainsi que ses métadonnées. Pour collecter les URL de tous les articles, j'ai utilisé un peu de regex pour analyser le fichier sitemap.xml des URL de la série neuroscience. Une fois que mon scraper Web a été lancé, mon jeu de données contenait 15803 articles stockés au format JSON. Ces articles comportaient un riche éventail de métadonnées, notamment les pays de publication, les auteurs, les dates de citation et les mots-clés.

La conversion du jeu de données JSON en un fichier CSV ne pose aucun problème avec les pandas. Vous pouvez simplement utiliser le constructeur normal du cadre de données si l'objet JSON est aplati (un seul niveau de clés). Cependant, en regardant un peu plus près, il apparaît qu'il y a des objets dict vides dans les champs auxquels il manquait une valeur. Voici une astuce que vous pouvez utiliser pour remplacer ces dict vides par NaN:

df = df.mask (df.applymap (str) .eq (‘{}’))

Maintenant que tout semble aller pour le mieux, appelons df.to_csv (), téléchargez le jeu de données vers Kaggle et effectuons une analyse exploratoire des données.

Découvrez le noyau: https://www.kaggle.com/markoarezina/frontiers-in-neuroscience-article-eda

Vous pouvez trouver le jeu de données sur Kaggle: https://www.kaggle.com/markoarezina/frontiers-in-neuroscience-articles

Apprendre à connaître les données

Je souhaitais avoir une idée des types d'articles de l'ensemble de données avant de plonger de manière approfondie dans la recherche spécifique de la BCI. Outre le texte de la revue, le jeu de données contenait également une vaste gamme de métadonnées intéressantes. Cela incluait des champs utiles tels que «citation_journal_title», qui spécifiait le journal de neuroscience de l’article. Par exemple, Frontiers in Cellular Neuroscience. Étant donné que les métadonnées contenaient également le pays de citation, j'ai pensé qu'une carte détaillée des pays et des revues de neurosciences pour un certain nombre d'articles pourraient être un bon moyen d'obtenir une vue d'ensemble de l'ensemble de données.

Sur la carte thermique, vous pouvez voir certaines des revues les plus importantes de la série: Frontiers in Neuroscience cellulaire, Frontiers in Neuroscience et Frontiers in Neuroscience.

Ensuite, je voulais explorer certains des thèmes communs dans les articles. Pour ce faire, j'ai trouvé les unigrammes, les bigrammes et les trigrammes les plus courants des résumés de citations. Le graphique suivant montre quelques thèmes communs.

Les unigrammes n'ont pas révélé grand chose, sans surprise, le mot le plus courant étant «cerveau». Les trigrammes les plus courants sont liés à l'imagerie, essentielle à l'étude du cerveau. L'imagerie par résonance magnétique utilise des champs magnétiques puissants et des ondes radio pour générer des images des organes du corps. La résonance magnétique fonctionnelle fait référence à une méthode de mesure de l'activité cérébrale en détectant les changements associés au flux sanguin.

J'ai aussi pensé que l'analyse de la popularité des bigrams au fil du temps pourrait être une bonne idée. Cela révèle certains concepts clés comme la résonance magnétique, qui est l’un des meilleurs bigrames de toutes les années. Il suggère également comment la recherche a évolué au fil des ans.

La représentation graphique de la croissance en pourcentage des trigrammes au fil du temps montre des pics dans certains mots-clés en raison de l'afflux d'articles de recherche au cours d'une année donnée.

Recherche spécifique BCI

Pour commencer à analyser certains des thèmes propres aux BCI, j'ai interrogé des articles qui mentionnaient les expressions «interface cerveau / ordinateur» dans leur résumé. Cela nous donne 332 articles.

Une analyse similaire des bigrames et des trigrammes révèle certains thèmes communs dans les articles spécifiques de la BCI.

Voici quelques-uns des termes spécifiques les plus courants de BCI et leurs explications:

imagerie motrice: est l’un des concepts standard de la BCI, en ce sens que l’utilisateur peut générer une activité induite en imaginant des mouvements moteurs. Les utilisateurs peuvent avoir besoin de plusieurs sessions de formation avant d'apprendre à générer l'activité cérébrale souhaitée et à exécuter la commande souhaitée. Un protocole d'apprentissage typique pour de tels BCI comprend l'exécution d'une tâche d'imagerie motrice par l'utilisateur, suivie d'un objet en mouvement sur un écran d'ordinateur.

«Machine à vecteurs de support» / «Précision de classification»: Ces expressions apparaissent dans le contexte de la classification des signaux EEG d'imagerie motrice. Les machines à vecteurs de support peuvent être utilisées pour classifier les signaux EEG d'imagerie motrice afin de déterminer l'action à effectuer par l'utilisateur.

Tracer les bigrammes au fil du temps révèle le changement de cap au fil des ans.

Certains modèles intéressants incluent l'accent mis sur l'onde p300 ainsi que son application dans un BCI pour l'orthographe. L'électroencéphalographie et la classification de ces signaux se concentrent également de plus en plus sur les années 2017 et 2018.

Parmi les choses intéressantes à essayer dans le futur, notons la comparaison des thèmes de recherche entre les différentes revues de la série. Il serait également intéressant d'explorer davantage de données comprenant des institutions, des mots-clés et des références. Je ne connais pas grand-chose à la neuroscience et j’ai trouvé cette analyse très utile pour avoir un aperçu de certains des domaines de recherche en neuroscience axés sur les BCI. J'aimerais savoir ce que vous feriez mieux ou s'il y a quelque chose que je pourrais corriger.

Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer