Technologie

Apporter un sens aux données personnelles avec l'apprentissage automatique.

Apporter un sens aux données personnelles avec l'apprentissage automatique.


Pouvons-nous donner un sens à nos propres données personnelles? Connaissons-nous même les lois qui nous protègent ou nous exposent?

2*8JMv TI 9xB2q MUT8WNtg - Apporter un sens aux données personnelles avec l'apprentissage automatique.
Image de Unsplash

Alors que le domaine des mégadonnées, l'apprentissage automatique et l'intelligence artificielle continuent de croître et de révolutionner le monde actuel tel que nous le connaissons et de jouer un grand rôle dans la détermination de l'avenir, il ne fait aucun doute que certaines questions commencent à se poser en termes d'éthique, de gouvernance , les réglementations et les problèmes de confidentialité entourant la révolution des mégadonnées. À première vue, ces sujets peuvent tous être classés comme des épines dans l'avancement de l'IA et de l'apprentissage automatique, d'autant plus que la plupart des entreprises sont beaucoup plus curieuses des avantages commerciaux du domaine et pas nécessairement des inconvénients.

Les activités récentes et les tendances mondiales commencent cependant à montrer l'impact négatif qui peut être causé par l'ignorance de certaines de ces épines d'apparence apparente dans les entreprises qui tentent de faire de l'argent avec les données. L'Union européenne a été un exemple de la façon dont les gouvernements commencent à prioriser certaines réglementations auxquelles la plupart des entreprises technologiques ne prêtaient pas attention auparavant et qui affectaient donc leurs modèles commerciaux. L'application de rencontres de Facebook, qui devait être publiée aujourd'hui, un jour avant la Saint-Valentin, a été interdite par l'Union européenne car Facebook n'a pas fourni la documentation adéquate et requise aux organismes de réglementation. Leurs bureaux en Irlande ont en fait été perquisitionnés alors que les gouvernements renforcent désormais la surveillance des sociétés de Big Data.

Image de Unsplash

La question de l'éthique autour de l'IA est également une préoccupation très croissante dans cette industrie relativement nouvelle où la plupart des avantages et des inconvénients ne sont pas encore connus. À partir des défis de faire des voitures autonomes, prendre des décisions éthiques basées sur les systèmes de reconnaissance faciale récemment identifiés dans les nouvelles qui identifient faussement les personnes de couleur et en particulier les femmes noires.

La gouvernance et l'éthique de l'IA est un sujet que je voudrais approfondir à mesure que mon intérêt pour le domaine de l'IA grandit, tout comme mon sens des responsabilités. Cependant, aujourd'hui, j'ai décidé de jeter un coup d'œil à quelque chose selon nos propres moyens et contrôle; Propriété des données personnelles.

Les données que chaque entreprise avec laquelle vous avez un compte en ligne recueille auprès de vous et même de vos amis, collègues et familles et de leurs amis et familles et de la chaîne peuvent continuer indéfiniment jusqu'à ce que vous réalisiez que les entreprises ont potentiellement des données personnelles et privées sur pratiquement tout le monde. L'un des facteurs les plus troublants à ce sujet est que la majorité des utilisateurs n'ont aucune idée du type de données collectées et encore moins de leur utilisation. La pression récente des régulateurs et de la société civile oblige les entreprises à être claires sur la possibilité pour les individus non seulement de savoir quelles données sont collectées à leur sujet, mais aussi d'accéder à toutes, si possible.

Linkedin est l'une de ces plateformes qui permet aux utilisateurs de visualiser et d'accéder à leurs données. En accédant simplement aux paramètres de confidentialité de votre profil LinkedIn, vous pouvez télécharger une copie de toutes vos données à partir de Connexions, Messages, Likes, Articles, etc. Comme illustré ci-dessous:

Capture d'écran de la page des paramètres de confidentialité liés

En tant que scientifiques des données ayant accès à des données personnelles, nous pouvons nous faire une idée beaucoup plus significative de nos propres données personnelles que nous n'avons jamais eues de manière organisée et significative. Les techniques d'apprentissage automatique telles que le clustering hiérarchique et k-means et le traitement du langage naturel peuvent être utilisées sur un ensemble de données comme les données personnelles LinkedIn pour créer des informations plus approfondies sur nos propres données personnelles. Voici quelques informations que j'ai tirées d'une analyse préliminaire de mes données personnelles LinkedIn.

Les données des réseaux de médias sociaux peuvent très souvent être moins structurées et ne suivent donc pas le même format, ce qui rend difficile l'agrégation de fonctionnalités de données connectées de manière similaire. Par exemple pour le titre Fondateur, différents utilisateurs peuvent avoir le titre 1. Fondateur 2. Co-fondateur 3. Fondateur et PDG 4. Fondateur / PDG, en utilisant des techniques de normalisation des données, on peut regrouper au mieux leurs données d'expertise et de connaissances telles que sous forme de titres, de lieux et de noms d'entreprises en données organisées et structurées qui faciliteront l'application de clusters proches de précis et significatifs. Ci-dessous, j'ai inclus des extraits de l'organisation des titres et des sociétés de mes relations.

Mes relations titres de travail LinkedIn semi-normalisés
Mes relations entreprises semi-normalisées

Je prévois d'appliquer davantage de nombreuses techniques d'apprentissage automatique en cluster pour extraire des informations plus approfondies de mon réseau en utilisant des fonctionnalités telles que l'emplacement, les goûts, l'industrie, l'importance des rôles et les domaines d'expertise.

En conclusion, j'exhorte toutes les personnes à vérifier les paramètres de confidentialité de vos plateformes numériques les plus utilisées et à demander des informations sur les données dont elles disposent sur vous. Les scientifiques des données peuvent immédiatement devenir des experts en la matière de leurs propres données personnelles, une qualité très recherchée dans des domaines tels que le traitement du langage naturel, en particulier lors de la mise en œuvre du calcul de normalisation et de similitude ainsi que des techniques de réduction de dimension.

Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer