PC & Mobile

Générer des images avec des autoencodeurs – Vers la science des données

Générer des images avec des autoencodeurs - Vers la science des données


Autoencodeurs

Autoencodeurs traditionnels

Les autoencodeurs sont des architectures neuronales étonnamment simples. Il s’agit essentiellement d’une forme de compression, semblable à la façon dont un fichier audio est compressé au format MP3, ou un fichier image compressé au format JPEG.

Les autoencodeurs sont étroitement liés à l'analyse en composantes principales (ACP). En fait, si la fonction d'activation utilisée dans l'auto-codeur est linéaire dans chaque couche, les variables latentes présentes au goulet d'étranglement (la plus petite couche du réseau, également appelée code) correspondent directement aux composants principaux de PCA. Généralement, la fonction d'activation utilisée dans les autoencodeurs est non linéaire. Les fonctions d'activation typiques sont ReLU (unité rectifiée linéaire) et sigmoïde.

Les calculs derrière les réseaux sont assez faciles à comprendre, je vais donc les passer brièvement en revue. Essentiellement, nous avons divisé le réseau en deux segments, le codeur et le décodeur.

La fonction encodeur, notée par φ, mappe les données d'origine X sur un espace latent F présent au goulot d'étranglement. La fonction de décodeur, notée ψ, mappe l'espace latent F au goulot d'étranglement vers la sortie. La sortie, dans ce cas, est la même que la fonction d'entrée. Ainsi, nous essayons essentiellement de recréer l'image d'origine après une compression généralisée non linéaire.

Le réseau de codage peut être représenté par la fonction de réseau de neurones standard transmise par une fonction d’activation, où z est la dimension latente.

De même, le réseau de décodage peut être représenté de la même manière, mais avec des fonctions de pondération, de polarisation et potentiellement d'activation différentes.

1555290587 481 Générer des images avec des autoencodeurs Vers la science des données - Générer des images avec des autoencodeurs - Vers la science des données

La fonction de perte peut ensuite être écrite en termes de ces fonctions de réseau, et c’est cette fonction de perte que nous utiliserons pour former le réseau de neurones à l’aide de la procédure standard de rétropropagation.

1555290587 336 Générer des images avec des autoencodeurs Vers la science des données - Générer des images avec des autoencodeurs - Vers la science des données

Étant donné que les entrées et les sorties sont les mêmes images, il ne s’agit pas vraiment d’un apprentissage supervisé ou non supervisé. Nous appelons donc cet apprentissage auto-supervisé. Le but de l’auto-encodeur est de sélectionner nos fonctions d’encodeur et de décodeur de telle sorte que nous ayons besoin du minimum d’informations pour encoder l’image de manière à ce qu’elle puisse être régénérée de l’autre côté.

Si nous utilisons trop peu de nœuds dans la couche de goulot d'étranglement, notre capacité à recréer l'image sera limitée et nous régénérerons les images floues ou non reconnaissables par rapport à l'original. Si nous utilisons trop de nœuds, il est inutile d'utiliser la compression.

Le cas de la compression est assez simple, chaque fois que vous téléchargez quelque chose sur Netflix, par exemple, les données qui vous sont envoyées sont compressées. Une fois qu’il arrive sur votre ordinateur, il est passé par un algorithme de décompression puis affiché sur votre ordinateur. Ceci est analogue au fonctionnement des fichiers zip, sauf que cela se fait en coulisse via un algorithme de streaming.

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close