PC & Mobile

Optimisation dynamique de la vitesse – Adam C Dick

Optimisation dynamique de la vitesse - Adam C Dick


MODÉLISATION DE RÉGRESSION

Modélisation des courbes de performance des navires pour réduire la consommation de carburant

Les navires conteneurs peuvent consommer plus de 350 tonnes de carburant par jour, Photo by Anker Crew Insurance

Les coûts totaux en carburant pour l'industrie du transport maritime commercial mondial s'élevaient à environ 100 milliards de dollars en 2018. Les règlements sur les émissions imposés par l'Organisation maritime internationale devraient faire augmenter les coûts en carburant de 24 milliards de dollars lorsqu'ils entreront en vigueur en 2020. Les chercheurs étudient donc des approches statistiques Estimer la consommation de carburant en fonction de la vitesse du navire.

Des startups telles que Nautilus Labs introduisent des solutions d'intelligence artificielle afin de réduire la consommation de carburant des navires grâce à une optimisation dynamique de la vitesse. En rassemblant des données sur le temps requis pour une livraison, les performances du système de propulsion du navire et les conditions environnementales tout au long de la route, les modèles d’apprentissage automatique permettent de tracer le compromis entre les coûts en carburant et la vitesse.

Utilisons des flux de données de séries chronologiques provenant de capteurs de navires et d’enregistrements météorologiques pour former nos propres modèles de régression prédictive. Avec ces modèles, nous pouvons générer des courbes de performances des navires qui prédisent la consommation de carburant dans diverses conditions de fonctionnement. Enfin, nous pouvons vérifier la fiabilité des relevés de données de nos capteurs, qui sont sujets à la dérive, en vérifiant la stationnarité dans le temps.

Parent d'un navire vitesse dans l'eau est un prédicteur significatif de consommation de carburant du moteur principal. Une relation lisse et positive est évidente dans la dispersion bivariée des relevés de capteurs horaires effectués sur une période de près de deux ans. Nous devrions prendre note des lectures anormales, telles que la consommation de carburant négative, soulignant la nécessité de nettoyer l'ensemble de données et d'éliminer les valeurs aberrantes.

La relation harmonieuse et positive entre la consommation de carburant du moteur principal et la vitesse dans l'eau

Notre ensemble de données contient 26 colonnes et 16 248 entrées horaires pour un navire commercial de juillet 2017 à mai 2019, qui ont été filtrées à partir d'échantillons prélevés toutes les 30 secondes. Outre la consommation de carburant du moteur principal, des capteurs suivent la configuration du navire, à savoir: source de carburant, tirant d'eau, performance de l'arbre et la vitesse du navire. Vent, mer et conditions des vagues sont enregistrés à l’emplacement du navire.

Avant d’utiliser notre ensemble de données pour former un modèle d’apprentissage automatique, nous voulons gérer les enregistrements nuls et manquants. En visualisant les entrées nulles dans toutes les colonnes, nous constatons qu'environ 1% de nos enregistrements sont manquants dans 14 colonnes, y compris notre variable cible. Étant donné qu’ils représentent un petit pourcentage de tous les enregistrements, allons de l'avant et supprimons-les de l'ensemble de données.

1% des enregistrements sont manquants dans 14 colonnes de l'ensemble de données, y compris la variable cible

Chaque colonne est associée à des horodatages UNIX dans le répertoire temps colonne, indexant la série chronologique. Notre variable cible est la consommation de carburant du moteur principal, mesurée en tonnes métriques (MT) par jour. Nous suivons également laquelle des deux sources de carburant est utilisée par le navire à un moment donné. Le fuel lourd (HFO) est standard, tandis que le gasoil marin (MGO) est une alternative de choix au carburant propre.

Visualisation en série chronologique des données de capteur pour la consommation de carburant du moteur principal et les sources de carburant

Nous pouvons facilement convertir les horodatages UNIX de notre index horaire en fichiers lisibles. date / heure format en pandas. Calibrons ensuite nos enregistrements de consommation de carburant en décalant la série complète de 0,048 MT par jour. Enfin, éliminons les enregistrements pour lesquels notre variable cible mesure une consommation de carburant négative importante (par exemple, -20 MT par jour), ce qui représente 16% de tous les enregistrements.

Séries temporelles de consommation de carburant du moteur principal après suppression de 16% des enregistrements montrant une consommation négative

Nos capteurs enregistrent la vitesse et l’orientation du navire, y compris vitesse au sol, vitesse dans l'eau, titre et angle de gouvernail. Comprenons la distinction entre vitesse au sol et vitesse dans l’eau. Un navire peut avoir une vitesse au sol non nulle sans puissance motrice lorsqu'il coule dans le courant, tandis qu'un navire amarré peut avoir une vitesse de l'eau lorsque le courant le traverse.

Série chronologique Mesures de la vitesse et de l'orientation du navire

Examinons de plus près la série chronologique qui enregistre l’angle du gouvernail du navire, qui est mesuré par rapport au cap du navire. Remarquez comment les mesures oscillent entre 0 et 360 degrés, ce qui semble être des discontinuités. Ces mesures doivent être centrées autour de 0 degré. Faites donc pivoter les angles du gouvernail pour créer une plage continue comprise entre -180 et 180 degrés.

Gamme continue d'angles de gouvernail créée par des mesures rotatives comprises entre -180 et 180 degrés

Les conditions de la mer à la position GPS instantanée du navire, collectées auprès de la NOAA (Administration nationale des océans et de l’atmosphère), comprennent température de surface de l'eau, le direction du courant marin, le vitesse du courant marin et le profondeur d'eau sous la quille du navire. Nous pouvons savoir quand le navire est en mer car notre capteur enregistre la profondeur de l’eau à zéro mètre en eau profonde.

Données météorologiques recueillies auprès de la NOAA des conditions de mer à la position GPS du navire

Nous pourrions remarquer quelques pics négatifs dans la température de surface de l’eau. Un examen plus attentif montre que les valeurs sont -273,15 degrés Celsius, ce qui correspond au zéro absolu. Cela signale clairement une défaillance de l'instrumentation pendant ces indices de temps. Nous ne pouvons pas connaître la température réelle au cours de ces périodes. Remplaçons donc ces lectures par la température médiane afin de minimiser leur influence.

Température de la surface de l'eau après remplacement des mesures erronées du zéro absolu par une température médiane

Les conditions des vagues de vent sont des données météorologiques supplémentaires recueillies auprès de la NOAA qui mesurent les vagues générées par le vent local. Ces données sont exprimées en hauteur significative des vagues, période de vague et direction des vagues. Ces propriétés sont associées à état de la mer, qui décrivent une mer calme ou agitée. Malheureusement, les enregistrements en nombre excessif sont manquants. Nous devons donc exclure ces colonnes de notre analyse.

Données météorologiques recueillies auprès de la NOAA sur l’état de la mer et les conditions de houle au point de localisation GPS du navire

Maintenant que nous avons nettoyé notre ensemble de données, examinons de nouveau la dispersion bidimensionnelle de la vitesse entre la consommation d’eau et la consommation de carburant du moteur principal. Nous avons maintenant une bien meilleure image des données puisque nous avons éliminé une grande partie du bruit, ce qui aurait gêné la formation de nos modèles d’apprentissage automatique. Cependant, nous avons toujours des valeurs aberrantes, notamment lorsque nous consommons du carburant à une vitesse d’eau nulle.

Réduction du bruit dans la consommation de carburant du moteur principal et vitesse rapide dans l'eau après le nettoyage

Le tirant d'eau d'un navire mesure la distance verticale entre la ligne de flottaison et le fond de la coque, qui varie en fonction de la charge utile du navire. Le tirant d'eau est peu profond lorsque le navire est déchargé et inversement. Le tirant d’eau de la coque n’est pas constant à chaque endroit du navire en fonction de la répartition du poids du navire. Nous avons donc des capteurs de tirage au vers l'avant, à l'arrière, tribord et Port l'étendue du navire.

Séries temporelles de capteurs de tirant d'eau de coque, variables en fonction de la charge utile du navire

Nous pouvons utiliser les données du capteur de tirant d’eau de la coque pour concevoir des mesures plus significatives de la configuration du navire. Chaque capteur de tirant d’eau ne décrit qu’un point du navire, mais leur relation entre eux caractérise l’orientation du navire. Avec le projet de moyenne, on peut calculer le réduire, qui mesure la différence entre l'avant et l'arrière, tout en liste concerne les côtés tribord et bâbord.

Orientation du navire dans l'eau telle que mesurée par le tirant d'eau moyen, le trim et la liste

Les conditions de vent sur la localisation GPS instantanée du navire sont les données météorologiques finales recueillies par la NOAA. le direction du vent vrai est mesurée en degrés par rapport au nord vrai, tandis que direction du vent apparent est relatif au vecteur du navire en degrés par rapport à la proue. De même, le vitesse réelle du vent et vitesse du vent apparent indique la force du vent dans les directions vraies et apparentes.

Données météorologiques recueillies auprès de la NOAA sur les conditions de vent à la position GPS du navire

Intuitivement, la direction du vent apparent est obtenue à partir de la différence entre la direction du vent réel et le cap du navire. Puisqu'une colonne peut être déterminée en fonction des deux autres, il existe un certain degré de multicolinéarité dans les données. Nous devrons exclure au moins une de ces colonnes de nos caractéristiques de modèle. Voyons donc les coefficients de corrélation de l’état du vent avec notre variable cible.

Nous constatons en effet que la vitesse du vent réel et apparent est modérément corrélée, de même que la direction du vent réel et apparent. La vitesse du vent apparent, cependant, est le plus étroitement liée à la consommation de carburant du moteur principal. Physiquement, cela suit la mécanique vectorielle de la voile, où la vitesse du vent apparent le long du cap du navire crée la force de résistance, appelée vent contraire ou vent arrière.

Coefficients de corrélation des conditions de vent avec la consommation de carburant du moteur principal

Notre ensemble final de données de capteurs mesure les performances de l’arbre du système de propulsion du navire. Ceux-ci inclus la vitesse de l'arbre, couple d'arbre et puissance de l'arbre. La vitesse de l’arbre mesure le taux de rotation de l’hélice du navire, alors que le couple est la force de levier requise. La puissance est le produit de la vitesse et du couple de l'arbre. Nous pouvons utiliser ces mesures de performances du moteur pour isoler les valeurs aberrantes à supprimer.

Séries temporelles de métriques de performance de l'arbre d'hélice du moteur

Lorsque nous étudions la relation entre la vitesse de l’arbre moteur et la vitesse du navire dans l’eau, nous rencontrons des traces aberrantes qui pourraient être attribuées au remorquage ou à l’ancrage. 7,6% des enregistrements montrent une vitesse d’eau nulle avec une consommation de carburant non nulle ou vice versa. 0,03% supplémentaires des enregistrements sont liés à des écarts importants entre la vitesse de l’arbre et la consommation de carburant.

Valeurs aberrantes à basse vitesse (en haut) et distribution statistique (en bas) de la vitesse des navires dans l'eau

Jetons un dernier regard sur le jeu de données que nous allons utiliser pour la modélisation de régression maintenant que nous avons nettoyé les traces du capteur et supprimé les enregistrements de valeurs aberrantes. Nous avons conservé 74% de tous les enregistrements dans l'ensemble de données brutes, minimisant ainsi le bruit dans la dispersion entre la vitesse de l'eau et la consommation de carburant. Notez que les vitesses de vent apparent élevées réduisent la vitesse de l'eau au même niveau de consommation de carburant.

Jeu de données pour la modélisation de régression après nettoyage des traces de capteur et suppression des valeurs éloignées

Nous pouvons fractionner notre ensemble de données de modèle en un ensemble d’apprentissage contenant 80% (9 640 enregistrements) et un ensemble d’essais contenant 20% (2 410 enregistrements) des données. Choisissons six éléments de nos colonnes, y compris le carré de la vitesse du navire dans l'eau, pour former un modèle de régression multi-linéaire. Une estimation simple de la taille de l'effet peut être calculée à partir du coefficient et des limites statistiques de chaque colonne.

Coefficients de modèle et tailles d'effet de six caractéristiques dans un modèle de régression multilinéaire

Notre modèle de régression peut utiliser les caractéristiques de notre ensemble d’entraînement (vitesse de rotation dans l’eau, tirant d’eau moyen, vitesse du vent apparent, assiette, vitesse du courant marin et vitesse dans l’eau) pour prévoir la consommation de carburant du moteur principal. Une comparaison de ces prévisions avec la vérité au sol montre que les tendances générales des données sont capturées, bien que notre modèle semble en mélanger les principaux effets.

La vérité au sol (en haut) et la prévision par modèle de régression multi-linéaire (en bas) de l'ensemble d'apprentissage

Notre modèle de régression multi-linéaire explique la quasi-totalité de la variance de notre ensemble d’entraînement, R carré de 96,8%. Sur une plage de 0 à 50 MT par jour, on peut s’attendre à ce que la prévision ait un erreur quadratique moyenne (RMSE) de 2,98 MT par jour. Notre ensemble de test produit un R-carré de 96,9% et un RMSE de 2,95 MT par jour, ce qui signifie que notre modèle n'est ni sous-ajusté ni excessif.

Un modèle de régression doit être évalué en fonction de la performance de ses résidus, en particulier de leur normalité, de leur linéarité et de leur distribution. UNE Parcelle Q-Q montre que les résidus suivent une distribution normale avec une certaine déviation dans les queues. La dispersion bivariée de la vérité de terrain et les prédictions sont généralement linéaires, tandis que la distribution résiduelle présente un léger biais positif.

Normalité (en haut), linéarité (au milieu) et distribution (en bas) des résidus dans le modèle de régression multilinéaire

Sur la base des limites statistiques des caractéristiques de notre ensemble de données, nous pouvons consolider les conditions d’exploitation de notre navire. Ceux-ci comprennent le tirant d'eau moyen (5 à 12 mètres), l'assiette (-5 à 0 mètres), la vitesse dans l'eau (0 à 20 nœuds), la vitesse du vent apparent (0 à 50 nœuds) et la vitesse du courant marin (0 à 3 nœuds). Nous pouvons ensuite prévoir la consommation de carburant du moteur principal pour 24 192 échantillons de grille dans cet espace.

Régression multi-linéaire des prévisions de consommation de carburant pour 24 192 échantillons de grille de maillage dans l'espace des fonctions

Ces échantillons de grille équidistants représentent le double des 12 050 enregistrements de notre jeu de données modèle. Nous pouvons utiliser notre modèle de régression pour analyser les performances avec la résolution souhaitée. Les courbes de niveau soulignent l'augmentation de la demande en carburant lorsque le tirage est élevé (charge importante). Nous pouvons également voir comment la demande varie avec le tirant d'eau et la vitesse de l'eau en fonction de la vitesse du vent, de l'assiette et de la vitesse actuelle.

Sensibilité générale du modèle multilinéaire au tirant d'eau moyen (en haut) et dans des conditions spécifiques (en bas)

De même, un graphique en courbes de niveau met en évidence la sensibilité de la consommation de carburant du moteur principal au trim et à la vitesse de l'eau. Notre modèle prédit que moins de carburant est consommé lorsque le navire a une assiette de niveau, plutôt qu'un arc relevé. Pour une vitesse de vent donnée (30 nœuds), un tirant d'eau moyen (8 mètres) et une vitesse du courant marin (3 nœuds), nous pouvons optimiser la consommation de carburant avec les réglages de compensation et la vitesse de l'eau.

Sensibilité générale du modèle multilinéaire à la compensation (en haut) et à des conditions spécifiques (en bas)

La consommation de carburant est très sensible à la vitesse du vent apparent, augmentant la demande en même temps que la vitesse du vent, ce qui est compatible avec la résistance aux vents contraires. Pour un tirant d'eau moyen (8 mètres), une assiette (-2 mètres) et une vitesse du courant marin (3 nœuds), nous pouvons visualiser la sensibilité de la demande en carburant à la vitesse du vent et à la vitesse de l'eau, permettant ainsi aux équipages maritimes d'échanger de la vitesse contre de l'énergie.

Sensibilité générale du modèle multi-linéaire à la vitesse du vent (en haut) et dans des conditions spécifiques (en bas)

Enfin, nous pouvons étudier la sensibilité de la consommation de carburant à la vitesse du courant marin, ce qui a un effet limité par rapport aux autres caractéristiques du modèle. Pour une vitesse de vent apparent constant (30 nœuds), un assiette (-2 mètres) et un tirant d'eau moyen (8 mètres), la consommation de carburant augmente légèrement avec la vitesse actuelle, mais a un plus grand effet lorsque la vitesse de l'eau et la vitesse actuelle sont comparables.

Sensibilité générale du modèle multi-linéaire à la vitesse actuelle (en haut) et dans des conditions spécifiques (en bas)

Voyons comment une méthode d'ensemble, telle que le régresseur de forêt aléatoire, fonctionne par rapport à notre modèle de régression multi-linéaire, tout en utilisant les mêmes ensembles de formation et de test. Par souci de simplicité, effectuons une recherche sur la grille de seulement deux hyper-paramètres du modèle, en sélectionnant le nombre d’estimateurs (450) et la profondeur maximale de l’arbre (8) pour notre modèle de régression aléatoire de forêt.

Recherche dans la grille des hyper-paramètres (estimateurs et profondeur maximale des arbres) pour le modèle de régression de forêt aléatoire

La profondeur de l’arbre est l’hyper-paramètre critique de la forêt aléatoire. Elle réduit l’erreur de modèle lorsque la profondeur augmente, atteignant un R-carré de 99,3% et une RMSE de 1,42 MT par jour pour l’entraînement. L'épreuve suivante s'ensuit avec un R-carré de 98,9% et un RMSE de 1,74 MT par jour. L’importance des caractéristiques du modèle montre comment la vitesse de l’eau est utilisée pour expliquer 95% de la consommation de carburant.

La vitesse dans l'eau explique 95% de l'importance des fonctionnalités dans le modèle de régression de forêt aléatoire

Comme avec le modèle de régression multi-linéaire, nous pouvons comparer les prédictions du modèle de régression aléatoire de forêt avec la vérité au sol de l'ensemble de formation. Qualitativement, le modèle de forêt aléatoire semble être plus net que le modèle multilinéaire, capturant mieux la forme des données à basse vitesse. Le modèle met également l'accent sur une distinction plus forte pour l'effet de la vitesse du vent.

Vérité terrestre (en haut) et prévision par modèle de régression de forêt aléatoire (en bas) de l'ensemble d'entraînement

Le graphique Q-Q des résidus du modèle de forêt aléatoire présente une déviation plus grande dans les queues que le modèle multilinéaire, mettant potentiellement en évidence des points aberrants supplémentaires qui devraient être examinés. La largeur de bande linéaire dans la dispersion bivariée de la vérité et des prédictions au sol s'est condensée, tandis que la distribution des résidus a coalesqué autour d'un centre sans erreur.

Normalité (haut), linéarité (milieu) et distribution (bas) des résidus dans le modèle de régression aléatoire des forêts

Utilisons notre modèle de régression de forêt aléatoire pour prédire la consommation de carburant du moteur principal avec les mêmes 24 192 échantillons de grille que nous avions précédemment définis pour générer des courbes de performance du navire. Immédiatement, nous pouvons voir la différence dans la forme des prévisions avec une variabilité accrue à une vitesse de l’eau modérée, tandis que l’extrapolation à une vitesse de l’eau élevée s’aplatit.

Prévisions de régression de forêt aléatoire de la consommation de carburant pour 24 192 échantillons de grille de maillage dans l'espace des caractéristiques

Lorsque nous repérons les contours de la sensibilité de la consommation de carburant au tirant d'eau moyen, nous pouvons voir les propriétés non linéaires du modèle de forêt aléatoire, où les lignes à tirant d'eau constant se croisent. Pour une vitesse de vent constante (30 nœuds), une assiette (-2 mètres) et une vitesse actuelle (3 nœuds), nous voyons comment la forêt aléatoire se transforme rapidement pour mieux se rapprocher des conditions de chargement et de déchargement.

Sensibilité générale du modèle de forêt aléatoire au tirant d'eau moyen (en haut) et à des conditions spécifiques (en bas)

Lorsque nous avons précédemment examiné la sensibilité à la vitesse du vent, l’effet était cohérent pour différentes vitesses de l’eau, alors que le modèle de forêt aléatoire variait l’effet, en particulier à une vitesse de l’eau modérée. Pour un tirant d'eau moyen, une assiette et une vitesse du courant de la mer constants, les limites du modèle deviennent apparentes avec des prévisions peu fiables en dehors de l'ensemble de données au-dessus de la vitesse du vent de 40 nœuds.

Sensibilité générale du modèle forestier aléatoire à la vitesse du vent (en haut) et dans des conditions spécifiques (en bas)

Étant donné que nous traitons avec des données chronologiques, nous devrions nous assurer de la stationnarité des mesures de nos capteurs dans le temps. Par exemple, les capteurs surveillant la vitesse de l'eau et du sol sont susceptibles de dériver, ce qui pourrait compromettre nos modèles de régression. Nous pourrions tenter de détecter des anomalies en recherchant la différence entre la vitesse de l’eau et la vitesse au sol à différentes périodes.

Différence entre la vitesse de l'eau et la vitesse au sol avant mars 2018 et après avril 2018

Comme on peut le constater, il est difficile de détecter la dérive des capteurs en visualisant simplement les différences de distribution des populations arbitraires. Nous pouvons toutefois calculer la moyenne mobile sur 200 jours pour observer et détecter ces anomalies de capteurs. La tendance de la différence entre les mesures des capteurs de vitesse d’eau et au sol diverge lentement avec le temps, nous avertissant de la dérive des capteurs.

Moyenne mobile de différence sur 200 jours entre la vitesse de l’eau et la vitesse au sol

Nous n'avons pas encore intégré les données de performances des arbres moteur dans nos modèles de régression, mais leur forte corrélation avec la consommation de carburant pourrait améliorer encore nos modèles à l'avenir. En utilisant la connaissance du domaine des systèmes de propulsion, nous pouvons incorporer des équations basées sur la physique dans nos modèles de science des données, en créant des prédictions robustes fondées sur des principes premiers.

Parcelles de paires de corrélations des performances de l'arbre moteur avec la consommation de carburant du moteur principal

Nous pourrions également envisager un compromis entre la consommation de carburant et la vitesse d'expédition lorsque différentes sources de carburant sont utilisées. Le poids ou le volume de carburant consommé peut ne pas être l'objectif principal, cependant, il peut donc être utile d'inclure la différence dans les émissions environnementales ainsi que les coûts de carburant. En rassemblant plus de sources de données, nous pouvons générer une analyse plus riche des sources de carburant.

Différence statistique dans la consommation de carburant en utilisant du mazout lourd (HFO) et du gazole marin (MGO)

Le code source écrit pour cette analyse est disponible sur GitHub, qui comprend le nettoyage des données, l’ingénierie des caractéristiques, la détection des valeurs aberrantes et les modèles de régression pour l’apprentissage automatique permettant de prévoir la consommation de carburant pour l’optimisation dynamique de la vitesse des navires commerciaux. Ces modèles prédictifs constituent la base du développement de modèles avancés d'optimisation des trajets, des itinéraires et des flottes.

Show More

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Related Articles

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Close
Close