On remote matching of ships to pollution
Leino, Ali (2019-10-04)
On remote matching of ships to pollution
Leino, Ali
(04.10.2019)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2019101733557
https://urn.fi/URN:NBN:fi-fe2019101733557
Tiivistelmä
Air pollution from shipping emissions is a significant hazard for humans and the environment. International Maritime Organization (IMO) has introduced limits on the used fuel and exhaust emissions from ships. A fixed measurement station can be used to remotely measure exhaust gases from passing ships to indicate their compliance with regulations. Automatic operation of a station requires that it can pair a measurement to a ship.
Data from a measurement station in Turku archipelago was used to collect gas concentrations, atmospheric data and Automatic Identification System (AIS) measurements from passing ships. Ship location information and class (A or B) were used from the AIS data. Data for the years 2017 and 2018 was used, with the latter used as a test set.
A prediction model is designed to predict a concentration time series for a ship’s route in the current atmospheric conditions. The model is based on the Gaussian puff approach with traditional Pasquill stability classes to estimate dispersion parameters. The time of maximum concentration and its value is extracted from the predictions for each passing ship. A separate peak detection model is used to extract peaks from measured gas concentrations that are significant and may originate from passing ships. Every predicted peak is matched to temporally closest observed peak to arrive at a list of possible matches of ships to their measured pollution.
A new family of classification metrics is introduced that take into account the probability of matches happening at random. A modification of the F1-score, F1t-score was used as a performance metric. One set of parameters of the model control which predicted and observed peaks are used for matching. These were optimized using Random Search (RS). We show that without the random performance adjustment the model can’t be optimized to results that represent ships matched to their pollution. Further the effect of including Class B ships is shown to always reduce the performance of the model.
A novel approach is used to learn a wind calibration function to correct for the effect of nearby obstacles. With the parameters optimized by RS locked, the parameters of the wind calibration are optimized using Stochastic Gradient Descent (SGD). This process is continued with another round of RS and SGD and is hence called iterative RS+SGD. Results of the wind calibration were validated using both visual comparison and by calculating the root-mean-square error (RMSE) with a nearby weather station maintained by Finnish Meteorological Institute (FMI). The results show that the method learned a correction that better represents the true wind conditions than without the correction. Iterative RS+SGD improved the F1t-score while lowering the amount of random matches. Merenkulun päästöt ovat merkittävä haitta sekä ihmisten terveydelle että ympäristölle. Kansainvälinen merenkulkujärjestö (IMO) on asettanut rajoja käytetylle merenkulun polttoaineelle ja laivojen päästöille. Paikallaan oleva mittausasema voi mitata ohiajavien laivojen pakokaasuja ja raportoida noudattavatko laivat IMOn asetuksia. Jotta mittausasema voi toimia automaattisesti, sen pitää pystyä liittämään mitattu päästö oikeaan laivaan.
Turun saaristossa olevaa mittausasemaa käytettiin mittaamaan kaasukonsentraatioita, meteorologista dataa ja AIS-viestejä (Automatic Identification System) ohittavista laivoista. AIS-viesteistä käytettiin laivojen sijaintitietoja ja lähettimen luokkaa (A tai B). Vuoden 2017 dataa käytettiin mallien kouluttamiseen ja vuoden 2018 testaamiseen.
Ennustemalli kehitettiin ennustamaan laivan päästöjä vallitsevissa sääolosuhteissa. Malli perustuu Gaussin pöllähdysmalliin (engl. Gaussian puff model), jonka dispersioparametreja ennustetaan Pasquillin vakausluokilla (engl. Pasquill stability class). Jokaiselle ohi ajavalle laivalle lasketaan ennustetun konsentraation aikasarja, jonka maksimiarvo ja sen aika poimitaan. Erillistä piikintunnistusalgoritmia (engl. peak detection algorithm) käytettiin poimimaan vahvoja piikkejä mitatuista kaasuarvoista, joiden oletetaan tulevan laivoista. Jokainen ennustettu piikki yhdistetään ajallisesti lähimpään mitattuun piikkiin, jolloin saadaan lista laivoista ja niiden päästöistä.
Kehitettiin uusi perhe klassifiointimetriikoita, jotka ottavat huomioon mahdollisuuden sille, että yhdistämisiä tapahtuu satunnaisesti. F1-arvosta johdettua satunnaisvirheen huomioon ottavaa F1t-arvoa käytettiin metriikkana optimoitaessa yhdistämismallia. Osa mallin parametreista kontrolloi mitä mitattuja ja havaittuja piikkejä käytetään yhdistämiseen. Nämä parametrit optimointiin satunnaishaulla. Näytämme miten tulokset eivät edusta laivoja ja niiden todellisia päästöjä kun käytetään metriikkaa joka ei ota huomioon satunnaismahdollisuutta, vaan lähes mielivaltaisia yhdistyksiä. Lisäksi näytämme miten luokan B alukset huonontavat aina tuloksia.
Tuulen kalibraatiomalli suunniteltiin ja opetettiin korjaamaan lähellä olevien esteiden aiheuttamia vääristymiä mitatussa tuulen voimakkuudessa. Tuulikalibraation parametrit optimoitiin stokastisella gradienttioptimoinnilla (engl. stochastic gradient descent), kun satunnaishaun parametrit on ensin lukittu. Tätä prosessia vuorotellaan satunnaishaun ja gradienttihaun välillä. Tuulikalibraation tulokset validoitiin ensin visuaalisella vertailulla maastomuodostelmiin, ja sitten laskemalla neliöllinen keskiarvovirhe kalibroidun tuulen ja ilmatieteen laitoksen havaintoaseman välillä. Molemmat tulokset näyttävät, että menetelmä oppii korjaamaan tuulta niin, että se vastaa paremmin todellisia tuuliolosuhteita. Lisäksi menetelmä paransi F1t-arvoa samalla vähentäen todennäköisyyttä satunnaiseen yhdistämiseen.
Data from a measurement station in Turku archipelago was used to collect gas concentrations, atmospheric data and Automatic Identification System (AIS) measurements from passing ships. Ship location information and class (A or B) were used from the AIS data. Data for the years 2017 and 2018 was used, with the latter used as a test set.
A prediction model is designed to predict a concentration time series for a ship’s route in the current atmospheric conditions. The model is based on the Gaussian puff approach with traditional Pasquill stability classes to estimate dispersion parameters. The time of maximum concentration and its value is extracted from the predictions for each passing ship. A separate peak detection model is used to extract peaks from measured gas concentrations that are significant and may originate from passing ships. Every predicted peak is matched to temporally closest observed peak to arrive at a list of possible matches of ships to their measured pollution.
A new family of classification metrics is introduced that take into account the probability of matches happening at random. A modification of the F1-score, F1t-score was used as a performance metric. One set of parameters of the model control which predicted and observed peaks are used for matching. These were optimized using Random Search (RS). We show that without the random performance adjustment the model can’t be optimized to results that represent ships matched to their pollution. Further the effect of including Class B ships is shown to always reduce the performance of the model.
A novel approach is used to learn a wind calibration function to correct for the effect of nearby obstacles. With the parameters optimized by RS locked, the parameters of the wind calibration are optimized using Stochastic Gradient Descent (SGD). This process is continued with another round of RS and SGD and is hence called iterative RS+SGD. Results of the wind calibration were validated using both visual comparison and by calculating the root-mean-square error (RMSE) with a nearby weather station maintained by Finnish Meteorological Institute (FMI). The results show that the method learned a correction that better represents the true wind conditions than without the correction. Iterative RS+SGD improved the F1t-score while lowering the amount of random matches.
Turun saaristossa olevaa mittausasemaa käytettiin mittaamaan kaasukonsentraatioita, meteorologista dataa ja AIS-viestejä (Automatic Identification System) ohittavista laivoista. AIS-viesteistä käytettiin laivojen sijaintitietoja ja lähettimen luokkaa (A tai B). Vuoden 2017 dataa käytettiin mallien kouluttamiseen ja vuoden 2018 testaamiseen.
Ennustemalli kehitettiin ennustamaan laivan päästöjä vallitsevissa sääolosuhteissa. Malli perustuu Gaussin pöllähdysmalliin (engl. Gaussian puff model), jonka dispersioparametreja ennustetaan Pasquillin vakausluokilla (engl. Pasquill stability class). Jokaiselle ohi ajavalle laivalle lasketaan ennustetun konsentraation aikasarja, jonka maksimiarvo ja sen aika poimitaan. Erillistä piikintunnistusalgoritmia (engl. peak detection algorithm) käytettiin poimimaan vahvoja piikkejä mitatuista kaasuarvoista, joiden oletetaan tulevan laivoista. Jokainen ennustettu piikki yhdistetään ajallisesti lähimpään mitattuun piikkiin, jolloin saadaan lista laivoista ja niiden päästöistä.
Kehitettiin uusi perhe klassifiointimetriikoita, jotka ottavat huomioon mahdollisuuden sille, että yhdistämisiä tapahtuu satunnaisesti. F1-arvosta johdettua satunnaisvirheen huomioon ottavaa F1t-arvoa käytettiin metriikkana optimoitaessa yhdistämismallia. Osa mallin parametreista kontrolloi mitä mitattuja ja havaittuja piikkejä käytetään yhdistämiseen. Nämä parametrit optimointiin satunnaishaulla. Näytämme miten tulokset eivät edusta laivoja ja niiden todellisia päästöjä kun käytetään metriikkaa joka ei ota huomioon satunnaismahdollisuutta, vaan lähes mielivaltaisia yhdistyksiä. Lisäksi näytämme miten luokan B alukset huonontavat aina tuloksia.
Tuulen kalibraatiomalli suunniteltiin ja opetettiin korjaamaan lähellä olevien esteiden aiheuttamia vääristymiä mitatussa tuulen voimakkuudessa. Tuulikalibraation parametrit optimoitiin stokastisella gradienttioptimoinnilla (engl. stochastic gradient descent), kun satunnaishaun parametrit on ensin lukittu. Tätä prosessia vuorotellaan satunnaishaun ja gradienttihaun välillä. Tuulikalibraation tulokset validoitiin ensin visuaalisella vertailulla maastomuodostelmiin, ja sitten laskemalla neliöllinen keskiarvovirhe kalibroidun tuulen ja ilmatieteen laitoksen havaintoaseman välillä. Molemmat tulokset näyttävät, että menetelmä oppii korjaamaan tuulta niin, että se vastaa paremmin todellisia tuuliolosuhteita. Lisäksi menetelmä paransi F1t-arvoa samalla vähentäen todennäköisyyttä satunnaiseen yhdistämiseen.