AS “SAF TEHNIKA” un Rīgas Tehniskā universitāte ir veikušas prognozējošu algoritmu grupu un modeļu precizitātes novērtējuma metriku analīzi, noteikuši telpās samazināmu sensoru veidus un apjomu un izstrādājušas temperatūras sensora prototipu

Pētījums Nr. 1.3. "Sensoru risinājuma un prognozējošo modeļu izstrāde optimālai ēku energoefektivitātes pārvaldībai". Projekts Nr. 5.1.1.2.i.0/1/22/A/CFLA/002 "Latvijas Elektrisko un optisko iekārtu ražošanas nozares kompetences centrs”.

Atbilstoši projektā analizētajiem algoritmiem, var uzskaitīt šādas galvenās algoritmu grupas [Zhang_2021]:

  • regresijas metodes – izmanto esošo mērījumu virknes īpašības, lai modelētu kādu matemātisku funkciju, kura, savukārt, ļauj prognozēt nākotnes stāvokļus. Metožu grupa ir ērti pielietojama skaitlisku datu virknēm;
  • atbalsta vektoru mašīnas (Support Vector Machines) – pārraudzītas mašīnmācīšanās metožu grupa, kas izmanto datu punktus, uz kuriem tiek balstīta n-1 dimensiju funkcijas, kas atdala piemērus tā, lai attālums starp dažādu klašu piemēriem būtu maksimāls. Minētos datu punktus sauc par atbalsta vektoriem, uz kuriem “balstās” atdalīšanas funkcijas.
  • mākslīgie neironu tīkli – metožu grupa, kas imitē dzīvas neironu šūnas un ir apvienotas vienotā skaitļošanas sistēmā – tīklā, kas ļauj risināt dažādus uzdevumus, t.sk. klasificēšanu vai prognozēšanu. Risināmais uzdevums ir cieši saistīts ar tīkla struktūru un individuālām mākslīgo neironu īpašībām.
  • dziļā mašīnmācīšanās (Deep Learning) – mākslīgo neironu tīklu tālās attīstības rezultāts, kas sniedz iespēju risināt augstākas sarežģītības problēmas, pateicoties tīkla struktūras sarežģītībai.
  • klasifikācijas kokos sakņotas metodes – metožu grupa, kas par pamata struktūru izmanto klasifikācijas kokus.
  • hibrīdas metodes – tādas, kas apvieno un sapludina vairākas iepriekš minētas metodes ar mērķi pastiprināt to priekšrocības uz trūkumu samazinājuma rēķina.
  • autoregresīvas metodes – regresijas metožu paplašinājumi, kas pielietojami tieši laikrindu analīzei un prognozēšanai. Metožu pamatā ir iespēja izmantot esošas laikrindas statistiskās īpašības, kas ļauj aplēst laikrindas attīstību nākotnē – prognozēt to.
  • izplūdis laikrindu modelis (Fuzzy Timeseries Model), kas nodrošina iespēju aplēst laikrindas nākotnes vērtības, izmantojot eksperta sniegtu izplūdušu modeli, kas saista iepriekšējos novērojumus ar nākotnes novērojumiem.
  • citi modeļi.

Visbiežāk izmantotās algoritmu sniegto prognožu precizitātes novērtējuma metrikas ir:

  • Vidējās kvadrātiskās kļūdas variācijas koeficients (CVRMSE – Coefficient of Variation of Root Mean Square Error). Standartizē (ar novirzes starpniecību) sagaidāmo kļūdu un sniedz novērtējumu, kas nav atkarīgs no mērvienībām.
  • Vidējā absolūtā procentuālā kļūda (MAPE – Mean Absolute Percentage Error). Sniedz relatīvu kļūdas novērtējumu starpībai starp sagaidāmo un novēroto vērtību, mazinot absolūtās kļūdas ietekmi.
  • Vidējā absolūtā kļūda (MAE – Mean Absolute Error). Sniedz novērtējumu starpībai starp sagaidāmo un novēroto vērtību.
  • Skanes Vidējā Kvadrātiskā kļūda (RMSE – Root Mean Square Error). Visplašāk izmantotais sagaidāmās kļūdas novērtējums, ļaujot samazināt individuālu ekstremālu vērtību ietekmi.
  • Determinācijas koeficients (R2) – Kopējā dispersija vērtībām, kas ir izskaidrojamas ar regresijas modeli. [Wang_2022] Šo konkrēto metriku neizmanto, pretēji pārējām metrikām.

Projekta ietvaros ir identificētas divas publikācijas, kuras var attiecināt uz sensoru izvietojumu un skaitu:

[Chen_2022] – autori piedāvā konkrētu šķidrumu dinamikā sakņotu metodi, kas pie dabīgas ventilācijas sistēmas ļauj optimizēt temperatūras sensorus tā, lai to mērījumi būtu reprezentatīvi, t.i. atspoguļotu pret tilpumu normalizētu vidējo temperatūras vērtību telpā. Šī metode patiešām ļauj novērtēt temperatūras sensoru izvietojumu, bet tai ir šādi būtiski ierobežojumi:

  • tās izmantošanai nepieciešams precīzs telpu modelis, kā arī gaisa kustības modelis katrā telpā;
  • ir būtisks pieņēmums – dabīga ventilācija.

Neviens no šiem faktoriem nav patiess projekta ietvaros izmantojamo telpu aprīkošanai un eksperimentu noturēšanai. Ir jāuzsver, ka pie mūsdienu energoefektivitātes prasībām, dabīga ventilācija ir drīzāk izņēmums nevis prakse.

[Egemose_2022] – autori piedāvā paņēmienu, kas ļauj ar salīdzinoši ierobežotu sensoru skaitu (PIR, CO2 un Elektroenerģijas patēriņa sensori) noteikt konkrētu cilvēku skaitu telpā, kas tālāk var tikt izmantots enerģijas patēriņa modeļos. Lai arī šis darbs precīzi neatbilst projekta risināmai problēmai, tajā ir daži būtiski aspekti:

  • Autori pierāda, ka ar 20% telpu pārklājumu ar sensoriem pietiek, lai salīdzinoši precīzi noteiktu cilvēku skaitu telpās. Eksperimentāli tas pierādīts ar izglītības iestāžu ēkām Dānijā un Kanādā. Tas ļauj izteikt hipotēzi, ka orientējoši 20% pārklājuma ir pietiekami, lai spriestu arī par citiem procesiem ēkā, kas saistīti ar enerģijas patēriņu. Šo eksperimentāli noteikto robežu var izmantot par bāzi projekta ietvaros veiktajiem pētījumiem un tajos sasniegto rezultātu novērtējumam;
  • Šo metodi var izmantot, lai ar cilvēku skaita aplēses datiem papildinātu prognozējošos modeļus, šādi palielinot to precizitāti.

Viena no projekta hipotēzēm ir “Līdzīgas uzvedības telpās esošie sensori potenciāli uzrāda līdzīgus mērījumus. Tādēļ tie nav jādublē, šādi samazinot kopējo sensoru skaitu ēkā.”.

Projektā izmantoti RTU DITF ēkā izvietoti sensori, kas nodrošina temperatūras, gaisa mitruma un ogļskābās gāzes koncentrācijas mērījumus. Sensori ir iedalāmi grupās pēc izvietojuma (pa stāviem) un pēc telpas pielietojuma – kabinets vai koridors.

Lai mazinātu kopējo kombināciju skaitu, veikta sekojošu sensoru pāru atlase:

  1. Katrā kombinācijā var novērtēt minimālo mērījumu atšķirību starp visiem pieejamiem mērījumu punktiem. Vairākām kombinācijām šī atšķirība visticamāk būs nulle, jo ilgākā laika periodā daudzi mērījumi būs vienādi. Savukārt, tās sensoru kombinācijas, kurām minētā atšķirība nav nulle, var uzreiz izslēgt no tālākā novērtējuma, pieņemot tās par kombinācijām, kas nekad neatkārto viena otru, jo to vērtības nekad nesakrīt.
  2. Atlase pēc mērījumu starpības, kad tiek novērtēta vidējā absolūtā starpība starp visiem mērījumiem katrai divu sensoru kombinācijai. Šis rādītājs var norādīt, cik vidēji līdzīgi ir divi sensori. Lai izmantotu šo paņēmienu, ir nepieciešams noteikt slieksni, kura izvēle varētu būt atkarīga no ēkas BMS (Building Management System) iespējām, kā arī citiem faktoriem. Šajā apskatā tika izmantos slieksnis 0,5°C kā vidējais rādītājs.
  3. Vidējā kvadrātiskā starpība. Ar vidējo absolūto atšķirību ir iespējams efektīvi atpazīt ilgstošas mērījumu atšķirības, tomēr, ja rodas īslaicīga starpība starp diviem mērījumiem, to var nepamanīt, jo vidējais rezultāts var būtiski nemainīties. Savukārt vidējā kvadrātiskā starpība šādas atšķirības atklāj labāk. Līdzīgi kā iepriekš, arī šeit ir nepieciešams slieksnis, kurš šajā gadījumā tika noteikts kā 0,25.

Izmantojot atlases metodes, atlasītas 77 kombinācijas, kas atbilstoši paņēmienam ir vislīdzīgākās un veikta sākotnējā detalizētākā sensoru līdzību analīze, tās rezultātā filtrēto kombināciju skaits samazinās par 18 kombinācijām.

Vairākās tālākas iterācijās noteikti sensori, kas var tikt aizstāti ar citiem, faktiski nezaudējot mērījumu kvalitāti, uz ko norāda salīdzinoši nelielā vidējā novirze ilgstošā laika periodā. Vairākiem sensoriem ir datu pārtraukumi, tāpēc salīdzinājuma datu apjoms varētu būt par maz, lai objektīvi novērtētu to uzvedību izvēlētajā periodā. Papildus tam nav pieejami dati dzesēšanas režīmam, un pieejamais datu apjoms ir mazāks par vienu gadu. Līdz ar to vasaras periodā mērījumi var radīt būtiskas izmaiņas novērtējumā. Pagaidām ir aizvietojamās kombinācijas, kurās sensori atrodas dažādos stāvos, kas var mainīties ar augstu saules intensitāti.

Sākotnējā aplēse par 20% sensoru pietiekamību šajā fāzē nav apstiprinājusies (aizvietojamo sensoru skaits ir lielāks par 20%, apmēram 60%). Tālākie pētījumi tiek veikti konkrētu sliekšņa vērtību noteikšanai, kā arī citu metriku piemērošanai.

Sensoru rādījumu līdzības novērtēšanai izmantota papildus metrika - Laika dinamiskā deformācija (no angļu val. Dynamic Time Warping). Laika rindu analīzē dinamiskā laika deformācija (DTW) ir algoritms divu laikrindu līdzības mērīšanai, kuru ātrums var atšķirties. Piemēram, cilvēka gaitas līdzību var noteikt, izmantojot DTW, pat ja viena persona iet ātrāk par otru vai, ja novērojuma laikā bija paātrinājumi un palēninājumi. DTW ir izmantots video, audio un grafikas datu laikrindām — visus datus, ko var pārvērst vienas dimensijas laikrindā, var analizēt ar DTW.

Veikti sensoru iegūto datu salīdzinājumi, izmantojot DTW metriku ar mērķi salīdzināt konkrētus sensorus, kā arī salīdzināt rezultātu ar iepriekšējā periodā iegūto salīdzinājumu.  Salīdzinājums veikts pa stāviem dažāda garuma datu virknēm 1 diena un 1 mēnesis. Papildus tam veikta dažādu stāvu sensoru datu salīdzinājums. Salīdzinot datus novērots, ka ir sensori, kuru laikrindas ir līdzīgākas un tādi, kas ir atšķirīgāki. Pie tam, ilgākā laika posmā laikrindas atbilstoši DTW metrikai ir līdzīgākas nekā īsākam laika periodam, kas ir skaidrojams ar konkrētas dienas atšķirību lielāku ietekmi, kura ilgākā laika posmā drīzāk ir izņēmums, nevis likumsakarība. Neskatoties uz to, sensoru vidējā līdzība saglabājas kā ilgākos, tā īsākos laika posmos, kas norāda uz atbilstošo telpu līdzīgo vai atšķirīgo uzvedību.

Secināts, ka ir sensori, kas ir relatīvi atšķirīgi no visiem izmantotajiem sensoriem, norādot uz telpu specifisku izmantojumu un to, ka šie sensori faktiski nav aizvietojami. Šie sensori ir relatīvi atšķirīgi arī dažādu stāvu salīdzinājumā, tādejādi var apgalvot, ka tie atspoguļo telpu unikālu uzvedību.

Atbilstoši sākotnējam novērtējuma savstarpēji aizvietojami ir ~30% sensoru, kuru DTW līdzība nepārsniedz 50. Šāds novērtējums atbilst sākotnējai aplēsei un ir optimistiskāks nekā izmantojot kvadrātiskās kļūdas novērtējumu. Secināt, ka, izmantojot pat salīdzinoši vienkāršas metodes, iespējams noteikt, kuru sensoru lietojums un uzstādīšana ir būtiska, bet kuri savstarpēji aizvietojami, šādi samazinot sākotnējo ieguldījumu apjomu vismaz par 30%, kas ir būtisks.

Rīgas Tehniskās universitātes (RTU) telpās Zunda Krastmalā 10, Rīgā, ir uzstādīts sensoru komplekts, lai, izmantojot to datus, izstrādātu paņēmienu, kas ļauj novērtēt ēkas termodinamiskās uzvedības prognozēšanai nepieciešamo minimālo sensoru skaitu, tipu un izvietojumu ēkā, pieņemamam prognozes precizitātes sasniegšanai.

Ēkā, Zunda krastmalā 10, Rīgā  jau pirms projekta uzsākšanas uzstādītas divas sensoru bāzes stacijas un 141 sensors. Projekta ietvaros veikta jaunu bāzes staciju uzstādīšana un konfigurācija, esošo sensoru pārslēgšana un esošo bāzes staciju pārsaukšana, izvietojot divas jaunas Aranet PRO+ bāzes stacijas – vienu ēkas 1. stāva serveru telpā (telpa: D110) un vienu ēkas 6. stāva serveru telpā (D621). Esošie sensori, kas atrodas 1. un 6. stāvos ir pārslēgti uz jaunajām bāzes stacijām un dzēsti no esošajām bāzes stacijām. Veikta bāzes staciju instalācija un divas esošās bāzes stacijas konfigurētas ar jauniem nosaukumiem. Sešos stāvos mācību kabinetos, gaiteņos, lielās auditorijās, serveru telpās un 6.stāva tehniskajās telpās uzstādīti 103 sensori (CO2, T/RG un diferenciālā spiediena).

Veikta temperatūras sensora prototipa izstrāde. Izstrādāta ierīce ar četrām ligzdām, katrai no tām var pieslēgt patvaļīgas ģeometrijas un specifikācijas PT100 temperatūras zondi. Dati no visām četrām zondēm ir laikā savstarpēji sinhronizēti un tiek nosūtīti izmantojot bezvadu Aranet radio protokolu. Prototipa izstrāde ir pilnībā pabeigta.

Izstrādāti divi modeļi, izmantojot LSTM (no angļu val. Long Short Term Memory), kā arī tā atvasinājumus un papildinājumus - LSTM-GRU tipa modeli (no angļu val. Gated Recurrent Unit), kas ir uzskatāma par vienkāršotu LSTM tīkla versiju. LSTM ir dziļās mašīnmācīšanās mākslīgais neironu tīkls, kas izmanto atgriezenisko saiti. Izmantota Python pakotne PyTourch, kas ļauj ērti manipulēt ar dažādām tīkla struktūrām, kā arī abstrahēties no apmācības procesa realizācijas. LSTM tīklam ir iespējams izveidot dažādas modifikācijas, manipulējot ar tīkla slēptā slāņa (h) vektora izmēru vai to skaitu. Slēptajā slānī visi neironi ir savstarpēji cieši saistīti, kas ļauj modelēt pat ļoti sarežģītas un garas laikrindas.

Līdzīgi kā LSTM, GRU risina t.sk. izzūdošā gradienta problēmu (palielinoties apmācības iterāciju skaitam kļūdas gradients kļūst ārkārtīgi mazs, kas faktiski aptur apmācības procesu). Tomēr atšķirība no LSTM ir tāda, ka GRU izmanto mazāk vārtu un tiem nav atsevišķas iekšējās atmiņas, t.i., šūnas stāvokļa. Tādējādi GRU paļaujas tikai uz slēpto stāvokli kā atmiņu, kas noved pie vienkāršākas arhitektūras un ātrākas apmācības. LSTM modeļa komponentes vairāk koncentrējas uz ilgtermiņa īpašībām, bet GRU uz īstermiņa, neprasot tās balansēt viena modeļa ietvaros. Šāds kombinēts modelis var sniegt augstāku prognozes precizitāti salīdzinot ar vienkāršiem modeļiem.

Veikta visu projektā analizēto modeļu praktiska implementācija, izmantojot vienu un to pašu laikrindu, kā paraugu no viena konkrēta sensora. Programmatūra izstrādāta, izmantojot PyTorch pakotni, kas būtiski vienkāršo šādu modeļu īstenošanu. Atlasīti nejauši izvēlēta sensora dati par pēdējo mēnesi (apmēram 4000 ierakstu), kas sadalīti apmācības un testa datu kopās. Apzinoties, ka vienas dimensijas datu kopu ir salīdzinoši vienkārša minētajiem modeļiem, apmācībai izmantoti tikai 10% no visas datu kopas, bet testiem pārējie 90%.

Secināts, ka lielākajā daļā gadījumu GRU modelis uzrāda labākus rezultātus nekā LSTM vai kombinēts LSTM-GRU modelis. Lai arī kopumā GRU modelim ir priekšrocība skaitliski, tomēr novirzes visiem modeļiem ir salīdzinoši nebūtiskas. Tādejādi var apgalvot, ka visi projektā analizētie modeļi ir izmantojami tālākām izstrādnēm, kā precizitātes mērs, lai mērītu konkrētu sensoru izslēgšanas no sistēmas ietekmi uz prognozēšanas precizitāti.

Related news

View more news