大數(shù)據(jù)時(shí)代,讓行業(yè)分析的精度達(dá)到了一個(gè)新的高度,也為行業(yè)的精細(xì)化管理提供了前所未有的便利條件。供水行業(yè)在大數(shù)據(jù)的應(yīng)用方面似乎滯后于一些行業(yè),但并不阻礙供水行業(yè)對大數(shù)據(jù)的開發(fā)和向往。
《凈水技術(shù)》小編了解到,作為智慧城市的先行者之一,上海近年來在大數(shù)據(jù)的分析方面開展了一些工作,并采用多種模型工具進(jìn)行探索和應(yīng)用。運(yùn)用大數(shù)據(jù)工具,目前上海城投水務(wù)集團(tuán)一方面能夠每天能夠?yàn)橄螺牭?1個(gè)供水所提供未來3天的供水量預(yù)測日報(bào);另一方面也能用長期水量預(yù)測模型做年度的月水量計(jì)劃。
本文為概述,上海城投水務(wù)集團(tuán)在供水水量大數(shù)據(jù)分析的具體工作成果請持續(xù)關(guān)注《凈水技術(shù)》本年度發(fā)表的相關(guān)原創(chuàng)論文。
隨著通信技術(shù)的不斷進(jìn)步,以及業(yè)務(wù)系統(tǒng)的建設(shè)升級,國內(nèi)各大水司的信息化水平不斷提高,累計(jì)的各類業(yè)務(wù)數(shù)據(jù)越來越多,數(shù)據(jù)規(guī)模及質(zhì)量不斷提高,數(shù)據(jù)統(tǒng)計(jì)分析能力進(jìn)一步提升,數(shù)據(jù)對業(yè)務(wù)的支撐作用也越來越強(qiáng)。但是隨著水司對數(shù)據(jù)分析要求的不斷增強(qiáng),以及現(xiàn)階段水司內(nèi)部單一的業(yè)務(wù)數(shù)據(jù)及基礎(chǔ)的分析工具,對于將來實(shí)現(xiàn)智慧供水的目標(biāo)還存在距離,所以我們開始重新思考如何豐富數(shù)據(jù)類型和如何利用新工具實(shí)現(xiàn)目標(biāo)。
智慧供水的目的是希望決策能像人腦一樣,而我們知道人腦在決策之前首先要同時(shí)感知身體內(nèi)部和外界環(huán)境的信息,然后經(jīng)過人腦內(nèi)部上億個(gè)神經(jīng)元的計(jì)算分析后得出結(jié)果,同樣如果未來要實(shí)現(xiàn)智慧供水,利用外部數(shù)據(jù)和先進(jìn)的分析工具必不可少。
上海作為國內(nèi)智慧城市建設(shè)先試先行的城市,現(xiàn)今已經(jīng)取得了一定的成果,其中城市公共數(shù)據(jù)免費(fèi)開放的力度不斷加大,供水作為城市服務(wù)的關(guān)鍵一環(huán),與電力、交通和旅游等其他社會服務(wù)息息相關(guān),相互之間有很強(qiáng)的關(guān)聯(lián)性,而這些行業(yè)數(shù)據(jù)可以為水司服務(wù),豐富數(shù)據(jù)維度,增強(qiáng)內(nèi)外部聯(lián)系,加深水司對用戶行為理解。
一
大數(shù)據(jù)下的供水量影響因素
以供水量的預(yù)測為例,首先市場上產(chǎn)品和服務(wù)的價(jià)格一定會對用戶用量產(chǎn)生直接的影響,例如對于家庭每天都會用水清洗蔬菜水果等食品,而這些食品的價(jià)格的波動(dòng)會決定居民采購數(shù)量的波動(dòng),進(jìn)而影響供水量的波動(dòng),下面是消費(fèi)者價(jià)格指數(shù)和居民供水量的曲線圖,我們發(fā)現(xiàn)消費(fèi)者價(jià)格的變動(dòng)與居民供水量的變動(dòng)呈現(xiàn)相反的趨勢。
(藍(lán)線為居民供水量曲線,橙線為消費(fèi)者價(jià)格指數(shù))
進(jìn)一步比較水產(chǎn)品價(jià)格和居民供水量發(fā)現(xiàn),二者的相反趨勢更加明顯。
(綠線為水產(chǎn)品價(jià)格,藍(lán)線為居民供水量)
季節(jié)、氣溫和節(jié)假日的變化也會對供水量的變化產(chǎn)生深刻的影響,下面這張曲線圖清楚的描繪了這些變化,夏季是用水高峰期,國慶和春節(jié)小長假由于人口凈流出較多出現(xiàn)短期的用水低谷。
用戶用水一般會伴隨著用電,比如居民做飯洗澡,加工制造企業(yè)產(chǎn)品生產(chǎn)等,總用電量、第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)和城鄉(xiāng)居民的用電趨勢與用水趨勢基本一致。
上海作為國際化大都市每年都會吸引全球各地的游客前來旅游,這部分游客也會對供水量產(chǎn)生影響。
除了上述舉例,對居民用水量產(chǎn)生影響的因素還有很多,從時(shí)間的角度看,CPI指數(shù)、PPI指數(shù)、氣溫、溫差、空氣質(zhì)量指數(shù)、節(jié)假日等因素影響較大,我們還發(fā)現(xiàn)每個(gè)月開什么花也和供水量有一定的相關(guān)性,比如上海3月份櫻花盛開,居民會外出賞花,這些活動(dòng)會造成餐館人數(shù)的增加,從而影響了供水;從空間的角度看,工廠、餐館、商場、景區(qū)等場所的位置分布也會影響供水量。
二
大數(shù)據(jù)下的水量預(yù)測模型工具探索
隨著外部數(shù)據(jù)量的增加以及計(jì)算難度的提高,傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)工具(例如excel)可能無法實(shí)現(xiàn)要求。近幾年,隨著python編程語言的崛起及算法模型的發(fā)展,數(shù)據(jù)分析的門檻不斷降低,普通人也能通過一段時(shí)間的學(xué)習(xí),很快實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)分析運(yùn)算,例如多維度數(shù)據(jù)間的相關(guān)性分析,非線性回歸分析等。
Python編程語言作為一種面向?qū)ο蟮慕忉屝跃幊陶Z言,具有簡單、易學(xué)、速度快、可移植性高和具有豐富的庫等特點(diǎn),越來越受到人們的重視和使用;機(jī)器學(xué)習(xí)模型是一種高效的數(shù)據(jù)分析算法,可以通過Python語言一步導(dǎo)入進(jìn)行數(shù)據(jù)計(jì)算,免去了復(fù)雜的編程過程,對于沒有計(jì)算機(jī)編程基礎(chǔ)的人員有很好的適用性。
利用上海市公共數(shù)據(jù),通過Python語言進(jìn)行編程建模取得的水量預(yù)測模型已經(jīng)在日常工作中得到了初步使用,可以實(shí)現(xiàn)短期、長期的水量預(yù)測,也可以根據(jù)業(yè)務(wù)要求實(shí)現(xiàn)特定類型的水量預(yù)測,具體應(yīng)用情況如下:
1、未來每天和每小時(shí)短期供水量模型,相對平均誤差分別為1.5%和1.9%,主要用于根據(jù)未來短期內(nèi)水量變化情況,為供水調(diào)度提供數(shù)據(jù)支撐。
2、未來每月長期水量預(yù)測模型,相對平均誤差為2.4%和2.5%,主要用于未來長期用水量計(jì)劃制定。
3、邊界流量儀水量預(yù)測模型,相對平均誤差為3.0%,主要用于修正流量儀非正常工作狀態(tài)下計(jì)量的水量。
今后隨著技術(shù)的不斷成熟,我們可以縮小供水范圍,例如利用預(yù)測結(jié)果控制小區(qū)的供水量,實(shí)現(xiàn)供水的精細(xì)化調(diào)度;還可以將這種方式應(yīng)用于水質(zhì)、水壓等數(shù)據(jù)分析中,發(fā)現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián)程度,從而逐步打通數(shù)據(jù)孤島,實(shí)現(xiàn)智慧供水。
本文 作者:高赫余 王圣 吳瀟勇
本文 采編:《凈水技術(shù)》雜志社 阮辰旼
排版:張蕾
校對:黎翔