
從人臉識(shí)別到水表識(shí)別

博士畢業(yè)后,我就留在中科院自動(dòng)化所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室,圍繞目標(biāo)識(shí)別和人臉識(shí)別,在圖像和視頻分析領(lǐng)域展開深入研究。
這些年,我所研發(fā)的核心技術(shù)在聯(lián)想、京東、華為等多家公司產(chǎn)品中,進(jìn)行了技術(shù)轉(zhuǎn)移和應(yīng)用。期間,我還攜自主研發(fā)的人工智能機(jī)器人“小加”上央視一套《加油向未來(lái)》節(jié)目為眾人展示人臉識(shí)別技術(shù)。
說(shuō)起來(lái),來(lái)臺(tái)州從事水表識(shí)別研究也算巧合。4年前,汕頭大學(xué)的一位教授介紹我們來(lái)到臺(tái)州,說(shuō)黃巖這邊有水表識(shí)別的需求。這家公司用的是人工抄表的方式,后來(lái)為了方便,就給每個(gè)抄表員發(fā)一個(gè)手機(jī),用手機(jī)錄入。但是這種情況下,存在大量的估抄、漏抄等現(xiàn)象,導(dǎo)致很多漏水現(xiàn)象沒有及時(shí)發(fā)現(xiàn),造成了大量水資源的浪費(fèi)。于是,他們就想到做水表的自動(dòng)拍照識(shí)別,找了好多人做水表識(shí)別,但都沒有成功。
我當(dāng)時(shí)分析了下他們失敗的原因:一是水表比較臟,而且拍照的角度是任意的;二是字符是嵌入凹槽里面的,給識(shí)別帶來(lái)了很大困難;三是最后一個(gè)數(shù)字是半個(gè)的,這也給識(shí)別帶來(lái)了非常大的挑戰(zhàn)。
我們當(dāng)時(shí)看了后,覺得很簡(jiǎn)單,再加上合作伙伴對(duì)水行業(yè)非常熟悉和了解,就答應(yīng)了下來(lái)。
耗時(shí)三年,換了幾十種方案

其實(shí),很多技術(shù)是相通的。識(shí)別水表的數(shù)字是經(jīng)典的字符識(shí)別問題,傳統(tǒng)最早的都是先檢測(cè)字符的位置,然后進(jìn)行字符的分割,對(duì)每個(gè)字進(jìn)行識(shí)別。這個(gè)過程跟人臉識(shí)別類似,但是他們的方法有很大不同。視覺抄表是把一串?dāng)?shù)字當(dāng)做一個(gè)整體來(lái)進(jìn)行識(shí)別,采用循環(huán)神經(jīng)網(wǎng)絡(luò)的方式。
本來(lái)想著,3個(gè)月就能完成,結(jié)果一做就是3年。做科研項(xiàng)目和做一個(gè)產(chǎn)品還是有很大差別,更別說(shuō)運(yùn)營(yíng)和推廣。
3年來(lái),我們換了幾十種的方法和方案。比如,開始用手機(jī)去現(xiàn)場(chǎng)拍水表,后來(lái)發(fā)現(xiàn)手會(huì)抖動(dòng),抖動(dòng)導(dǎo)致照片模糊影響識(shí)別效果,后來(lái)就加了防抖;另外就是為了拍照方便,我們?cè)O(shè)計(jì)了一個(gè)獨(dú)特的工具,用來(lái)方便抄表員打開水表蓋子,并支撐在水表表面進(jìn)行拍照,這樣既保障了拍照的質(zhì)量也固定了拍照的距離。
此外,為了記錄拍照的位置,我們保留了GPS位置信息,從而形成了一個(gè)抄表的路線軌跡,這樣即使抄表員換了,新的抄表員也可以順利地拍照。
這種改動(dòng),這幾年來(lái)我們做了太多太多的嘗試,才做到目前單個(gè)抄表員用我們的設(shè)備能一天拍800張左右的水表圖,而手工抄表的方式每天最多只能500張。
向全國(guó)推廣視覺抄表云

今年3月,我們才開始在臺(tái)州推廣。與其他公司不同,我們是在搭建好云服務(wù)和抄表系統(tǒng),并經(jīng)過反復(fù)測(cè)試穩(wěn)定之后,才將產(chǎn)品推向市場(chǎng)。
我們最先在黃巖試用,不過,抄表員一開始比較抵制,因?yàn)橐蟼鲌D片,對(duì)拍照也有要求,而且還有位置信息。為此,我們給抄表員進(jìn)行培訓(xùn),讓他們更方便地使用我們的抄表系統(tǒng)。
經(jīng)過幾個(gè)月的試用,抄表員的抄表效率大幅度地提升,而且所有數(shù)據(jù)都可以有效統(tǒng)一的回收,識(shí)別的精度也非常高。
因此,今年下半年,椒江、路橋等地的幾十家公司開始在使用視覺抄表云,在浙江以外也有多家開始在試用。
至于未來(lái),我們將繼續(xù)在全國(guó)推廣我們的視覺抄表云。同時(shí),針對(duì)北方水表在室內(nèi)的情況,我們將采用微信小程序的方式,讓用戶自助拍照和上傳,更方便地進(jìn)行收費(fèi)。
除此之外,我們會(huì)對(duì)城市的用水、供水、調(diào)度等做一個(gè)城市用水的大數(shù)據(jù)分析平臺(tái),建立一個(gè)城市用水大腦,方便對(duì)一個(gè)城市的水資源進(jìn)行全方面智慧化的管理。這對(duì)于水資源的管理和合理利用具有非常重要的意義,我們會(huì)一直做下去。
對(duì)話

記者:現(xiàn)在越來(lái)越多專家將科研轉(zhuǎn)化成商業(yè)效益,你覺得這是大趨勢(shì)嗎,轉(zhuǎn)化中最困難的是什么?
我:科研不能一直都停留在實(shí)驗(yàn)室,最終還是要轉(zhuǎn)化為生產(chǎn)力,可以說(shuō)原來(lái)轉(zhuǎn)化的力度不大。隨著互聯(lián)網(wǎng)和人工智能技術(shù)的發(fā)展,再加上國(guó)家政策的支持,加速了科研產(chǎn)業(yè)化的進(jìn)程,這也是我們科技發(fā)展的一個(gè)重要的趨勢(shì)。
在科技轉(zhuǎn)化中最難的就是技術(shù)到產(chǎn)品再到市場(chǎng),科學(xué)家只是擅長(zhǎng)做科研,對(duì)產(chǎn)品和市場(chǎng)缺乏認(rèn)識(shí),這種脫節(jié)是科技轉(zhuǎn)化的一個(gè)難點(diǎn),因此如何找到與科學(xué)家互補(bǔ)的產(chǎn)品團(tuán)隊(duì)和市場(chǎng)團(tuán)隊(duì),充分達(dá)成一致的合作協(xié)議,并能達(dá)到共同一致的目標(biāo),這是最關(guān)鍵的部分。
記者:你是如何理解創(chuàng)業(yè)的?
我:創(chuàng)業(yè)是非常辛苦和艱難的,不僅需要對(duì)行業(yè)痛點(diǎn)的敏銳洞察和科技方向的把控能力,更要能夠發(fā)現(xiàn)商業(yè)機(jī)會(huì)并快速占領(lǐng)市場(chǎng)??茖W(xué)家創(chuàng)業(yè)其實(shí)主要是更想看到自己的技術(shù)能夠給人們的生活帶來(lái)便利和改善,對(duì)我們而言,能夠?qū)崿F(xiàn)水資源的閉環(huán)管控,這是非常有價(jià)值的事情。盡管非常辛苦和艱難,但這個(gè)愿景給我們帶來(lái)了很多激情和動(dòng)力,也是我們一直能堅(jiān)持到現(xiàn)在的根本原因。
我
王金橋,1978年出生于河北衡水,2001年,本科畢業(yè)于河北工業(yè)大學(xué)機(jī)械學(xué)院。2004年,研究生畢業(yè)于天津大學(xué)機(jī)械學(xué)院機(jī)械電子工程系。2008年,博士畢業(yè)于中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室。2008年后,留所工作,目前任中科院自動(dòng)化研究所研究員,智能媒體聯(lián)合實(shí)驗(yàn)室主任、視頻云識(shí)別聯(lián)合實(shí)驗(yàn)室主任,研究領(lǐng)域視頻大數(shù)據(jù)分析與識(shí)別,發(fā)表論文SCI/EI論文220篇,主持多個(gè)國(guó)家重大項(xiàng)目,有專利16項(xiàng),國(guó)家標(biāo)準(zhǔn)3項(xiàng)。2014年,創(chuàng)辦臺(tái)州視讀信息技術(shù)有限公司,任首席科學(xué)家。