“拉薩發(fā)現(xiàn)首例新冠肺炎確診病例,急尋從武漢武昌到西寧,從西寧到拉薩的Z264次、Z265次同車廂旅客。”
“4個(gè)航班發(fā)現(xiàn)確診患者,急尋同行旅客”
“緊急擴(kuò)散!廣元急尋以下車次乘客”
……
打開搜索引擎輸入“急尋”,可以看到下拉聯(lián)想詞基本都是和尋找患者同行人相關(guān)內(nèi)容??梢?,防控疫情的戰(zhàn)場,不僅僅在于醫(yī)療一線的救死扶傷,更需要做好人群流動(dòng)信息,洞察疫情擴(kuò)散情況,控制好傳播途徑,進(jìn)而抑制疫情的過快擴(kuò)散,保護(hù)更多人的健康和生命安全。
這一切,離不開強(qiáng)大的大數(shù)據(jù)分析技術(shù)。
疫情就是命令 大年三十成立項(xiàng)目組 馳援某政府客戶
“我們這里有大量的疫情相關(guān)數(shù)據(jù),但是卻摸不清頭緒,無從下手,急需要模分析模型。”
春節(jié)期間,奇安信大數(shù)據(jù)與態(tài)勢感知公司陸續(xù)收到了某部委及全國多個(gè)省市的下屬機(jī)關(guān)的緊急需求。該部委作為此次疫情防控的重要支撐單位,為了更高效推進(jìn)工作,第一時(shí)間向奇安信集團(tuán)發(fā)出數(shù)據(jù)分析技術(shù)的請求,希望利用大數(shù)據(jù)技術(shù)分析轄區(qū)內(nèi)的疫情擴(kuò)散情況,為精準(zhǔn)防控提供數(shù)據(jù)支撐。
疫情就是命令!奇安信連夜成立態(tài)勢感知應(yīng)急項(xiàng)目組,陸續(xù)召集了22人擅長大數(shù)據(jù)分析的精兵強(qiáng)將,按照就近原則,連夜奔赴前線,給客戶提供駐場貼身服務(wù)。
“因?yàn)檫^年車很難打,加上很多地方開始交通管制,到客戶現(xiàn)場也很不容易,甚至有位同事在下雪天徒步走了2個(gè)多小時(shí)。”項(xiàng)目負(fù)責(zé)人李虎回顧道,“比交通問題更大的困難,這次客戶提出的需求是全新的,需要高度定制化的開發(fā)和服務(wù),而且復(fù)雜度遠(yuǎn)遠(yuǎn)超出想象。”
大家都知道,奇安信本身是一家安全公司,在感知網(wǎng)絡(luò)安全態(tài)勢方面無出其右,可這次感知疫情態(tài)勢,盡管二者之間有相通的地方,卻也是大姑娘上花轎——頭一遭。
面對全新的需求,時(shí)間緊且任務(wù)重。在首批項(xiàng)目組到達(dá)一線的第二天,李虎果斷決定又專門成立了40多人二線團(tuán)隊(duì),涵蓋產(chǎn)品、售前、研發(fā)、數(shù)據(jù)、測試等多條業(yè)務(wù)線,全力保障前線同事們的后勤。
數(shù)據(jù)一條條看,模型一個(gè)個(gè)建,bug一個(gè)個(gè)改
果不其然,項(xiàng)目初期并非一帆風(fēng)順。試想,疫情發(fā)生以后有幾百萬人從武漢流向全國各地,有坐火車的、有坐飛機(jī)的還有自駕的,這些都有可能是潛在的傳染源。他們什么時(shí)間到過哪些地方、接觸過那些人,面對如此龐雜、海量的數(shù)據(jù),一線的分析師需要從中抽絲剝繭,并且放到系統(tǒng)里面進(jìn)行建模分析,這個(gè)難度是可想而知的。
李虎回憶,一線同事初到現(xiàn)場之時(shí),由于數(shù)據(jù)比較少,質(zhì)量也很一般,很難直接開戰(zhàn)模型訓(xùn)練和結(jié)果驗(yàn)證工作。為了解決這些難題,一線同事不厭其煩,反復(fù)研究了疫情數(shù)據(jù)的特點(diǎn),人工一條條的進(jìn)行數(shù)據(jù)篩選和補(bǔ)全,工作量巨大,每天都是半夜12點(diǎn)后才離開客戶現(xiàn)場;在建模過程中,與用戶保持密切溝通,確定每個(gè)模型所需的數(shù)據(jù)資源、關(guān)鍵特征、衡量標(biāo)準(zhǔn)等,并基于這些數(shù)據(jù)展開模型訓(xùn)練和分析工作,確保模型能夠迅速投入實(shí)戰(zhàn)。
隨著數(shù)據(jù)量的劇增,數(shù)據(jù)的各字段信息也相對完整,數(shù)據(jù)本身的問題基本得以解決,但數(shù)據(jù)分析的難度陡然上升。況且疫情發(fā)展到這樣一個(gè)地步,已經(jīng)出現(xiàn)了二代甚至三代傳播,數(shù)據(jù)分析的難度就更大了。為確保模型輸出的數(shù)據(jù)結(jié)果快速而又準(zhǔn)確,研發(fā)同事連夜設(shè)計(jì)出了能夠自動(dòng)化數(shù)據(jù)處理的腳本文件,大大提高了現(xiàn)場大規(guī)模數(shù)據(jù)的處理和分析效率。
后臺的工作一樣辛苦。同事們的電話聲徹夜不休,用來聊天打字的手都已經(jīng)僵住了,為的就是準(zhǔn)確、快速響應(yīng)一線需求。研發(fā)同事們的鍵盤敲擊聲鏗鏘有力,為此他們還要時(shí)不時(shí)回過頭,生怕吵醒身后熟睡的孩子,偶爾捋捋僅剩的一小撮頭發(fā)。就這樣,一行行代碼在電腦屏幕上滾動(dòng)著。
為了避免忙中出錯(cuò),研發(fā)組毫不敢放松,一邊開發(fā),一邊加大了對bug的檢測力度。果然,從中揪出了20多個(gè)bug。為了盡快解決bug,按時(shí)交付系統(tǒng)并上線運(yùn)行,老馬拎起一大袋子方便面就坐在了電腦前,結(jié)果是bug解決了,系統(tǒng)按時(shí)交付上線了,自己也因泡面吃得太多上火了。
20個(gè)模型、超1000萬條數(shù)據(jù) “疫情態(tài)勢圖”助力精準(zhǔn)決策
據(jù)不完全統(tǒng)計(jì),在前線、后方兩線同事的緊密配合下,依托奇安信大數(shù)據(jù)智能建模平臺,項(xiàng)目組共搭建了近20個(gè)數(shù)據(jù)分析模型,處理了超過1000萬條數(shù)據(jù),并且通過可視化大屏,繪制出了一張精準(zhǔn)的“疫情態(tài)勢圖”,為當(dāng)?shù)毓矙C(jī)關(guān)研判疫情態(tài)勢、排查密切接觸人員、控制傳播途徑,提供了精準(zhǔn)的決策支撐。
“如果這些定制化需求擱在平時(shí),且要在短時(shí)間完成巨大工作量,以及如此復(fù)雜的數(shù)據(jù)分析和模型開發(fā),簡直就是天方夜譚。”李虎感慨到。
此時(shí)此刻,抗擊疫情的大數(shù)據(jù)分析及態(tài)勢感知會戰(zhàn)還在緊張的進(jìn)行,每一位參與其中的同事都在竭盡全力。如果說在傳統(tǒng)戰(zhàn)爭中,情報(bào)是決定勝負(fù)的要素的話,那么在這場信息化為特征的全民戰(zhàn)“疫”中,數(shù)據(jù)就是情報(bào),就是指揮決策的依據(jù),是打贏這場阻擊戰(zhàn)的重中之重。而作為網(wǎng)絡(luò)安全國家隊(duì),奇安信旗下態(tài)勢感知團(tuán)隊(duì)依托自身強(qiáng)大的大數(shù)據(jù)分析和智能建模能力,全力為國家相關(guān)部門提供技術(shù)保障,盡早贏下這場“戰(zhàn)疫”!
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。