作者:馬微冰,來源:Tech星球
原標題:逆行成都的「數(shù)據(jù)俠」
大數(shù)據(jù)抗疫進行時。
一場突如其來的疫情令人始料未及,每天跌宕變化的疫情數(shù)據(jù),牽動所有人的心。
感染者、密切接觸者數(shù)量、活動軌跡、時間節(jié)點等大數(shù)據(jù),成為疫情防控的關鍵信息。而在備受矚目的數(shù)據(jù)背后,有這樣一群人,他們雖然不是醫(yī)生護士等一線抗疫人員,卻在疫情爆發(fā)后,逆行奔向疫情最嚴重的區(qū)域。
“真沒想到,我回到成都,就再也沒離開過,而且一工作就是 40 多天?!闭f這句話的海致科技數(shù)據(jù)工程師許珂,就是許多逆行奔赴疫區(qū)的數(shù)據(jù)技術人員之一。
1 月 20 日晚上 8 點,剛放年假的許珂抵達湖北鄂州的家中,正吃著晚飯時接到了公司的通知。
“成都這邊疫情爆發(fā),需要做一些疫情分析支撐工作,我們成都這邊人手有限,需要 8 小時內(nèi)到崗,你有沒有問題?”放下手機后,許珂告訴家人,接到緊急任務第二天要返回成都。
翌日一早,許珂簡單收拾衣物,開車回成都緊急待命。
彼時,各個城市還沒有拉響警報,甚至成都街頭,戴口罩的人也不是很多,多數(shù)人和許珂一樣還不能意識到后來發(fā)生的一切。
緊接著,成都封城,全國各地防疫管控,以數(shù)字為標準展開篩查隔離。在疫情籠罩的 3 個月里,每一組數(shù)據(jù)、每一串代碼都發(fā)揮了重要的價值。
一場大數(shù)據(jù)抗疫戰(zhàn),拉開了大幕,這是對大數(shù)據(jù)價值和“數(shù)據(jù)俠”成色的一次實戰(zhàn)檢閱。
“前所未有”,當提到這次疫情的感受時,這是許珂用到的詞語。
“戰(zhàn)疫”打響后,阿里、騰訊、百度等很多互聯(lián)網(wǎng)公司開始向成都,緊急運送支援物資。接到緊急召回的電話時,許珂并沒有想太多,以為和平時加班趕項目一樣,去幾天就回來。但沒想到,一直奮戰(zhàn)至今。
1 月 20 日,海致湖北負責人高勇波接到需求,需要緊急抽派人手組建一支技術團隊參加成都防疫指揮部的數(shù)據(jù)分析工作。
疫情中成立的防疫指揮部,是由政府部門、醫(yī)院、衛(wèi)生防疫機構(gòu)、衛(wèi)健委等聯(lián)合組成的。防疫指揮部會下發(fā)一些數(shù)據(jù)核查、數(shù)據(jù)分析的需求,數(shù)據(jù)工程師們配合相關部門完成后,再把分析結(jié)果提供給指揮部,以供決策。
“因為年前也比較忙,最開始的時候我們今年準備提前放假,讓大家去休息一下的,沒想到遇上突發(fā)的疫情?!焙V驴偛脳罹陮ech星球說,“陸續(xù)接到來自于各地這樣的電話后,我們立刻開始內(nèi)部討論。我們也很糾結(jié),畢竟還是有風險,也很擔心員工會有情緒,但大家基本上沒有二話?!?/p>
接到緊急任務的高勇波,便在工作群里問大家,誰能夠盡快來成都,“有的是已經(jīng)到家里返回的,有的是在半路掉頭回來的,還有成都當?shù)夭淮蛩慊丶业?,”沒過多久,就有 6 名同事表示,可以第一時間返回,許珂是他通知的第二個人。
“接到通知后,我們 6 個人在 1 天之內(nèi)全部到崗”,高勇波對 Tech 星球說道。
1 月 21 日上午 11 點,許珂與 6 名同事到成都集結(jié)待命。“我不知道這次具體是要做什么,只知道是疫情相關的事情?!眲偟匠啥嫉脑S珂,午飯還沒來得及吃,便立刻參加工作會。
僅僅一個小時的工作對接,讓擅長數(shù)據(jù)分析的許珂一下就意識到疫情的嚴重性,他知道即將開始的工作將會是前所未有的挑戰(zhàn)。。
各級政府部門有上百種數(shù)據(jù),存儲總量極為龐大,分散在不同部門,同時各級醫(yī)療防疫機構(gòu),還擁有大量一手疫情數(shù)據(jù)的手工表格。這些冗雜紛繁的數(shù)據(jù),要迅速的形成一套高效的數(shù)據(jù)接入、清洗、處理的機制,轉(zhuǎn)化為精準的防疫信息,傳遞到防疫指揮部,對于高勇波來說,最大壓力就是時間和每一條數(shù)據(jù)后面所代表的生命。后來有人問起高勇波當時的感受,“我從來沒有過這樣的體驗,腦子里每一分鐘都是人命關天四個字。”高勇波說到。
海致網(wǎng)聚實施總監(jiān)鄧華亮認為:前期工作是最難,也是最緊張的,“第一次會相對復雜一些,等我們把這些數(shù)據(jù)接入,以及處理的規(guī)則都建立好了之后,后續(xù)再進來新的數(shù)據(jù)隨時更新,這個過程就是自動的?!?/p>
“短時間內(nèi),我們要接入各個部門的數(shù)據(jù),做數(shù)據(jù)處理、清洗、關聯(lián),形成數(shù)據(jù)模型。數(shù)據(jù)流轉(zhuǎn)機制剛剛建立,模型也都是摸索著做,改動很頻繁,要的也很急。那是疫情爆發(fā)的第一階段,需要做很多東西去摸索?!痹S珂說道。
許珂與同事們沒日沒夜的工作,從 1 月 21 日開展第一次密接人員信息發(fā)布開始,基本上每天都是凌晨三四點,甚至四五點才休息,早上八九點鐘又要開始工作。一線“戰(zhàn)疫”刻不容緩,許珂與同事們每天想著如何壓縮時間,更快的形成數(shù)據(jù)模型應用。
確診病例、疑似病例、發(fā)熱門診,這一些患者數(shù)據(jù),如果能第一時間獲取,用于后續(xù)研判分析,比如去發(fā)現(xiàn)這些密切接觸者,及時通知他們,使數(shù)據(jù)及時下發(fā)到一線社區(qū)工作人員手中,都至關重要。
從 1 月 21 日開始,海致協(xié)助各地相關部門,通過海致的大數(shù)據(jù)挖掘系統(tǒng),每天處理數(shù)據(jù)幾十億條,發(fā)出幾萬條關于“ B 類人群”(密切接觸者)的信息,為社區(qū)工作人員的精準排查提供支撐,當時基本上是半個小時就要更新一次。
疫情防控的數(shù)據(jù)模型非常重要,前線的同事們也感受到前所未有的壓力。高勇波說,“平常的工作會給一個時間,比如說一天或者兩天。可現(xiàn)在同等量的工作,會壓縮在一個小時之內(nèi)就得完成?!?/strong>
剛開始,他們下班后被安排在附近酒店休息,但隨著疫情爆發(fā)城市管制,外地人不允許住酒店,所有酒店都被騰出給援助的醫(yī)療隊。許珂與同事們直接在辦公室旁邊搭一張行軍床,累了直接休息。
數(shù)據(jù)工程師在辦公桌旁搭的行軍床
“我們只能分清白天黑夜,沒有其他的?!备哂虏ㄕf。
防疫指揮部的第一步工作是要快速地把這些數(shù)據(jù)匯聚起來。鄧華亮向 Tech 星球說道:“匯聚起來以后,發(fā)現(xiàn)數(shù)據(jù)標準不統(tǒng)一,數(shù)據(jù)質(zhì)量也參差不齊。然后接下來的工作就是,抓緊把這些數(shù)據(jù)都整理好、清洗好”,這無疑是一個工作量巨大且高強度的事情。
隨著確診人數(shù)不斷激增,23 日上午十點鐘成都封城。全國最關心問題是,成都到底外流出去多少人?去了哪,乘坐什么交通工具?每日的數(shù)據(jù)每日結(jié)清,每日的數(shù)據(jù)中各類關注對象信息都要當日上報。這些原始的一手資料,只能由成都團隊第一時間進行歸納,相比較其他城市的防疫,成都的工作量都是乘以百計、千計、甚至萬計。
鄧華亮說,“掌握了外流人員信息后,我們利用大數(shù)據(jù)建模手段,構(gòu)建了上百個分析模型,有數(shù)據(jù)真實性的交叉驗證模型,有落地確診病例模型,有外流人員去向查找模型,有密切接觸人員身份落地模型等等。然后把這些模型的分析數(shù)據(jù)推送給一線防疫人員,抓緊去落地核查。可以說一個模型就是一個戰(zhàn)場,每個戰(zhàn)場都關乎生死。”
臨時團隊人員少,在巨量的數(shù)據(jù)處理信息面前,難免會出現(xiàn)各式各樣的問題?!耙驗槭嵌嗖块T、多系統(tǒng)向一個地方匯集,又從一個地方向外發(fā)送,相較于技術支撐的難度,在整個分析運行的協(xié)同機制上可能會存在更多的問題,每天除了解決技術問題,更多的時候我們還要跟不同的部門進行溝通,提醒數(shù)據(jù)上報,詢問接受反饋,確保工作順暢進行。機制運行之外,就是不斷地完善算法和功能,盡可能的壓縮技術處理的時間,每壓縮一點,就有更多的時間去處理更多的問題?!痹S珂向 Tech 星球解釋。
由于成都交通管制,海致成都總部的技術人員無法到達成都現(xiàn)場,但為了能夠保證及時協(xié)助成都的團隊,技術同事們 24 小時在線,遠程幫忙排查解決問題。
1 月 30 日,公司緊緊協(xié)調(diào)增援3名技術骨干進駐成都,進行輪崗。同日,海致為全國 2.2 萬名一線疫情防控人員,緊急開通了內(nèi)網(wǎng)大數(shù)據(jù)分析平臺賬號,免費支持服務一線疫情防控數(shù)據(jù)分析。隨后,從南昌、南京以及湖北很多正在被封閉的村鎮(zhèn),十幾位海致工程師在短短幾天內(nèi)向成都、孝感、黃岡、鄂州等疫情前線集中。
一道大數(shù)據(jù)防疫城墻建立起來。
大約一個月的時間,9 位工程師連軸轉(zhuǎn),最終成都的疫情防控數(shù)據(jù)模型逐漸穩(wěn)定,“接下來要支撐湖北其他的地市,本地工程師人手已經(jīng)不夠,只能從總部抽調(diào)人過來?!备哂虏ㄏ?Tech 星球說道。
研發(fā)總監(jiān)翟士丹介紹,“我天天都在和勇波電話,既害怕又期待,害怕的是系統(tǒng)臨時出現(xiàn)了什么問題,耽誤了分析,期待的是按照前方要求新上線的功能,能帶來救人的好消息。就這樣,有時一晚上都睡不好,就想著能從哪兒下手,做的更好一點?!?nbsp;
2 月 19 日,成都全面啟用 12 家方艙醫(yī)院,醫(yī)療資源得到緩解后,成都疫情防控戰(zhàn)役發(fā)起總攻,數(shù)據(jù)量倍增。應成都疫情防控總指揮部要求,再次緊急增派數(shù)據(jù)分析師,火線支援。連明、張順民宋彥朝三位“數(shù)據(jù)俠”主動請纓。
連明是北方區(qū)負責人,常年在成都辦公。2 月 18 日晚上 8 點,下班后的連明接到公司副總裁的電話。“成都這邊的兄弟已經(jīng)連續(xù)作戰(zhàn) 30 天了,為了保證大家的身體健康,我們得向醫(yī)護人員一樣強制替換,需要你現(xiàn)在支持成都的疫情防控工作,明天清晨出發(fā),OK 么?”突然接到通知的連明,直接回復“沒問題,馬上清行李?!?/p>
隨后,連明立即通知部門同事,“緊急去成都支援,有沒有問題?明早出發(fā)。”大家都沒有任何遲疑。2 月 19 日早上 7 點左右,連明與同事相約來到成都西站,往日人頭攢動的西站只有零星的乘客,各自相隔很遠。
7 點 26 分,三人坐上了由成都開往成都的 G71 高鐵。成都封城后,G71 便不在成都經(jīng)停,但當聽聞是派往成都的支援人員時,成都有關部門提前溝通,協(xié)調(diào)成都站特批 G71 可以臨停成都。
連明與同事在高鐵站
連明與同事們在同一截車廂,車廂內(nèi)有七成的乘客。2 月 19 日湖北以外的地區(qū),疫情防控已經(jīng)進入到中后階段,成都有些公司已經(jīng)復工,但成都仍在嚴密防控中。下午13點,高鐵抵達成都,連明與同事拿著蓋滿印章的通行證,在成都站下車,發(fā)現(xiàn)整個高鐵站都空空蕩蕩。
連明說,“原以為當時成都疫情也會好轉(zhuǎn)些,但和想象中不一樣,差別太大了?!弊谲嚿系倪B明看到此時的成都很是震撼,“從人流和車流這兩個角度,跟平時真的是天壤之別。”
在當?shù)厝藛T接應下,連明與同事直接到達防疫指揮部辦公室??吹揭褗^戰(zhàn)一個月的同事,并沒有明顯的疲態(tài)。“大家都在想把這個事做得更好,做得更精確、更精準一點,讓疫情早日結(jié)束?!?/p>
五天以后,海致 CEO 楊再飛帶著一批口罩、藥品和食品,乘坐與連明同一趟高鐵、也趕到了成都。
高勇波說,“省市兩級的最高領導,這幾十天內(nèi)都多次過來督戰(zhàn)疫情防控,察看工作進程,審閱數(shù)據(jù)?!?/p>
“這是一場持久戰(zhàn)”,在連明看來。
隨著疫情發(fā)展趨勢的變化,不同階段關注點是不一樣的,分析的側(cè)重點同樣也會產(chǎn)生變化。
鄧華亮說,“初步控制階段,沒有再集中爆發(fā)的情況下,我們會做一些基于流行病學的分析和研判,將以前全覆蓋的防控,變成分級分區(qū)域的一些精準防控,提供一些分析模型的支撐??梢耘卸?,同一個地市不同的曲線,不同的社區(qū)、小區(qū)哪些是高風險,哪些是低風險,作為精準防控的決策依據(jù)。”
無論何時,這些逆行的數(shù)據(jù)俠們也絕不是孤軍奮戰(zhàn)。“看到同事在前方奮戰(zhàn),開始自己沒辦法出力,心里還是比較難受的”,徐培對 Tech星球講道。
身為成都團隊的一份子,徐培由于身體原因在家休養(yǎng)。1 月 21 日,高勇波詢問是否有人能到達成都時,徐培也積極響應,但年前剛做完心臟瓣膜手術,領導建議徐培暫時先不參與“前線”工作。
但隨著成都的疫情每況愈下,徐培說,“既然不能在一線,我就做后勤保障工作,為大家改善一下伙食或者是營養(yǎng),換一種方式并肩作戰(zhàn)?!?/p>
沒有家人陪伴、沒有年夜飯,一線的工程師們開足馬力工作,除夕、春節(jié)、元宵節(jié)等等,對于大家而言都沒有概念。“年夜飯就是在現(xiàn)場,坐在一起,每人一個自嗨鍋,當時覺得已經(jīng)十分幸福了”,高勇波說道。
2 月份,成都甚至整個湖北的物資都比較匱乏,了解到前線同事們經(jīng)常在吃泡面,徐培和家人們發(fā)動所有的力量,每天通過各種渠道購買食材。
因為徐培在家靜養(yǎng),采購和送東西的事情都是由妻子代勞,有些需要加工的,母親會一起幫忙。從 2 月初開始,徐培每隔一兩天就會到指揮部運送物資。一般早上出門,趕在同事吃中午飯時送到,這樣能吃到比較新鮮的食物。
“有一次,同事們說想喝可樂,后來我在一個店里看到,把他們一整個柜臺 20 多瓶可樂全買走了,第二天送去,他們見到可樂時特別開心?!?/p>
隨著物資逐漸豐富,疫情趨于平緩。各地都在有序復工復產(chǎn),數(shù)據(jù)模型搭建的重心也在改變。
2 月 22 日,許珂與同行的兩位同事,被安排去構(gòu)建湖北全省的防疫大數(shù)據(jù)平臺?!拔覀儠鲆恍╋L險預警的模型,及時發(fā)現(xiàn)一些可能的發(fā)熱患者,或者疑似病例,防止再次擴散?!编嚾A亮對 Tech 星球說。
“大數(shù)據(jù)這張看不見的抗疫網(wǎng),可以說是決定生死,至關重要”,2 月 24 日,海致網(wǎng)聚 CEO 楊再飛在朋友圈寫道。
一線工程師許珂家里有兩位同樣在一線堅守的親屬,父親與大伯都是醫(yī)生。“從疫情開始,大伯就在鄂州一線救援。但 1 月 26 日開始發(fā)熱,確診感染,2 月13 日很不幸沒能挺過去,離開了我們,同樣被感染的大伯母還在隔離治療中?!?/p>
許珂說,“經(jīng)歷過這個事之后,才真正的覺得我們每天看到的,手里頭的那些數(shù)據(jù),真的就是一個個活生生的生命。很多時候看到一個生命,從最初的密接人員數(shù)據(jù)表格一步一步挪到病亡人員表格,那種感覺是難以忍受的。我們從來沒有做過這樣的數(shù)據(jù)分析,這也是我們能超出個人極限,咬牙堅持下來的最終原因。如果說,有一點數(shù)據(jù)沒弄好或者弄錯了話,會導致非常嚴重的后果,就是一個生命沒辦法得到及時的救助。”
疫情是災難,同樣也是一種警醒。作為“抗疫”背后無形的手,大數(shù)據(jù)的重要作用,在這次疫情防控中愈發(fā)凸顯。之前,政府和企業(yè)往往覺得數(shù)據(jù)是一個輔助性的工具,僅僅是一個參考,但在這場“戰(zhàn)疫”中,許多人開始真正意識到大數(shù)據(jù)的重要性。
海致公司制作的智慧大屏效果圖
正如謝爾曼?斯坦因所闡釋的,數(shù)學化遠不止是“一堆數(shù)字的計算過程”?!爱斣谝粋€突發(fā)的、超級復雜,不斷動態(tài)變化的過程當中,如果沒有大數(shù)據(jù),就沒有辦法支撐決策,這時候大數(shù)據(jù)成了決策的本身”,楊娟對 Tech 星球說道。
疫情爆發(fā)后,互聯(lián)網(wǎng)科技公司都紛紛利用自己的大數(shù)據(jù)技術能力,快速地投入抗疫之中。
1 月 21 日,丁香園推出了“疫情實時動態(tài)”信息頁面;22 日,微信上線疫情實時搜索功能;23 日,騰訊健康和百度地圖同時上線“發(fā)熱門診地圖”,推出了百度遷徙數(shù)據(jù),騰訊看點上線“戰(zhàn)肺炎”頻道和“關注肺炎”專題,以及疫情地圖和預防手冊;阿里達摩院研發(fā) AI 算法,將原來數(shù)小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間。
“戰(zhàn)疫”接近尾聲,但尚未結(jié)束。一線戰(zhàn)斗崗位仍需堅守,在這場“人命關天”的爭奪戰(zhàn)中,大數(shù)據(jù)工程師們擔負了重大而特殊的使命,保衛(wèi)了許多人的健康。
經(jīng)授權轉(zhuǎn)載至成都,轉(zhuǎn)載請聯(lián)系原作者
作者公眾號:Tech星球(ID: tech618)
136 0806 8886【加微信請注明來意】
四川省成都市高新區(qū)天府三街1599號(天府三街與南華路交匯處)