期待更穩定、更完善的系統平臺
阿里人都會記得,每年“雙11”期間,負責后臺技術保障的團隊都非常緊張,加班加點加資源,甚至會燒香,祈禱系統別崩。阿里的IT系統也是在連續幾年打磨后,才逐漸順暢地應對“雙11”電商購物節的洪峰。
理解了“雙11”的崩潰,就能懂得核酸系統為什么也會出現崩潰的情況。
今年9月1~4日,成都在全市范圍內開展全員核酸檢測,核酸檢測系統“崩”了。在此之前,上海、北京、山東、西安、天津等地的核酸檢測平臺都先后出現過故障。這些也在網上引發了廣泛的討論,以及網民的吐槽。
事實上,懂行的業內人士則會把一次次問題的出現當作是遭遇戰,反思、調整、進化。在他們看來,核酸系統是智慧城市很重要的一個組成部分,這個系統打磨成熟的過程,承擔起了智慧城市磨刀石的角色。
“吐槽”該有的正確姿勢,是反思問題真正所在,以及其帶來的啟示。
「 01 」原因:對新事物的難度、復雜度認知不足
過去三年,全球宏觀環境的不確定性給許多行業帶來了巨大挑戰,數字化轉型早已不是選擇,而是適應宏觀環境和滿足用戶需求并更好生存的必由之路。特別是疫情的發展,給數字化帶來了更多的變量,這些都尤為值得思考。

10月26日第七屆IDC中國數字化轉型年度盛典上,一場以“從核酸與健康碼系統看如何奏響智慧城市建設的和諧樂章”小型論壇,吸引了參會人士的關注。幾位資深業內人士認為“核酸系統崩潰”主要是三重原因。
首先是認識不足。數字化轉型是業務與新技術的疊加,企業不斷遇到新事物和挑戰。比如核酸檢測是近兩年多才開始做的,存在認知不足的情況,比如剛開始并不清晰未來會用多久、多少人用、使用的頻率,倉促上線,導致出現一些問題。
第二是瞬間并發巨大。“大家可能沒有意識,在很多大城市核酸檢測的高峰期,其并發的要求和雙11是一樣的。”業內資深技術專家劉松認為高并發量是系統崩潰的直接誘因。這一點從多地管理部門的聲明中也得到驗證。成都市疫情防控指揮部相關負責人表示:“成都市核酸檢測系統因對短時超大并發量預估不足,導致系統出現卡頓問題。” 負責“貴州核酸信息采集平臺”研發的云上貴州大數據公司在對問題進行說明時也表示:“由于貴州核酸檢測系統對短時超大并發量預估不足,導致檢測系統出現訪問異常。”
“一旦用戶量達到一定程度的時候,簡單的事情就變得非常復雜,很多人對這個系統難度預計不足。”中國軟件網總裁曹開彬認為。
高并發量是IT行業的一個經典話題,也是影響前端用戶體驗最核心的一個問題。從IT行業技術發展路徑來看,數據庫、云基礎設施等技術的迭代,都一直在努力解決這個問題。就以“雙11”為例,在電商大促之前往往需要四五個月的時間、用上萬人的團隊提前做容量規劃,還需要提前做全鏈路的壓力測試。
需要注意一點,前面幾個城市核酸系統出現問題,幾乎都是發生在集中出現疫情、需要全市大篩查的時間節點。在劉松看來,這就是IT建設體系與新一代高頻應用的一場遭遇戰,“以前的政務體系是給政府辦公用的,沒有這么高頻和瞬間高并發的需求。”
講得更通俗一些,政務系統就像建立在政務云這個“地基”之上的建筑,地基是按照承載兩層樓挖的。而核酸檢測系統這樣的高并發,相當于是在這地基上蓋了一個十層樓的建筑物,已經超出了地基的承載能力,難免會出現各種各樣的問題。

第三是不同企業部門之間的合作。現在的數字化應用,都是一個復雜的系統工程,涉及到各個方面角色,特別是智慧城市相關的系統。這些不同的角色組合在一起共同去為一個系統服務,這期間的協調和溝通就尤為重要。
看似簡單的核酸系統,除了這個應用的直接開發企業,背后還涉及到應用開發企業,電信運營商、云服務平臺、運維系統、數據庫等多個供應商。不僅如此,還要與眾多檢測機構、多個政府部門對接。每一個角色都決定著這個系統能否順暢運行。
一場音樂會,舞臺上至少需要十幾種樂器、幾十位演奏者,他們之間彼此配合、緊密銜接,才能演奏出完美的樂章。健康碼、核酸這樣的應用系統也是如此,某一個合作方出現問題或者是對接中出現問題,都會影響整體的效果。
「 02 」應對:足夠重視,詳細規劃,選對伙伴
核酸系統在當下生活中的重要性不斷提高,關系到每個人的工作、生活。從這個角度來看,不僅需要對之前崩潰的理性反思,還要提出更有建設性的改進思路。
在劉松看來,以前因為重視不夠,錢花得也不到位。所以,首先一點就是要對其重要性給予足夠的重視,對其復雜度也要有足夠的認知。

曹開彬對此給出了四個具體建議:
第一是在重視的基礎上,做好一個非常詳細的規劃:
第二是對現有業務和系統進行充分的評估,要進一步明確目標,包括達成目標會經過哪些挑戰,如何跨過這些障礙,需要制定詳細的路線圖。
第三選型。要選擇適合自己的合作伙伴、適合自己的產品。選對的合作伙伴非常重要。把合適的提供商、合適的廠商能夠放在一個合適的位置,這時候整體的協調、整體的工作、整體的系統最終才能達到一個最優的狀態。
第四個應急預案。疫情一直在動態變化,面對新鮮事務一定要有更充分的準備,做好預案,一旦有突發情況,也能更快地解決問題,將對用戶的影響降到最低。
劉松也認同這些建議,并給出了一些具體的建議。
他認為做這樣一個重要且復雜的系統,需要一個“兜底人”。這個系統上線,往往是一個很具體的執行部門負責,可能沒有足夠的授權,也沒有很多的經費,同時還要面對那么分散的開發商、集成商,怎么辦?
這需要從組織形式上有一個“兜底人”來作保障。現在一些大的省市已經有了專門的市場化的運維支持公司,這就是從組織形式上確保有了“兜底”。
劉松特別強調“選對合作伙伴”的必要性:“涉及到幾億人的核酸系統,一定還是盡量選擇相對有經驗的大的公司。”比如在應用上東軟有很多經驗,為多個城市提供服務。云服務上,阿里云、騰訊云都有很非常豐富的經驗,他們帶來的不僅是技術,還有組織形式和運維體系上的經驗,可以說把互聯網的先進方式論平移過來。之前成都、西安等地核酸系統出現問題后,經過政府快速的排查調整,從而增加算力,優化了網絡。
此外,他還提出了一個建議:做好全鏈路壓力測試。包括從網絡到整個云基礎設施,再到數據庫處理、負載均衡,一直到最前端的應用的優化等等。這可能需要很長的時間,但很有必要。這也是互聯網企業常用的方式,非常值得借鑒。
「 03 」啟示:用“三新”理念建設智慧城市
核酸系統的問題,給智慧城市的建設帶來哪些啟示呢?
首先是要看到變化。以前,我們說數字城市,主要是勤政、惠民、興業,基本都是從政府管理的角度來看,更像是一個信息化系統,主要是公務員在用,所以從前的數字城市建設是基于2B應用的系統邏輯。而現在的智慧城市主要目標是服務于人民,類似于核酸系統,是無數個C端用戶在使用,使用的對象和場景發生了變化。其實,我們現在已經能感受到明顯的變化,老百姓可以在手機APP里使用到越來越多的政府服務。可以說,這是數字城市應用的本質變化。
其次,看到這種變化帶來的挑戰與機遇。
“隨著數字化、智能化的提升,新的系統會層出不窮。”曹開彬認為這對于供給側是機遇也是挑戰。
未來智慧城市建設中,會有越來越多類似的高頻、高并發的應用,每一個普通用戶體驗的是評價系統好壞的真實標準,這對智慧城市建設者提出全新的挑戰,要從過去的2B思維轉上2C思維
新的系統都會涉及新的問題,核酸系統看似是一個小應用,但它關乎民生,不像以前2B的應用,有一點小錯誤并不明顯,這類關乎民生的系統,稍有閃失就會造成巨大的影響。“使命光榮,責任重大。” 曹開彬強調。
談及啟示,劉松則認為:“你必須重新思考一個新的開放創新體系,包括新基礎設施,新組織形式,是新運維體系。”
互聯網企業、金融行業在面對2C應用有著豐富的經驗,他們更愿意接受新技術、新趨勢。智慧城市的建設中,也應該考慮采用更多的新技術、新基礎設施,特別是經過驗證的云服務,這不僅大大降低成本,也提升了應用上線的效率。
所謂新組織形織形態,就是前面提到的“兜底人”。一個公共服務應用,如果由具體執行部門負責IT系統的建設,他們的人力、財力、能力可能都不足夠支撐。應該采用新的組織形態,有一個最終負責的“兜底人”。
鑒于智慧城市新階段的特征,這些高頻應用關系到每一個用戶的體驗,可以學習互聯網的方法論,形成一套新的運維體系。
【結束語】
智慧城市正處于一個關鍵的轉型期。核酸系統遇到了很多新問題,這個過程中老百姓抱怨牢騷是正常的,但作為政府部門更需要透過現象看本質,并將經驗教訓沉淀下來。作為智慧城市的一個重要應用,這些經驗或許會對未來智慧化的進程起到更大的作用。“三新”就是這一次的重要收獲。