當(dāng)前,物聯(lián)網(wǎng)(IoT)、人工智能(AI)和機(jī)器學(xué)習(xí)正在走向一個(gè)不可阻擋的旅程,它們正在改變?nèi)藗兩畹拿恳粋€(gè)方面,但是只有通過數(shù)據(jù)中心收集和處理所有信息,人們將會(huì)繼續(xù)從中受益。
充分利用大數(shù)據(jù)和 AI 技術(shù),構(gòu)建智能化運(yùn)維管控模型,自動(dòng)識(shí)別業(yè)務(wù)問題,簡化運(yùn)維操作復(fù)雜度,持續(xù)改善數(shù)據(jù)中心運(yùn)行管理狀況,成為今后數(shù)據(jù)中心管理的重要課題。如何利用這些新技術(shù)在數(shù)據(jù)中心管理中精準(zhǔn)智能告警、智能異常檢測、智能趨勢預(yù)測是大家關(guān)注的趨勢。
這樣的新聞報(bào)道你可能看過:
上海銀行數(shù)據(jù)中心迎來智能機(jī)器“巡檢員”
數(shù)據(jù)中心將采用機(jī)器人監(jiān)控機(jī)柜中的熱點(diǎn)
京東金融發(fā)布京東智能巡檢機(jī)器人
沉浸式混合現(xiàn)實(shí)(MR,即Mix Reality)運(yùn)維通信系統(tǒng)正式投入生產(chǎn)環(huán)境運(yùn)行
……
機(jī)器人時(shí)代要來了嗎?數(shù)據(jù)中心運(yùn)維管理中是否可以實(shí)現(xiàn)以更少的人員投入,同時(shí)保障更高效的運(yùn)營管理水平? 如何控制風(fēng)險(xiǎn)?“人與機(jī)器”是對立,還是合作?機(jī)器人和人類是否可以合作管理基礎(chǔ)設(shè)施?
6月25日,第十屆DCD中國數(shù)據(jù)中心國際峰會(huì)上海站在上海中心大廈舉行,在這個(gè)專題討論中,主辦方邀請到了騰訊數(shù)據(jù)中心研發(fā)總監(jiān)岳上、業(yè)內(nèi)專家肖建一、阿里巴巴基礎(chǔ)設(shè)施一體化架構(gòu)師汪剛博士、萬國數(shù)據(jù)高級副總裁梁艷作為專家小組就以上話題進(jìn)行了討論。
專家小組專場討論
數(shù)據(jù)中心智能化是一個(gè)趨勢,很明顯,這些技術(shù)促使了數(shù)據(jù)中心智能運(yùn)維管理不斷的演進(jìn)。肖建一指出,數(shù)據(jù)中心運(yùn)維管理的演進(jìn)可分為三個(gè)階段。階段一,需要大量的運(yùn)維人員,運(yùn)維質(zhì)量完全依賴個(gè)人經(jīng)驗(yàn)?zāi)芰胺€(wěn)定性;階段二,建立了驅(qū)動(dòng)人工的機(jī)制及系統(tǒng)工具,依靠標(biāo)準(zhǔn)和流程將經(jīng)驗(yàn)知識(shí)固化,并定量分析人力資源分配;階段三,開始建設(shè)自動(dòng)化智能運(yùn)維,將重復(fù)???????運(yùn)維事務(wù)轉(zhuǎn)由自動(dòng)化系統(tǒng)負(fù)責(zé),分析性事務(wù)轉(zhuǎn)由AI介入?yún)f(xié)助,一定程度上大幅度降低了人力資源投入。
專家小組一致認(rèn)為,數(shù)據(jù)中心智能運(yùn)維自動(dòng)化、智能化成功的基礎(chǔ)是數(shù)據(jù)化,但數(shù)據(jù)要合理、有效、準(zhǔn)確、可靠、安全,這些是前提。機(jī)器人起到作用時(shí),則需要人工大量建模。
很多數(shù)據(jù)中心智能運(yùn)維管理的應(yīng)用場景是以事件為核心的全閉環(huán)運(yùn)維問題處理模型。我們要思考的是:數(shù)據(jù)如何采集?效率如何?準(zhǔn)確性如何?數(shù)據(jù)可以幫助實(shí)現(xiàn)什么目標(biāo)?數(shù)據(jù)的價(jià)值在哪里?AI是一種手段,怎么用?AI解決的是什么問題?人機(jī)結(jié)合的目標(biāo)是什么?
騰訊數(shù)據(jù)中心研發(fā)總監(jiān)岳上表示,騰訊研發(fā)了一個(gè)數(shù)據(jù)中心管理軟件平臺(tái)——騰訊智維,它管理了騰訊內(nèi)部約80個(gè)數(shù)據(jù)中心,超過百萬臺(tái)服務(wù)器設(shè)備。
在采集效率上,騰訊已經(jīng)在研發(fā)新的數(shù)據(jù)和視頻采集協(xié)議。通過新協(xié)議,可以打造更高效的監(jiān)控網(wǎng)絡(luò),既更細(xì)致的了解數(shù)據(jù)中心現(xiàn)場運(yùn)行情況,同時(shí)做到更低的網(wǎng)絡(luò)負(fù)載。
在保證數(shù)據(jù)的準(zhǔn)確性上,針對這些數(shù)據(jù),騰訊從五方面入手:
① 測點(diǎn)側(cè),監(jiān)控MDC測點(diǎn)接入率;
② 網(wǎng)絡(luò)側(cè),通過技術(shù)手段,一旦網(wǎng)絡(luò)出現(xiàn)問題,我們可以自動(dòng)識(shí)別問題并判斷根本原因,進(jìn)而自動(dòng)切換或者人工干預(yù);
③ 視頻側(cè),實(shí)時(shí)檢查視頻參數(shù)、視頻格式和碼率,發(fā)現(xiàn)問題及時(shí)告警;
④ 服務(wù)器側(cè),一旦服務(wù)器進(jìn)風(fēng)溫度異常,及時(shí)告警;
⑤ 異常數(shù)值,對數(shù)值做了合理區(qū)間設(shè)定,系統(tǒng)算出異常值會(huì)預(yù)警開發(fā)者。
數(shù)據(jù)可靠性的提高,確實(shí)給現(xiàn)場運(yùn)營帶來許多新的改變,如CMDB自動(dòng)發(fā)現(xiàn)設(shè)備——騰訊數(shù)據(jù)中心的所有設(shè)備上面都帶有測點(diǎn),可以通過測點(diǎn)的上報(bào),來感知整個(gè)網(wǎng)絡(luò)里的設(shè)備運(yùn)行情況,從而發(fā)現(xiàn)新增/刪除或者維修的設(shè)備,通過人簡單核對就可以入庫。如數(shù)據(jù)中心運(yùn)營水平量化考核——從大量數(shù)據(jù)中,歸納計(jì)算出反應(yīng)現(xiàn)場運(yùn)營效率的數(shù)十個(gè)一級指標(biāo),上百個(gè)二三級指標(biāo),作為對現(xiàn)場進(jìn)行???????核的KPI指標(biāo),指導(dǎo)運(yùn)維團(tuán)隊(duì)提升現(xiàn)場運(yùn)營效率。
騰訊智維是騰訊近20年數(shù)據(jù)中心運(yùn)營經(jīng)驗(yàn)與云化技術(shù)相結(jié)合成果,利用騰訊數(shù)據(jù)中心先進(jìn)的管理運(yùn)維經(jīng)驗(yàn),騰訊強(qiáng)大的技術(shù)研發(fā)實(shí)力,安全保障能力,幫助客戶持續(xù)提升數(shù)據(jù)中心運(yùn)營的質(zhì)量與效率,降低成本投入,將數(shù)據(jù)中心的價(jià)值極大化。
騰訊數(shù)據(jù)中心研發(fā)總監(jiān)岳上
筆者也看到,這一年來,智維也在多方面進(jìn)行著進(jìn)化,包括有很多AI方面的探索。
岳上表示,未來數(shù)據(jù)中心會(huì)向無人值守進(jìn)化,人機(jī)協(xié)同是一個(gè)過程,機(jī)器人做一些基礎(chǔ)重復(fù)的工作會(huì)比人做的好,但AI不光是機(jī)器人,它更需要一個(gè)大腦。
比如騰訊覓蹤,就是借助AI技術(shù),結(jié)合騰訊內(nèi)部數(shù)十年的數(shù)據(jù)中心運(yùn)營經(jīng)驗(yàn),通過自研的高性能視頻分發(fā)服務(wù)、智能跟蹤服務(wù)、針對數(shù)據(jù)中心場景特別優(yōu)化的H5圖形渲染引擎等三大核心技術(shù),依托云的池化、彈性等特性,在較低的成本下,實(shí)現(xiàn)了數(shù)據(jù)中心人員身份的精準(zhǔn)鑒別,包括關(guān)鍵區(qū)域人員入侵檢測、異常行為識(shí)別、人員隨工監(jiān)測等功能,并能夠?qū)梢扇藛T的活動(dòng)軌跡實(shí)時(shí)跟蹤定????、追溯和告警,從而滿足園區(qū)人員全方位監(jiān)控的細(xì)化需求。
騰訊覓蹤就像是個(gè)能力強(qiáng)大、高度負(fù)責(zé)的機(jī)器安檢員,7×24小時(shí)不眠不休的盯著園區(qū)上千個(gè)攝像頭的實(shí)時(shí)畫面,一旦發(fā)現(xiàn)異常便會(huì)立即告警。這個(gè)機(jī)器安檢員還可以通過多個(gè)攝像頭,實(shí)時(shí)追蹤定位可疑人員,把對物的監(jiān)控進(jìn)一步擴(kuò)展到對人的管控。
據(jù)悉,騰訊覓蹤不僅可以應(yīng)用在數(shù)據(jù)中心,還可以為很多大型功能園區(qū),如工廠、醫(yī)院、校園等提供視頻安防解決方案。目前,它依托于騰訊智維平臺(tái),為客戶提供服務(wù)。未來,騰訊覓蹤也將作為獨(dú)立產(chǎn)品向行業(yè)推出。