創(chuàng)業(yè)投資服務(wù)平臺

創(chuàng)投時報(bào)LOGO

霄云科技:敢捅窗戶紙 不懼浪淘沙

1264人瀏覽 / 0人評論

“感覺捅破了窗戶紙?!?/span>

李小勇看了一眼實(shí)驗(yàn)室中搭建的原型系統(tǒng),又仔細(xì)核對一遍各項(xiàng)實(shí)測能數(shù)據(jù)。他感覺捅破了窗戶紙,感覺時機(jī)已經(jīng)成熟,“是時候,將‘PB級海量存儲技術(shù)’進(jìn)行產(chǎn)業(yè)化推廣了。”

2015年,李小勇作為創(chuàng)始人兼CEO,正式創(chuàng)辦上海霄云信息科技有限公司,篤定完全自研、不基于開源的高能分布式存儲。

霄云科技 創(chuàng)始人兼CEO 李小勇博士

“系統(tǒng)架構(gòu)”成為突破口

李小勇的內(nèi)心一直有個IT人的夢想,“我們使用的核心IT系統(tǒng)和各類基礎(chǔ)軟件,幾乎都是國外的。我們的研究不能只停留在論文上,我們不但要能說能寫更要能做,才能迎頭趕上與國外IT技術(shù)的差距?!苯虝耸噍d,李小勇無數(shù)次向?qū)W生講授分布式存儲技術(shù)原理,但他深知“將原理轉(zhuǎn)化為產(chǎn)品,需要解決諸多技術(shù)挑戰(zhàn)。例如,可擴(kuò)展架構(gòu)、連接與請求的超時處理、I/O的并發(fā)、讀寫過程中進(jìn)行擴(kuò)容而I/O不能中斷等,諸多原理、架構(gòu)、關(guān)鍵技術(shù)問題堆積在一起時,就感覺無從下手。”

“系統(tǒng)架構(gòu)”成為了霄云科技的第一突破口。

時間回到2003年,Google發(fā)布Google File System論文,正式為分布式軟件定義存儲奠定了理論基石。當(dāng)時還在讀博士的李小勇敏銳感覺到是次機(jī)會,“為存儲產(chǎn)業(yè)打開了一扇新的窗口?!?/span>

但也僅是一扇窗口。

因?yàn)樵谥T多分布式存儲實(shí)現(xiàn)方式中,“集中式元數(shù)據(jù)管理”最早被提出應(yīng)用,GFS和Hadoop HDFS等經(jīng)典系統(tǒng),均是依據(jù)此模式設(shè)計(jì)。其優(yōu)點(diǎn)是系統(tǒng)架構(gòu)簡單,元數(shù)據(jù)操作高,但缺點(diǎn)也很明顯,元數(shù)據(jù)服務(wù)器就是系統(tǒng)瓶頸,它所能管理的文件數(shù)量上限很難突破10億。

到了2010年,分布式存儲又迎來一場巨大的技術(shù)進(jìn)步。隨著OpenStack技術(shù)的發(fā)展,“去中心化”的Ceph成為分布式存儲的明星。不夸張的說,國內(nèi)的大多數(shù)分布式存儲企業(yè),都在基于Ceph開源軟件設(shè)計(jì)產(chǎn)品。但Ceph起步之初就缺乏工程經(jīng)驗(yàn),差強(qiáng)人意的代碼質(zhì)量也確實(shí)會影響系統(tǒng)穩(wěn)定

霄云科技學(xué)習(xí)了開源技術(shù),但又忘掉開源技術(shù),沒有選擇Ceph,當(dāng)然也沒有選擇此前的“集中式元數(shù)據(jù)管理”?!耙詮?fù)雜的方法去解決復(fù)雜的問題,正確和效率都難以保證,用簡單方式解決復(fù)雜問題才是正確的方法。”李小勇說:“借鑒NoSQL數(shù)據(jù)庫理念,霄云科技完全自研系統(tǒng)架構(gòu),以“集中決策、分布執(zhí)行”模式,將文件的內(nèi)容以對象的方式存儲到每個節(jié)點(diǎn)上。這樣既兼顧了集中式架構(gòu)和去中心化架構(gòu)的優(yōu)點(diǎn),也保證了系統(tǒng)可分布式拓展,且沒有單點(diǎn)并發(fā)瓶頸?!?/span>

運(yùn)氣還是偏執(zhí)

一切因此迎刃而解。

以2015年為起點(diǎn),創(chuàng)業(yè)后的4年間,霄云科技的技術(shù)線從塊存儲,延伸至文件存儲、對象存儲,并推出碧海分布式存儲系統(tǒng)(BOSS)。同時,霄云科技攻克了“海量小文件聚合優(yōu)化”和“文件和對象可互通訪問”、“自適應(yīng)流控”等技術(shù)難題,還在實(shí)踐中自研應(yīng)用了“海量數(shù)據(jù)快速遷移工具”。

“每一次關(guān)鍵技術(shù)的突破,至少要經(jīng)歷三次以上的失敗?!崩钚∮抡f:“創(chuàng)業(yè)始于創(chuàng)新,但成功的技術(shù)創(chuàng)新,必然是小概率事件,需要一點(diǎn)點(diǎn)運(yùn)氣,需要一點(diǎn)點(diǎn)偏執(zhí),也需要一點(diǎn)點(diǎn)時間。”

他所說的“一點(diǎn)點(diǎn)”運(yùn)氣,就是技術(shù)創(chuàng)新的不確定。如果有人有錢就能保證創(chuàng)新成功,就不可能有創(chuàng)業(yè)企業(yè)的生存空間。因?yàn)閺膩頉]有所謂“條條大路通羅馬”,在技術(shù)創(chuàng)新過程中,只有部分道路才會通向羅馬。

當(dāng)然,李小勇所說“一點(diǎn)點(diǎn)”偏執(zhí)和“一點(diǎn)點(diǎn)”時間,是霄云科技已經(jīng)在分布式存儲領(lǐng)域堅(jiān)持了10多年。人海戰(zhàn)術(shù),遠(yuǎn)遠(yuǎn)不能抵消“偏執(zhí)狂”在縱向領(lǐng)域10年+的探索積累。

在應(yīng)用場景中打開市場

這就使霄云科技,有資格去捅破第二層窗戶紙。

中國企業(yè)數(shù)字化轉(zhuǎn)型始于2015年,至2020年前后進(jìn)入深水區(qū)。此時產(chǎn)業(yè)格局發(fā)生著妙的變化,科技企業(yè)在以“應(yīng)用場景”重新劃分市場格局。道理很簡單,業(yè)務(wù)痛點(diǎn)藏在應(yīng)用場景中,而數(shù)字化轉(zhuǎn)型的價值就是解決業(yè)務(wù)痛點(diǎn)。

“存儲產(chǎn)品并沒有行業(yè)屬,但聚焦行業(yè)應(yīng)用場景,更容易打開市場?!毕鲈瓶萍颊业搅耍?“碧海分布式存儲系統(tǒng)(BOSS),特別匹配醫(yī)院中的PACS場景,這可是醫(yī)療行業(yè)3大核心生產(chǎn)系統(tǒng)之一”。這并不是霄云科技摸索的第一個應(yīng)用場景,而是歷經(jīng)數(shù)年摸索了大概5-6個行業(yè)10幾種應(yīng)用場景后找到的。

10年前,患者CT檢查產(chǎn)生的圖像大約只有幾百張,醫(yī)生調(diào)閱患者PACS圖像只需要10秒左右。但在10年后,256排高端CT設(shè)備已經(jīng)廣泛應(yīng)用。目前,患者一次檢查產(chǎn)生的圖像數(shù)量達(dá)到3000~10000幅,調(diào)圖時間普遍在2分鐘以上。

別看就是這兩分鐘,初審醫(yī)生還可以喝杯水忍耐一下,但復(fù)審醫(yī)生每天要調(diào)用200組以上圖片,調(diào)圖卡頓等待時間可能超過4個小時,周末加班成為常態(tài)?!拔覀兊臅r間不能浪費(fèi)在鼠標(biāo)“轉(zhuǎn)圈圈”上。中國人都要在月球建基地了,傳張圖片有那么困難嗎?”復(fù)審醫(yī)生經(jīng)常如此吐槽。

還真有這么難。

信息部門先后對系統(tǒng)硬盤和內(nèi)存進(jìn)行升級,PACS軟件服務(wù)商也嘗試了6種優(yōu)化方案,網(wǎng)絡(luò)系統(tǒng)甚至已升級至“萬兆骨干、千兆桌面”,但效果都不明顯?!?span id="fkx4pno" class="keyword">性能瓶頸只能是存儲系統(tǒng),”在逐一排除了可能存在的能瓶頸之后,醫(yī)院也不得不面對和解決存儲的能瓶頸。

在此之前,醫(yī)療PACS影像在線業(yè)務(wù)幾乎都是國外高端SAN存儲,并沒有三甲級醫(yī)院將分布式存儲用于在線業(yè)務(wù)的先例。但先例正是從此開始,經(jīng)實(shí)際業(yè)務(wù)測試,霄云科技碧海分布式存儲系統(tǒng)(BOSS),可實(shí)現(xiàn)百億級文件能不衰減(100TB的PACS數(shù)據(jù)量約為2億個文件),將PACS系統(tǒng)的調(diào)圖速度從業(yè)內(nèi)普遍的每秒20~50幅,提高到每秒300幅以上,徹底解決了PACS影像調(diào)圖卡頓的痛點(diǎn)。

“每秒300幅就此成為行業(yè)門檻?!崩钚∮抡f。雖然友商也喊出了“每秒300幅”的目標(biāo),但那是下一代產(chǎn)品,霄云科技顯然不用讓用戶等那么久,其成熟產(chǎn)品已經(jīng)在實(shí)際項(xiàng)目中落地驗(yàn)證。

這確是個技術(shù)問題。1995年,Sun公司發(fā)表文章,標(biāo)題為《為什么線程池設(shè)計(jì)是個很糟糕的想法》;2003年,伯克利大學(xué)也發(fā)表一篇文章,標(biāo)題為《事件驅(qū)動是行不通的》。兩篇文章的觀點(diǎn)截然相反,代表決定分布式存儲能的兩種技術(shù)流派之爭:線程池模式與事件驅(qū)動模式。

而且兩種技術(shù)流派爭論了20年?!跋鲈瓶萍家沧哌^彎路,每一種流派都有過嘗試,”李小勇說:“最終霄云科技是將兩種方法結(jié)合,采用‘進(jìn)程池+事件驅(qū)動’模式,每顆CPU啟動一個進(jìn)程,每個進(jìn)程內(nèi)部使用事件驅(qū)動模式。”

以“海量小文件聚合優(yōu)化”為例,霄云科技管理文件數(shù)可達(dá)百億,是傳統(tǒng)NAS存儲的100倍,是開源軟件Ceph的10倍。最終能測試數(shù)據(jù)表明:霄云科技通過海量小文件聚合優(yōu)化技術(shù),能夠?qū)崿F(xiàn)百億級文件能衰減小于5%,能超過了傳統(tǒng)及Ceph開源存儲。

同行之間才有赤裸裸的信任

正因如此。霄云科技的碧海分布式存儲系統(tǒng)(BOSS),成為目前為數(shù)不多能用于醫(yī)療PACS影像在線業(yè)務(wù)的分布式存儲產(chǎn)品。這可并不是一個小市場,中國三級甲等綜合醫(yī)院已經(jīng)超過1600家,二級醫(yī)院數(shù)量更為龐大。

僅此應(yīng)用場景,年市場容量就在20億~50億元,而且在如此專業(yè)的應(yīng)用場景中,只有同行之間才有赤裸裸的信任。因?yàn)榭蛻粜湃瓮械谋硶蛻絷P(guān)注同行的實(shí)踐。這正是霄云科技捅破的第二層窗戶紙。

目前,霄云科技推出的新一代醫(yī)療PACS影像存儲解決方案,已經(jīng)服務(wù)30%上海大三甲醫(yī)院,輻射北上廣深及全國范圍三甲醫(yī)院,包括上海市胸科醫(yī)院、上海市五官科醫(yī)院、復(fù)旦大學(xué)附屬腫瘤醫(yī)院、上海兒童醫(yī)學(xué)中心、上海市華東醫(yī)院、上海市龍華醫(yī)院以及北京、深圳、江蘇、山東、山西、安徽等多家三級甲等醫(yī)院。

“此后,醫(yī)療大數(shù)據(jù)、醫(yī)療影像云、醫(yī)療云平臺、金融電子票據(jù)、大數(shù)據(jù)分析等應(yīng)用場景,數(shù)據(jù)量巨大、能要求高的應(yīng)用場景,都將成為霄云科技的目標(biāo)市場。”李小勇提出了后續(xù)業(yè)務(wù)目標(biāo)。

當(dāng)然,有一點(diǎn)永遠(yuǎn)不會改變。

“市場就是大浪淘沙。缺乏核心技術(shù)競爭力,產(chǎn)品同質(zhì)化,就容易徘徊在低端市場,難以盈利,很難有好的發(fā)展前景。而碧海分布式存儲系統(tǒng)(BOSS)在系統(tǒng)架構(gòu)、能、穩(wěn)定方面的優(yōu)勢,將使霄云科技有能力在中高端分布式存儲市場,占據(jù)一席之地?!崩钚∮伦詈笳f。

全部評論