技術(shù)帶來美好,在這個“卡脖子”領(lǐng)域,中國科學(xué)家成功破局——
4個在美國,1個在歐洲,后也被美國公司收購。這是美國技術(shù)長期占絕對主導(dǎo)的一個領(lǐng)域。和近年芯片被廣為人知相比,數(shù)據(jù)庫對大眾來說略顯生疏和神秘。如何理解它的重要性?數(shù)據(jù)庫、操作系統(tǒng)和芯片,并稱現(xiàn)代信息技術(shù)領(lǐng)域三大核心基礎(chǔ)。其中,數(shù)據(jù)庫作為存儲、處理、分析數(shù)據(jù)的關(guān)鍵技術(shù),被譽為數(shù)字經(jīng)濟的底座。在我國,數(shù)據(jù)庫是“核高基”重大專項重點突破的核心基礎(chǔ)軟件,屬于“卡脖子”的關(guān)鍵基礎(chǔ)軟件賽道。這個賽道上,自上世紀八九十年代歐美幾個大型數(shù)據(jù)庫出現(xiàn)后,由于競爭門檻太高,世界上就再無同級別新數(shù)據(jù)庫面世。結(jié)果是,我國數(shù)據(jù)庫市場長期被國外廠商壟斷。隨著互聯(lián)網(wǎng)爆發(fā)帶來海量數(shù)據(jù),如何處理數(shù)據(jù),不僅是行業(yè)難題,也事關(guān)國家信息安全。國家對這一領(lǐng)域也曾進行大量投入,只是尚未結(jié)出碩果。面對這個中國人有些熟悉的劇本,現(xiàn)實主義的選擇,或是視而不見,或是膽怯不碰,或是繼續(xù)拿來主義,抑或機會主義,淺嘗則止,不行就撤。然而,有個20幾歲便已功成名就的科學(xué)家,放棄了令人艷羨的職位和優(yōu)渥待遇,在外界普遍不看好的情形下逆風(fēng)而行。13年來,一次次面對外界質(zhì)疑和否定,帶領(lǐng)團隊自主研發(fā)了國內(nèi)首個擁有100%自主知識產(chǎn)權(quán)的分布式數(shù)據(jù)庫——OceanBase。和目前通行的集中式數(shù)據(jù)庫相比,分布式數(shù)據(jù)庫算得上換道超車,兼?zhèn)淞思惺綌?shù)據(jù)庫無法同時具有的“記賬”(OLTP)和“數(shù)據(jù)分析”(OLAP)兩種功能。眼下,OceanBase不但讓孵化它的支付寶全面替換掉了原本依賴的國外數(shù)據(jù)庫,而且開始對外輸出,服務(wù)超過1000家客戶,涵蓋金融、政務(wù)、能源等諸多行業(yè),并走出國門,讓全世界擁有了第一個可以大規(guī)模應(yīng)用在金融核心業(yè)務(wù)的中國數(shù)據(jù)庫。
未上傳,可自行百度哈哈
▲資料圖片:陽振坤(右二)和工程師們進行討論。張朋紅
這個科學(xué)家的名字叫陽振坤,目前是螞蟻集團副總裁,也是OceanBase的創(chuàng)始人、首席科學(xué)家。上世紀90年代初,還只有20幾歲的陽振坤就聲名鵲起。1984年進入北京大學(xué),一路獲得數(shù)學(xué)學(xué)士、碩士以及計算機博士學(xué)位后留校,追隨其導(dǎo)師——著名科學(xué)家王選院士,在激光照排系統(tǒng)研發(fā)中做出了重要貢獻,獲得1995年度國家科技進步一等獎(排名第四),相關(guān)成果轉(zhuǎn)化成的商品,在海內(nèi)外大量銷售,取得了巨大的社會和經(jīng)濟效益。憑借激光照排領(lǐng)域的貢獻,陽振坤被破格晉升為教授,1999年成為北京大學(xué)首批“長江學(xué)者獎勵計劃”特聘教授之一。已獲得世俗意義上的成功,讓多數(shù)人一輩子都難以企及的陽振坤本可以“躺”在這份成果上,收獲安穩(wěn)和舒適。然而出人意料的是,36歲時他做了個有些“中年叛逆”的決定,辭去北大教職。原因是,陽振坤覺得:“激光照排技術(shù)成熟后,就覺得自己這個年齡還能為社會做點事情。在學(xué)校里面可能就是上課、做研究寫論文,一直熬到退休也是一條路,會很平穩(wěn)?!睂?dǎo)師王選的理念影響了他,做工程的需要到市場上,到需求中去,才能真正發(fā)揮價值。陽振坤覺得自己在工程領(lǐng)域有些特長。眼看互聯(lián)網(wǎng)行業(yè)的成熟和發(fā)展,他決定跳出舒適區(qū),去企業(yè)找到一個新的能讓自己對社會有用的方向。在市場中找到數(shù)據(jù)庫這個新的攻關(guān)方向,陽振坤花了8年時間。2010年,陽振坤加入了阿里巴巴。彼時,中國的移動互聯(lián)網(wǎng)開始爆發(fā),帶來了海量數(shù)據(jù),傳統(tǒng)集中式數(shù)據(jù)庫在應(yīng)對海量存儲、高并發(fā)、容災(zāi)運維等方面顯得不堪重負。關(guān)鍵的是,有人算了一筆賬,對中國的電商行業(yè)來說,1萬億商品交易總額(GMV)意味著,每年要給IOE(IBM、Oracle、EMC)三家公司支付200億元采購費。這筆錢會超過他們當(dāng)年所能賺取的利潤。這讓一直在尋找的陽振坤看到了機會。如果將數(shù)據(jù)庫的處理能力和容量比為“馬拉車”,隨著數(shù)據(jù)增長,傳統(tǒng)集中式數(shù)據(jù)庫的解決方案是把“馬”不斷做大,但誕生于數(shù)十年前的集中式數(shù)據(jù)庫很難應(yīng)對這種指數(shù)級的增長,成本高昂。而且還有一個缺點,一臺機器出問題,整個系統(tǒng)會崩潰。對分布式頗有研究的陽振坤意識到,用分布式來研發(fā)數(shù)據(jù)庫,用許多“小馬”來共同拉“大車”,不僅更靈活,可靠性高,而且成本也更低。這便是中國人自主研發(fā)原生分布式數(shù)據(jù)庫的靈感來源。有統(tǒng)計顯示,每一項國家科技獎的背后,科學(xué)家平均要坐16年“冷板凳”。
科技進步行走在無人區(qū),結(jié)果有很大不確定性,路徑也并不清晰,要面對周邊的質(zhì)疑??茖W(xué)家同樣是有血有肉的人,有不得不低頭的現(xiàn)實生活需要,能耐住寂寞,不焦慮,把“冷板凳”坐熱的是少數(shù)。然而核心技術(shù)買不來,要突破,就少不了不浮不躁,心無旁騖的人。OceaBase從立項之初,就時刻有夭折風(fēng)險。“數(shù)據(jù)庫巨頭們試了很多次沒做成的事,你們幾個人能成?”“二三十年來一直沒有新大型數(shù)據(jù)庫出現(xiàn),你們沒想想為什么?”從內(nèi)到外,質(zhì)疑聲不斷。數(shù)據(jù)庫雖復(fù)雜,要做也不是沒有捷徑。海外數(shù)據(jù)庫巨頭已開源,國內(nèi)廠商拿著開源穿馬甲,改頭換面成自己的來做,也是很多人的選擇。但那樣就掌握不了核心的東西,而且別人的版本升級你也得跟著升級,所以終究還是別人的附庸,自己的技術(shù)能力也沒長起來。缺人也是頭疼的問題。本來數(shù)據(jù)庫這行專業(yè)的人就少,國內(nèi)更少。很多人不愿意做,因為領(lǐng)域比較成熟,發(fā)論文會難。海外數(shù)據(jù)庫巨頭的高管還曾公開揚言,絕不培養(yǎng)中國員工,不能任由中國像美國培養(yǎng)出越來越多的工程師。公司則給出了兩年的期限,兩年內(nèi)全力支持,如果兩年做不出來,就關(guān)停。就是在這樣的情形下,沒有任何先例可參考的陽振坤,帶著拼湊起來的幾十人的團隊,一行一行代碼開始了分布式數(shù)據(jù)庫之路。這個團隊除了陽振坤,剩下的基本都是應(yīng)屆生。轉(zhuǎn)眼到2012年底,兩年之期到來,OceanBase的功能尚未完善,關(guān)停風(fēng)險也隨之而來。雖然最終公司并未這么做,但接下來幾年,陽振坤和他的團隊依舊在冷板凳上坐著,雖屢屢主動請纓,業(yè)務(wù)團隊卻依然不信任,不敢用。“萬一出問題,怎么辦?老的數(shù)據(jù)庫至少穩(wěn)健?!睆臉I(yè)務(wù)角度出發(fā),擔(dān)心也不無道理,但這種不信任卻讓新產(chǎn)品陷入了死循環(huán)。直到2014年“雙11”前夕測試時,一直依賴的國外數(shù)據(jù)庫崩了。技術(shù)團隊在沒有辦法的情形下,不得不緊急啟用OceanBase ,在冷板凳上坐久了的陽振坤,終于等來了證明自己的機會。那年“雙11”,一貫謙遜寡言的陽振坤難得說了一次“過頭話”。面對CEO有沒有信心的詢問,站在窗邊的陽振坤說:“出問題的話,我們準備從這跳下去?!?/section>最終一切都很順利。此后的時間里,OceanBase以遠低于傳統(tǒng)數(shù)據(jù)庫的成本,扛住了支付寶一次又一次的“雙11”交易峰值。2019年和2020年,在被譽為“數(shù)據(jù)庫領(lǐng)域世界杯”的TPC-C和TPC-H基準測試中,兩次封頂世界紀錄,打破了由Oracle(甲骨文)保持了9年之久的世界紀錄,成為唯一兩次登頂該榜單的中國數(shù)據(jù)庫產(chǎn)品。在突飛猛進的時代,陽振坤和他的團隊信奉另一種職業(yè)邏輯,靜心專注于自己的代碼,深耕技術(shù)也可以取勝。正如愛因斯坦在《探索的動機》中所說:“在攀登科學(xué)高峰中,功利主義也能走遠,但非功利主義可以走得更遠,能夠跨越從0到1?!?/section>陽振坤對自己的評價是:我不是一個很聰明的人,只是我把精力時間都集中在一個點上。2022年11月,陽振坤獲得中國計算機界的至高榮譽“王選獎”。但58歲的陽振坤更愿意稱自己是“數(shù)字工匠”或者“程序員”。導(dǎo)師王選多年前的一段教誨,是他做很多事的原則。王選說,做事情要頂天立地。頂天就是做的東西技術(shù)上要有過人之處,立地就是做東西的時候就得想著別人怎么來用它。否則,你技術(shù)再好再牛,不符合別人的需求,也沒有用。陽振坤在做國產(chǎn)數(shù)據(jù)庫時,就要求必須“頂天立地”。在這個理念下,OceanBase 沒有成為研究室里的花瓶,憑借高可用、高擴展、高兼容、高性價比及穩(wěn)定安全等優(yōu)勢迅速走向了市場。工信部賽迪顧問軟件與信息服務(wù)產(chǎn)業(yè)研究中心發(fā)布的報告顯示,OceanBase已占據(jù)國產(chǎn)分布式數(shù)據(jù)庫金融市場占有率第一的位置。OceanBase目前已助力1000多家行業(yè)客戶實現(xiàn)數(shù)字化升級,涵蓋金融、政務(wù)、能源、運營商、交通、互聯(lián)網(wǎng)等海內(nèi)外企業(yè),有30%的客戶將OceanBase應(yīng)用于核心系統(tǒng)。國內(nèi)70%千億資產(chǎn)規(guī)模以上銀行、75%頭部證券機構(gòu)、65%頭部保險機構(gòu)、45%頭部基金公司都選擇OceanBase進行核心系統(tǒng)升級。全國1/5省份的移動運營商、1/4省份的人社部門等都在采用OceanBase。 作為中國數(shù)據(jù)庫的代表,OceanBase的出海腳步也在加快。截至目前已在美洲、歐洲、亞洲三大洲的30個可用區(qū)提供服務(wù)。非洲電子錢包Palmpay也在OceanBase助力下實現(xiàn)云遷移,降低了80%數(shù)據(jù)庫成本。陽振坤說,數(shù)據(jù)庫沒有國界,中國的數(shù)據(jù)庫在全世界業(yè)務(wù)收入比例還很小,如果我們不能走出去,企業(yè)也沒有活路。他還不敢說目前國產(chǎn)分布式數(shù)據(jù)庫已完全成功,但他相信,一定能成。“我們只是一個分布式數(shù)據(jù)庫領(lǐng)域的‘破局者’,要在變局中開新局,還需要攻克很多難關(guān)?!蹦杲哉诩夹g(shù)一線一個一個地攻關(guān)。排在日程上的一個難關(guān)是,如何將數(shù)據(jù)庫出故障后恢復(fù)時間再縮短。前幾年,陽振坤給OceanBase設(shè)計的算法,已經(jīng)讓恢復(fù)時間可以做到30秒,全球領(lǐng)先。不過他覺得還是長了些,用一年多時間,苦思冥想設(shè)計了新算法,希望能做到5秒,最后結(jié)果是8秒。所以,還不能止步。
來源: 參考消息?。?!