百邁客創(chuàng)始人兼董事長鄭洪坤先生
產(chǎn)研對(duì)話:SLAF-seq助力海洋生物基因組科研
海洋生物是生物學(xué)研究的重要領(lǐng)域,也是破解人類起源之謎的重要板塊。自1997年起,美國便開始有計(jì)劃的開展對(duì)羅非魚、對(duì)蝦和牡蠣等海洋生物的基因組研究,并且多個(gè)海洋藍(lán)藻基因組計(jì)劃也相繼啟動(dòng)。雖然我國起步較晚,但目前也已啟動(dòng)了扁藻、螺旋藻、牡蠣、對(duì)蝦等基因組計(jì)劃。正如相建海老師所說:由于海洋生物基因組大、雜合度高、拼接難度大成為了全球研究海洋生物基因組的最大困擾。
工欲善其事,必先利其器。為了破解凡納濱對(duì)蝦的基因組密碼以便更好地培育對(duì)蝦,實(shí)現(xiàn)其經(jīng)濟(jì)價(jià)值和生物研究價(jià)值,相建海老師在基因測(cè)序的道路上開始了新的征程。多次嘗試使用二代測(cè)序技術(shù)都沒有辦法完成對(duì)蝦的基因組圖譜的重組,但在一次偶然的機(jī)會(huì)下他發(fā)現(xiàn)來自百邁客公司自主研發(fā)的SLAF-seq技術(shù)可以很好的完成這一問題。該技術(shù)前期利用生物信息學(xué)方法,對(duì)目標(biāo)物種的參考基因組(或已知BAC序列)進(jìn)行系統(tǒng)分析,設(shè)計(jì)標(biāo)記開發(fā)方案,后期根據(jù)前期的方案,構(gòu)建SLAF-seq文庫,篩選特異性長度片段進(jìn)行高通量測(cè)序,將獲得測(cè)序深度和質(zhì)量滿足要求的SLAF片段來代表目標(biāo)物種的全基因組信息。于是產(chǎn)研互助,世界上第一個(gè)凡納濱對(duì)蝦的基因組圖譜在我國率先完成了,很快也在國際期刊《scientific reports》雜志上發(fā)表這一重大成果,獲得了國際上認(rèn)可。
自此,百邁客公司自主研發(fā)的SLAF-seq技術(shù)奠定了在海洋生物基因研究上不可或缺的重要地位。
共建共享:基因大數(shù)據(jù)平臺(tái)提高公共基因利用率
數(shù)據(jù)是觀測(cè)生物遺傳信息的重要基礎(chǔ),不同生物的遺傳數(shù)據(jù)可謂是科研道路上必不可少的戰(zhàn)略性資源,但目前這種資源卻存在利用不足或者資源浪費(fèi)的現(xiàn)象。
相建海老師對(duì)此提出了自己的建議:搭建生物大數(shù)據(jù)平臺(tái)勢(shì)在必行,這是發(fā)展海洋生物基因組學(xué)研究必不可少的事情。特別是如何共建共享生物領(lǐng)域的公共數(shù)據(jù)?如何利用數(shù)據(jù)不斷地更新迭代以完善生物基因組圖譜信息?更重要的是,如何把數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力,服務(wù)生物經(jīng)濟(jì)的發(fā)展;如何將數(shù)據(jù)轉(zhuǎn)化為科研動(dòng)力,服務(wù)生物科研的前進(jìn)。
面對(duì)這些問題,百邁客公司提出了自己的回答。而這一回答的答案便是:建立海洋生物基因大數(shù)據(jù)平臺(tái)。百邁客創(chuàng)始人兼董事長鄭洪坤先生為我們介紹到:自高通量基因測(cè)序發(fā)展的十幾年時(shí)間以來,業(yè)界已經(jīng)積攢了許多數(shù)據(jù),但這些數(shù)據(jù)的公共利用率卻不是很高。據(jù)了解,面對(duì)海量的數(shù)據(jù)不知從何下手、有效的數(shù)據(jù)不能得到專業(yè)性的轉(zhuǎn)化成為了阻礙基因公共數(shù)據(jù)利用率的兩座大山。
既然問題已經(jīng)很明顯了,那解決問題就很容易了。鄭洪坤先生表示:讓數(shù)據(jù)庫的數(shù)據(jù)可用,讓可用數(shù)據(jù)有工具再利用便是這一大數(shù)據(jù)平臺(tái)搭建的出發(fā)點(diǎn)。
如何搭建這一大數(shù)據(jù)平臺(tái),鄭洪坤先生及其團(tuán)隊(duì)有著自己的步驟和想法,他告訴生物探索記者:首先,我們從海洋生物信息的科研需求入手,打造一個(gè)海洋生物多組學(xué)數(shù)據(jù)庫。該數(shù)據(jù)庫包含了基因組、轉(zhuǎn)錄組、表觀組、代謝組、蛋白組等各種類型組學(xué)的數(shù)據(jù),把科研所需的數(shù)據(jù)一網(wǎng)打盡,為科研人員提供多方位全覆蓋的幫助。在這里,不僅可以幫助科研人員減少測(cè)序成本的浪費(fèi),也能夠提高基因公共數(shù)據(jù)的利用率,為數(shù)據(jù)更新迭代做出努力。
第二,既然有了數(shù)據(jù),如何才能把數(shù)據(jù)背后的價(jià)值挖得更加透?我們想要打造一個(gè)類似人工智能的交互平臺(tái),依靠海量的基因公共數(shù)據(jù),利用互聯(lián)網(wǎng)大數(shù)據(jù)算法技術(shù),為科研人員提供相關(guān)建議和解決方案。例如,科研人員通過測(cè)序技術(shù)得出了海洋生物的一些數(shù)據(jù),但并不清楚這些數(shù)據(jù)能為科研提供何種幫助。這時(shí),大數(shù)據(jù)的交互分析便成為了科研亟需的工具了。它就像一個(gè)人工智能科學(xué)家,幫助你解讀數(shù)據(jù)信息,幫你找到合適的工具、甚至我們可以設(shè)想它能夠幫助你找到研究的新突破口。
基因+:產(chǎn)業(yè)化支撐海洋生物信息產(chǎn)業(yè)發(fā)展
如今,大數(shù)據(jù)平臺(tái)的正式成立成為了新的開端,至于以后的發(fā)展如何,鄭洪坤先生也表示將繼續(xù)依托“基因+”多元化的發(fā)展理念,將海洋生物基因組學(xué)的研究推向新的高潮。但要堅(jiān)持這一發(fā)展理念,也存在重重困境。
首先是生物信息人才的流失。鄭洪坤先生表示:“為什么IT行業(yè)不存在人才流失呢?是因?yàn)楫a(chǎn)業(yè)的支撐能力。隨著產(chǎn)業(yè)的不斷發(fā)展,產(chǎn)業(yè)價(jià)值的不斷豐富,給足了在此行業(yè)的工作人員安定定求發(fā)展的信心。如果如果想要留住專業(yè)的生物信息人才,我目前能想到的方法還是以互聯(lián)網(wǎng)商業(yè)化的形式將他們留住。舉個(gè)例子,如果市場需要一個(gè)基因組的解讀軟件,而恰好由我們的專業(yè)團(tuán)隊(duì)開發(fā)出來了,他們的付出就應(yīng)該得到回報(bào),而這個(gè)回報(bào)可以是金錢。隨著在市場上用這個(gè)軟件的人越來越多用,他能夠得到的回報(bào)也就更多,也讓他有更多的信心和動(dòng)力去不斷地對(duì)此軟件進(jìn)行更新迭代。通過商業(yè)化的模式,有投入有回報(bào),持續(xù)迭代,就有可能將其發(fā)展成為一個(gè)具有市場強(qiáng)競爭力的產(chǎn)品。”
其次是商業(yè)模式的選擇。既然要用商業(yè)化的方式留住人才,也就逃不開談到平臺(tái)的盈利模式。與會(huì)期間也有很多科研學(xué)者建議將此作為免費(fèi)的科研服務(wù)平臺(tái),對(duì)此鄭洪坤先生也表達(dá)了自己的意見:“目前我們團(tuán)隊(duì)所設(shè)想的盈利模式可能很貼近互聯(lián)網(wǎng)的盈利模式,是將其放置一個(gè)相對(duì)長時(shí)間的周期里面來看的。開始投入市場的時(shí)候,可能會(huì)是免費(fèi)試用的模式。因?yàn)槌醭雒]的我們需要的是流量和培養(yǎng)用戶的體驗(yàn)感,讓用戶不斷地給我們提意見進(jìn)行改進(jìn)。當(dāng)我們的改進(jìn)達(dá)到穩(wěn)定可持續(xù)的狀態(tài)時(shí),我們需要的便是用戶的黏度了,也就是當(dāng)用戶真正認(rèn)可了我們的服務(wù)與價(jià)值,也就會(huì)很自愿地對(duì)我們的產(chǎn)品買單。”