蘇州報告:AI製藥未來可期亦可欺

日前,筆者受邀在蘇州談一談中國的AI製藥。

下文是這次報告的主體內容:AI製藥,未來可期亦可欺 —— 我們分6點說。較現場報告,本文略有刪補。

首先,超越AlphaFold。

我想,沒有人能否認,今天中國的AI製藥產業繁榮,唯一的推手就是 AlphaFold2,不是 1 也不是3,所以我們從 AlphaFold 開啓話題。

在2021年6月,AlphaFold2 的論文見刊、推理模型開源後,國內的AI藥企開始了對 AlphaFold2 爭先恐後地超越。

爲什麼要超越?

原因不外乎三點。公司可以向外界證明:其擁有極其優秀的專家團隊,能夠研發尖端水平的通用模型,願意投入大量研發資金。—— 這些都是頂尖創新型公司的特徵,所以投資人可以放心打錢。

2021年末的超越AlphaFold三方打分大戰,大家都還有印象吧?

12.8,甲公司發佈Afold,在CASP14目標集上LDDT打分82.6,並且速度比AF2塊2~3倍。第二天,乙公司發佈Bfold,在CASP14目標集上TM-score打分82.7。又過了幾天,丙公司發佈Cfold,在CAMEO最新測試集上超過A和B。

一時間,你方唱罷我登場,好不熱鬧。

作爲一名做蛋白計算的一線研發人員,我對這些打分數字非常敏感。在所有的文獻中,AlphaFold2只有5種打分。其中,在CASP14目標集上,AF2的LDDT打分也是82.6,和Afold相同,但是Afold效率更高,高2 ~ 3倍,所以實現了超越。

然而,在CASP14目標集上,AF2的TM-score的打分僅僅爲0.91,Bfold的82.7的大約是其90倍,遠遠超過,超了一個量級,可見更勝一籌。

大家覺得是嗎?我在諷刺。

因爲TM-score打分是張陽教授在2004年開發的,是蛋白計算領域最常用也最有用的打分之一,它的分值範圍是 0 ~ 1,0最差,1最佳。所謂82.7就是0.827乘以100。

這就好比2個人比賽吹牛。一個人說我硬拉180公斤,牛吧?另一個說,我跳遠1.81 x 100 = 181釐米,181 > 180,是不是更牛?如果乙公司不是要營造一種超過甲公司的觀感,爲什麼要乘以100,剛剛好超過0.1呢?這在當時給人的觀感是非常差的。

更何況,丙公司將它超越甲乙的結果翻譯爲英文發到外網,立刻在推特上引發了學術羣嘲,帶頭的就是時任哈佛大學助理教授的謝爾蓋·奧武什尼科夫。

AF2是CASP14冠軍。在CASP15比賽中,多支華人團隊在多個賽道取得了非常優異的成績。比如,張陽課題組的鄭偉博士開發的方法取得了蛋白單體結構預測和多體結構預測冠軍,他們的工作在2024年正式見刊於Nature Methods,非常贊。

但是,他們的這個方法不適合商業化。

我不知道他們要不要把它商業化,我只是認爲它不適合,這是我的個人觀點。

以多體結構預測爲例,其方法首先對每個單體生成10個MSA,而後用AF2分別預測10個單體結構,以pLDDT打分排序結構,取排序最高的M個MSA;

其次,對N聚體,將單體的MSA排列組合,可以得到M^N種MSA的拼接方式(同源多聚體要去冗),令M^N <= 100;

接着,再用AF-multimer分別預測拼接的MSA的結構,依據pLDDT打分,挑出最佳的多聚體結構即可。

也就是說,只要10N次單體AF2預測,加上,最多100次多體AF-multimer預測,就能獲得比1次AF-multimer預測好很多的結構。

所以,這個方法不適合商業化落地。—— 因爲它的創新點在於生成多個高質量的MSA和套殼AF2的pipeline,即便AF2允許商用,這個pipeline需要約100倍的算力和時間,不適合高通量。

現在已經開始超越AF3了。

這是真的。

AF3的論文所列舉的各個測試項目中,唯一AF3不是SOTA的項目是RNA結構預測,它輸給了Alchemy_RNA2這個方法 —— Alchemy_RNA2CASP15RNA結構預測冠軍。

怎麼回事呢?

CASP15的RNA結構預測比賽共有12個目標結構,其中4個是非天然RNA,8個是天然RNA,而4個非天然RNA的結構非常難,幾乎所有方法的預測結果都非常糟糕,除了Alchemy_RNA2。

原因是,Alchemy_RNA2通過專家文獻調研精準地找到了它們的二級結構,這非常厲害!通過二級結構再預測三級結構就準確多了。我們也可以看到,在其他8個結構的預測上,與其它幾個排名靠前的方法相比,Alchemy_RNA2雖然也排名靠前,但並不佔明顯優勢。

所以,我們或許依然可以說,人工智能,AI,不如人工智能,human intelligence。

但是,超越又如何呢?

這是一篇2024年上半年發表在Nature Methods的文章,它的結論簡單地說就是AF2的側鏈預測不夠準確,而這不夠準確並不是因爲可能存在的多構象。

側鏈不準對小分子docking可是非常不好的。

再退一步,即便側鏈預測得準,又如何?

如果我們只把“AI製藥”的概念侷限於蛋白質或者核酸的結構預測、從頭設計,那麼在整個藥物發現的全流程中,類似於AlphaFold的工具的用武之地是非常小的。

的確,AlphaFold可以加速藥物研發,也可以省錢。

但是我們看這裏,各類成功研發的藥物的研發週期的中位數都在10年左右,把10年縮短爲9年11個月,把10億投入減少爲9.99億,這真地能提供很大的想象空間嗎?

AlphaFold是通用模型,特別是AF3。下面,我們說不可通用的模型。

2023年初,chatGPT爆火,一時間AI製藥蠢蠢欲動,彷彿AlphaFold之後又一個大風口來了。所以我們就看到了這樣一出表演。大家都還有印象吧?

實話說,訓練chatGPT閱讀特定領域的文獻、專利,從而提高生產力,是非常好的主意!深勢科技不就這麼做了嗎?很贊。

但是,一些公司忙不迭地說自己開發出類似於這樣的GPT工具,可以和它對話,設計抗體序列。真是大聰明,David Baker怎麼想不到呢???而且還當真去做溼實驗驗證。

誅心一點問,現在已經過了一年多,這些公司還在用對話框設計抗體嗎?如果客戶找上門,跟客戶說,你就放心吧,我們用對話框給你設計抗體?

爲什麼把寶貴的研發力量和資金投入只能做噱頭的項目?還要花更多資源來宣傳?長期看,這對公司的發展有利嗎?

所以,大家明白爲什麼有一些AI藥企有鉅額虧損吧?

上面我們說了,如果只把AI製藥侷限於結構預測、從頭設計,那麼就太狹隘了。理論上,在藥物研發的全流程中,只要能夠產出數據,就能夠應用AI或者機器學習吧,去分析和預測。

大家看這篇發表在2024年上半年Science正刊上的research article,它的標題:illusory generalizability —— 虛幻的泛化性能,對AI製藥而言,這太糟糕了。

簡單地說,作者發現,不是針對甲種疾病的臨牀試驗數據訓練的機器學習模型難以用於乙種疾病的臨牀試驗數據,而是,用甲種疾病的A項臨牀試驗數據所訓練的模型,甚至難以用於甲種疾病的B項臨牀試驗數據。

這還怎麼泛化?

反駁者或許會說,這項研究是針對“精神分裂症”來說的,這是一種複雜成因的神經類疾病,對單成因的疾病,或許機器學習模型就能泛化呢?

對,說得對。這項研究的結論本身不能泛化到其它疾病 —— 可是,這項研究的結論不就是不能泛化嗎?

有點繞啊,也就是說,“不能泛化”這一結論可以泛化。

劉慈欣在《鄉村教師》中說,宇宙的最可理解之處在於它可以理解。或許,臨牀試驗數據的機器學習模型的可泛化之處在於它不可泛化。

我們不妨把話說得明白一些,事實上,訓練泛化模型的原因不正是訓練不了特異模型嗎?

因爲訓練特異模型需要淵博的領域內知識和對這些知識的深刻理解,而絕大部分AI製藥的從業者既不懂病也不懂藥,只懂一點AI,那不就只能訓練泛化模型嗎?

下面談專家團隊。

專家團隊是非常昂貴而稀缺的。

過去或許會讓專家團隊研發泛化模型,並由多個業務團隊使用泛化模型去接多個商單。

但是,如果泛化模型不管用,怎麼辦?專家團隊研發特異模型,而後專家團隊化身業務團隊,自己去接商單?

當然這樣不是不行。或許可以通過提高商單的單價來抵消接單數量減少。不過,這樣的模式適合AI + CRO嗎?

並且,專家團隊招不招得到?招到後養不養得起?

再一個問題是,專家CEO。

如果創業者本人是AI製藥公司最大的專家,其擔任CEO對公司而言是好是壞?

這等於說公司最具備科研能力的人去做管理,我們不討論其能不能做好管理,我們只問:這個公司的科研和這位專家CEO有什麼關係?

那麼這時,還能以這位專家發表過多少頂刊等等爲宣傳點嗎?

首席科學家不能只是頭銜,常常在創業之初最難的研發問題是首席科學家親自攻關的。別人我不知道,Jumper至今不說看文獻,甚至依然寫代碼。這固然可能是他的興趣愛好,但是首席科學家不能脫離一線研發。

我們現在說一個很尖銳的問題。

請大家思考AF3的研發成本。

根據AF3的論文,其模型訓練用了256張A100顯卡,一次完整訓練耗時約20天 —— 這些都是論文中列舉的。那麼,我們可以輕易估算一次訓練的雲資源費約爲30萬美元。考慮5次完整訓練,若干次中途停止,按10次訓練算,則訓練費用爲300萬美元。

人力方面,AF3論文共48位作者,除去創始人哈薩比斯,還有47人,按人均50萬美元每年的工資計算,3年研發,共約7500萬美元。請注意,50萬很可能是低估。

好了,現在AF3的研發成本是300 + 7500 = 7800萬美元,約5.7億人民幣。即使翻一倍,也就是11.4億元。

請問:

1. 中國的頭部AI藥企是花不起這個錢嗎?如果花得起而不花,能否說明其領導團隊缺乏志向或膽量?

2. 如果花得起並且花了,但是依然研發不出來,能否說明其研發團隊的科研水平欠佳?

3. 既然其研發團隊的科研水平差,而其公司又有幾億、十幾億、幾十億融資,有這麼多錢還僱不到水平高的人嗎?能否說明其人力團隊的招聘水平低?

以上三點,總要至少選一個吧?

下面,我們說長期主義。

右側是AlphaFold的時間線,從2017年9月底Jumper加入DeepMind,2018年的AF1,2020年的AF2,2021年的AF-multimer和AFDB,2023年的AlphaMissense,到2024年的AF3。

從2017年開始研發AF1到2024年1月與禮來、諾華達成合作,獲得總首付款8250萬美元,超過6年。這是DeepMind的長期主義。

左側是Baker Lab的長期主義,他們就更久了,從03年左右就開始做蛋白質從頭設計。

這一面PPT是雞湯。

標題 the great fools 是一個經濟學術語,指的是買長賣短的人。這種人極度自信,自信到自負,他們認爲自己能在別人失敗地方成功,只要他們秉持長期主義、買長賣短。所有偉大的事業都由這種人造就。

製藥需要長期主義,不管你用不用AI。

中國有哪些AI製藥公司?

我們知道有許多初創公司號稱自己是AI + 什麼什麼,但實際上,只有什麼什麼,沒有AI —— AI只是引流的hashtag。當然,反過來也是有的,只有AI,沒有什麼什麼。

波士頓諮詢集團,BCG,在2023年出版了一份AI製藥的全球行業發展報告,列舉了228家AI-first biotech,包含了多家中國公司。

BCG在今年4月底又發表了一篇論文,討論AI製藥的成功與失敗,列舉了114家AI-native biotech,其中39家有臨牀試驗管線。

報告和論文的作者相同。

從228到114,作者使用了3個條件進行篩選:(1)公司在己方官網上強調AI的中心作用,(2)公司在內部管線或外部合作管線中使用AI,(3)公司在管線中用AI去發現新靶點、小分子、大分子等藥物。

也就是說:(1)自己說自己是AI製藥,(2)不光說,真用AI,(3)不光用AI,真製藥。

對吧,不能說自己是AI製藥,結果去做AI + 化妝品吧?我覺得這個篩選標準定得很合理。

那麼,這兩份表單涉及了哪些中國公司呢?

228家AI-first biotech中有17家,114家AI-native biotech中有5家,它們是標紅的阿爾脈、百圖、英矽、達冕、尋百會。

剩下的天演、康邁迪森、星藥、華深、劑泰、燧坤、天鶩、新合、水木、望石、騰邁、晶泰不算 —— 這些公司要麼沒有AI,要麼沒有製藥。

居然某某公司也不是嗎?

打星號的英矽、劑泰、尋百會有臨牀管線。

所以我上面說,AI製藥有時候只是引流的hashtag。

如果大家有疑問,不同意,建議寫郵件給BCG的這幾位研究員 —— 我就給他們寫過郵件。他們幾個人分別是劍橋和牛津的生物學博士,跟他們更新貴公司的信息,我想在下一版行研報告或下一篇論文中,作者會在覈實後修改的。

這一面,我們岔開說一個話題。科研實力。

頂級的藥企都有頂級的科研實力。這周,6月下旬,Nature出版集團剛剛更新2023年的Nature Index。在生命科學領域,全球所有的企業中排名前十的有8家藥企,羅氏第一、諾華第二、阿斯利康第三,再生元、安進、輝瑞、強生、葛蘭素史克等等。

只有2家非藥企位列Top10:排名第五的字母表,也就是谷歌,他們有DeepMind和Isomorphic Labs嘛,以及排名第八的華大,這是唯一一家中國企業,也是唯一一家亞洲企業、亞太企業,把日本、韓國、澳大利亞、以色列等都算上。

如果只統計以第一作者單位或者通訊作者單位發表在CNNS正刊或子刊的論文,華大在2023年共發表了33篇,22年37篇,21年8篇,21年21篇。

我們來看看中國的AI製藥公司。

爲了這次報告,我調研了14家公司的情況,分別是晶泰、英矽、百圖、星藥、望石、華深、宇道,以及晶泰投資的7家公司:劑泰、希格、萊芒、默達、賽德康、科邁、新生泰。

其中宇道2013年成立,時間最早。英矽2014年成立,晶泰2015年,望石2018年,星藥2019年,百圖2020年,華深2021年。

晶泰投資的公司則是:劑泰、希格2020年,萊芒、默達2021年,賽德康、科邁、新生泰2022年。

我有統一的統計的標準:
(1)不包括預印本,必須正式見刊;
(2)不包括會議poster或abstract,必須全文;
(3)必須在affiliation的任意位置中出現公司名,在current address、致謝、conflict of interest等處出現不計入;

(4)截止時間是2024.6.15。

並且,我以谷歌學術搜索結果爲主,各家公司的官方網站的發表列表爲輔,逐篇搜索覈實。

比如,英矽在官網上列了超過200篇論文,但是2014年某個時間點更早的論文都是英矽成立之前,創始人Alex等發表的,不計入。

又比如,一些公司把別人發表的,用了他們開發的工具的論文也放在了官網的發表列表中,也不計入。這要也算,DeepMind僅AF2就有20000多篇。

再比如,一些公司把創始人剛發表的論文放到官網上,但是論文的作者單位僅有學校,而沒有公司,也不計入。這要也算,David Baker參與創立的十幾家公司都能說自己發表幾百篇論文了。—— 這些公司首先自己就得打起來,因爲關乎自己的論文未必願意給其它公司分享。涉及IP法律,即便是現任員工剛發表的論文,如果作者單位沒有公司只有學校,公司也需要得到學校的授權才能使用相關IP。

2021年成立的萊芒、默達和2022年賽德康、科邁、新生泰至今都沒有論文,情有可原,才成立2、3年。2020年成立的劑泰至今1篇論文,希格有4篇。

2021年成立的華深在2022年就有工作正式見刊,2022年有PNAS。

2020年成立的百圖有高欣、宋樂兩位老師加持,論文比較多,有Nat. Methods、Nat. Machine Intel.、Nature、Nat. Comm.、Nat. Cell Biol.。

2019年成立的星藥有Nat. Machine Intel.、Nat. Comm.。

2018年成立的望石有Nat. Comm.、Cell。

我想最受矚目的是晶泰和英矽。

英矽,從2014年成立,2015年開始,每年都有20左右篇論文,很穩定,大約3/4是生化、神經、藥化論文,1/4是AI或平臺論文。配置堪稱合理。

晶泰,2015年成立,在2020年達到年發表10篇論文的頂峯,2021年9篇,2022年只有4篇,2023年2篇。根據晶泰的IPO申請書,其在2020、2021年不僅連獲鉅額融資,而且研發投入從每年2億增加到近5億。研發投入大幅增加的情況下,論文產出大幅下降,發生了什麼???

上一頁我們說頂級藥企有頂級研發實力。公司內部數據、專利、論文、頂刊論文應該是一個正向金字塔,很難說某家公司論文很少但是內部數據很多,或者論文很多但是內部數據反而很少。

再者,一個外部觀察員,在一家創新型公司還沒有盈利的時候,不看論文和專利又看什麼呢?

當然,我這裏的統計是比較粗的。因爲可能有朋友會反駁,有時候一篇頂刊論文抵得上10篇普通論文。說得對!加和影響因子可能比加和論文數更好。不過,我也粗略估算過,那樣可能並不有助於改善這裏一些論文較少的公司的統計結果。因爲,還是那句話,正向金字塔,概率上,論文總數多,頂刊論文才會多。

有些事情是很經不住比較的。如果以這一頁AI藥企的論文統計標準,華大在2023年發表了382篇。而且,大家清楚5億人民幣是什麼概念嗎,2019年的嫦娥四號只花了5億。

我們最後來討論一些泛泛的東西:“入關”和“辯經”。

我們知道,入關後自有大儒爲我辯經,沒有入關才需要辯來辯去。

首先,AI製藥 + 自動化?

這張圖是深圳市人才研修院人才咖啡廳裏拜訪的樣機,雙臂拉花咖啡機。它有幾個特點:AI視覺機器學習、軌跡復現拉花、全自動高溫清洗。

這年頭沒有AI都不好意思出來打招呼。

現在我的問題是,AI + 自動化咖啡機,ToC 還是 ToB?

ToC,個體戶,多大門面、銷售量多大的個體咖啡店才需要這樣一臺咖啡機?每年要賣多少臺,製造方纔能實現盈利?

ToB,大規模連鎖店,最近暴雷的Manner壓榨員工到極致,都不肯用這種機器,那就是大規模無人店咯?別誤會啊,深圳真有無人咖啡店。可是,如果大規模無人咖啡店是好生意,爲什麼製造方不自己做呢?再成立一家子公司就是了?

誒,我是在說咖啡嗎,還是製藥?

我個人比較困惑,一直想不通,希望各位來教我,AI製藥 + 創投是個怎麼回事。

首先,假設深創投覺得自己下場做AI製藥,不成立新公司,就開一個辦公室,招一組人,董辦直屬吧,請問,這時候我們是將深創投成爲“做投資的AI製藥公司”,還是“做AI製藥的投資公司”?得看主營業務,是不是?

第二,如果AI製藥公司甲投資了AI製藥公司乙,請問,甲能否允許乙投資AI製藥公司丙?

必須允許。因爲和尚摸得,我也摸得。而且,丙還能投資丁,丁還能投資戊己庚辛,回過來戊己庚辛還能投資甲 —— 如果甲能上市的話,買甲的股票的就是了。共軛父子,不是,共軛股東嘛。

轉一圈錢又回來了,變相回購了屬於是,而且對外還提振了市場信心。

第三,如果AI製藥公司甲有A團隊做業務α,現在A要攜α出來單幹,創業公司乙,甲還做α。甲投資乙。

請問:
(1)如果甲的 α 能力> 乙的 α 能力,是否說明甲的投資能力弱?否則爲什麼要去投資一家比自己的研發部門還弱的公司?

(2)如果甲的 α 能力 <= 乙的 α 能力,甲欠缺研發能力是沒跑了,能否說明甲的人力能力弱,無法留存優秀員工?

總要選一個吧?

最後,既然都投資了,爲什麼不買房?不是更穩妥嗎?

根本上,把融來的錢去風投,而不是留給自家研發部門,其潛臺詞難道不是寧願相信別人的研發也不相信自己嗎?

最後,AI + CRO。

美國製裁了藥明,美國限制了中國的AI行業,請問,美國有沒有可能,制裁中國的AI + CRO 企業或者整個行業?有沒有可能?有沒有風險?需不需要考慮?

不過,制裁又怎麼樣?這件事情如果真對,那就做啊,MD,制裁李耳,李耳就不做了嗎?制裁是最好的內宣和外宣。

本文完。

2024.6.29於深圳

後記。
AI製藥行業的健康發展需要同事、同仁、同行、同志們的共同努力。
少一些虛頭巴腦,多一些長期主義。
AI只是一個工具,別誇大它,別貶低它,用它,用好它。
AI製藥的未來可期亦可欺。
AI製藥的未來可欺亦可期。


推薦閱讀
  • 二傳 | 波士頓諮詢:AI製藥迄今有多成功?

  • 波士頓諮詢:哪些公司算AI製藥?

  • 我認爲目前AI製藥的邏輯可能不通

  • 再議AI製藥的困境:虛幻的通用臨牀模型

  • AI智藥對未來生醫行業提出什麼要求?

  • AlphaFold3看重哪些結構生物學工作?

  • 奠基人、全球第一、新紀元、新範式,我受不了這些詞

  • AlphaFold3詳解之輸入嵌入

  • 公開信、施壓、質疑、辯論與AlphaFold3的開源