湯森路透為何連續25年預測諾獎,還那麼準?

一年一度的諾貝爾獎最近開始逐項揭曉,又到了全世界人民(假裝)關心文學家和科學家們工作成果的時間了!

由於科學一般會被歸為嚴肅而艱深的邊緣話題,所以即使每個獎項的獎金已經高達 800 萬克朗(約 113 萬美元),也幾乎沒有人像看足球比賽那樣去押寶哪個科學家會最終得獎——列出 5 個頂級足球俱樂部,偽球迷都毫無壓力;列出 5 個世界級科學家(還是沒拿過獎的),理科生們都不一定能行。

但經營數據及信息服務的大公司湯森路透(Thomson Reuters)在過去的 25 年裡都格外熱衷於對這一聽起來不可能預測的獎項進行預測,甚至還針對預測結果設立了自己的“湯森路透引文桂冠獎”(Citation Laureates),自 2002 年起,共有 36 位“引文桂冠獎”得主最終贏得諾貝爾獎。在科學界,通常獲得“引文桂冠獎”的得主,只需等待幾年時間,幾乎就能成為諾貝爾獎得主,中獎率相當驚人了。比如今年諾貝爾物理學獎得主中村修二就是 2002 年“引文桂冠獎”的得主。


湯森路透究竟為什麼以及如何預測諾獎得主?我們總結了以下 4 點,或許可以幫助你答疑解惑。

預測諾獎是為了推廣服務

每年萬眾矚目的諾貝爾獎頒獎對於湯森路透來說是一個絕佳的營銷盛事。這家公司掌握著全世界最大的科研數據庫之一 Web of Science ,是湯森路透旗下的業務之一,隸屬於知識產權與科學部門,2013 年為湯森路透貢獻 9.82 億美元的收入。這一數據庫可以調用 1898 年至今的近 260 萬份論文數據,而且這些論文及其相關數據都已經實現了電子化,可以查詢單篇論文引用記錄、還可以預測科研領域未來發展,數據庫中最豐富的是生理醫學、物理、化學與經濟這四大領域,和諾貝爾獎項分類有著天然契合之處。坐擁這樣一個數據庫,不利用諾貝額獎的契機做點啥,簡直是暴殄天物。


當然除了科研領域之外,湯森路透最有名的還是它的金融與信息業務。2013 年,湯森路透的總營業收入達到了 125 億美元,其中 66 億美元來自其金融與風險部門。另外,湯森路透旗下還擁有路透通訊社,成立於 1851 年,是享譽全球的世界第二大通訊社,在全球 94 個國家的超過 200 個城市設有辦公室。

科學的預測方法

有了數據庫只是第一步,總的來說,湯森路透設計的一整套預測方法十分科學精準,因而保證了中獎率居高不下,具體包括定量、定性和篩選三個環節。
在定量環節中,要在不同領域中統計出科學家 30 年內的總被引次數和高被引論文數;另外統計領域內的單篇平均被引次數、單人平均被引次數,作者是否擁有多篇高被引論文等多個指標。
在定性環節中,需要評估該科學家的研究內容,發掘被引頻次背後的特徵;尋找熱門研究領域及領域內具有開拓意義或理論前瞻性的科學家;確定研究成果與其他候選人相比是否具有優勢等。

在篩選環節中,需要根據前述分析結果,識別重大研究成果的主要貢獻者,並根據其他因素將每一領域的候選人名單精簡至 3 人。

這一整套流程下來,基本可以確保篩選出來的獲獎者是該領域發表最具影響力、突破性觀點的人物,因而幾乎也就是諾獎評委會鎖定的獲獎人選。

將主觀因素納入考量

在預測這件事上,除了定量分析,還需要考慮到一些非研究因素。科學家的學術頭銜就是一個重點,例如是否為國家科學院院士,是否為外國科學院院士,是否在重要學術團體中任職等。此外,在國內和國際學術會議中發表過主題演講,在大學或重要實驗室中擔任高級職位,以及在高影響力國際期刊中擔任編委,都能為科學家的諾獎之路加分。

此外,諾貝爾獎有一些不成文的慣例,例如三年內不能在同一細分領域內頒出兩次諾獎。根據這些規則,在預測時就可以針對過去幾年獲獎的相關領域進行調整了。

堅持 25 年的積累

說來說去,按照上述預測方法,任何一家科研機構通過調用數據庫,理論上都可以預測諾獎。但在過去 25 年裡,只有湯森路透一家每年一絲不苟地堅持做著這項工作。不過湯森路透自己也表示,不應該將每年的“引文桂冠獎”名單與當年的諾貝爾獎直接掛鉤,而是將其看作是“引文桂冠獎”長名單中的一部分。

意思是說,其實還有很多未奪得諾貝爾獎的科學家也在各自的領域做出了傑出貢獻,他們同樣不應該被忽視。