李飛飛:“成為科學家是一種我負擔不起的奢望”


“AI教母”李飛飛如何一步步點亮她的人生北極星?

文章思矩MindMatrix   

觀察AI時代重要的人、公司與事件   

打造專業有用的AI科普《AI入行第一課》  

“成爲科學家是一種奢望,我負擔不起”,二十年前即將從加州理工學院研究生畢業的李飛飛,在面臨繼續成爲一名科學家或是接受世界知名的管理諮詢公司麥肯錫工作邀約這兩個選擇之間徘徊。母親因爲心臟病問題加重再次病危,家裏開了七年的乾洗店——那是全家經濟來源的救命稻草也無法再經營下去。
她覺得自己特別自私,“畢生的好奇心把我帶進了一個競爭激烈、薪酬低廉、無法保障長久職業生涯的領域,而我的父母現在需要我無法提供的支持(金錢)。我每天都在追求自己的夢想,這讓我覺得自私至極,甚至過於魯莽。”成爲一名科學家是她一直以來的夢想,而在這一人生重要十字路口選擇面前,殘酷的現實、匱乏的家境、未來的迷茫、是否要因此放棄夢想的痛苦纏繞着這位二十出頭的年輕人。
二十年後,科學家李飛飛成爲了人工智能這場世界級科技革命中心的真正明星,成爲被人們譽爲“AI教母”的頂級計算機視覺科學家。2023年她入選《時代》“百大AI影響力人物”,2020-2021年連續入選美國國家工程院院士、美國國家醫學院院士、美國藝術與科學院院士等三院院士。2019年擔任斯坦福大學以人爲本人工智能研究院(HAI)聯合院長,2013年-2018年期間擔任斯坦福大學人工智能實驗室第七任主任,也是首位女性主任。
而早在2006-2009年期間,李飛飛便帶領團隊初步完成了世界上最大的圖像識別數據庫ImageNet項目,正是在她發起的第三屆ImageNet大型視覺識別挑戰賽上,傑夫辛頓團隊的AlexNet神經網絡算法利用ImageNet死而復生、栩栩如生,一舉開啓了人工智能歷史上重要的新一輪深度學習革命。
深度學習的發展需要算法、算力、數據三駕馬車來拉動。從2006年到2012年,算力層面傑夫辛頓團隊的AlexNet架構的出現證明了卷積神經網絡的有效性,算力層面英偉達GPU的廣泛應用爲深度學習的訓練和推理提供了強大的計算能力,而數據層面由李飛飛主導的ImageNet數據集開始着手搭建並順利完成。這三件事的發生吹散了深度學習上空的三朵烏雲,並在2012年由李飛飛發起的ImageNet挑戰賽上神奇交匯,徹底改寫了人工智能產業乃至整個人類社會的命運。 
但在2006年,無論是傑夫·辛頓、李飛飛、黃仁勳,亦或是其他推動深度學習發展的人,顯然都無法預料人工智能在此後的繁榮,更不用說他們所扮演的角色了。
近期,由李飛飛所寫的《我看見的世界:李飛飛自傳》在中國出版發行,這既是一部世界頂級AI科學家從困頓艱辛的少年時代、到一步步追尋心中對於科學熱愛、不斷突破成長的個人成長曆史,也是一部人工智能從一篇大霧迷茫中逐步發展、從少數人的堅持變成如今引領時代浪潮的跌宕起伏的產業發展歷史。
“將我的一生奉獻給這個曾經默默無聞的領域的決定讓我走得比我想象的更遠。由於歷史的偶然,我屬於見證它從學術奧祕轉變爲頭條新聞的那一代人。”而牽引她在人生無數個十字路口依然堅定選擇這條路的,正是是她心中的那顆“北極星”,那是她的熱愛、她的追求、她樂此不疲的方向和意義。
生命應當過得繁榮,李飛飛是這句話最好的詮釋。李飛飛在書中的描述既有理性與邏輯,也有作爲女性科學家的細膩和觸動,全書共有12個章節,講述了她從少年作爲底層移民舉家遷往美國,到在普林斯頓邊開乾洗店邊拮据地度過與世隔絕的大學生涯,再到一次次因爲家庭的拮据、母親的病痛、學界的負反饋而動搖是否要放棄心中對夢想的堅持最終守得雲開見月明、追求人生北極星的旅程。我拆解了《我看見的世界:李飛飛自傳》一書,讀完這篇文章,跟隨李飛飛的視角,你將看到:
1. 李飛飛生活在什麼樣的家庭環境中?
2. 李飛飛的少年和大學時期是怎麼度過的?
3. 由李飛飛發起的,世界上最大的數據集ImageNet背後有哪些波折的故事?
4. 2012年開始的那場影響深遠的深度學習革命是如何拉開序幕的?
5. 爲什麼李飛飛開始專注“以人爲本的人工智能”?
波折少年時代,“你和我一樣都不屬於這裏”
李飛飛出生於北京,成長於成都,那是七八十年代的中國,普遍的文化觀念裏還盛行着重男輕女的觀點。小學的最後一年即將結束,老師突然提出了一個奇怪的要求:女生先回家,男生在座位上多坐幾分鐘。她徘徊在教室門口,偷偷聽到了老師的話,那些話讓她終生難忘:
“我讓女同學先走,是因爲現在我要告訴你們:你們整體表現是不行的。男孩天生就比女孩聰明,你們平均成績竟然比女生還低,今天我對你們非常失望...但是你們也不要自暴自棄,等到了十幾歲,你就會發現,周圍的女生自然就變笨了。她們後勁不足,成績會不斷下降...落在女生後面是不可接受的,大家明白了嗎?”
在李飛飛的家庭裏,不管是父母還是外祖父母,都堅持着一個培養孩子的價值觀:“我首先是一個獨立的個體,其次纔是個女孩。我當然要努力學習,充分發揮自己的潛力,但這麼做並不是爲了取悅任何人,或者得到任何東西。我的努力只是爲了自己。”
母親頭腦敏銳,她的祖母是晚清時期第一批上大學的女性,而母親從小自驅力十足、希望探索世界的每個角落,本可前途無限光明卻因爲特殊的政治身份而被緩慢而無聲地吞噬了生命力、在現實生活中產生了許多挫敗感,因而自幼沉浸書海之中、渴望逃離現實世界。父親則像個迷失在成年人身份中的孩子,聰明、愛玩、在小事上離經叛道、有時做事不經思考,卻也因此爲李飛飛樹立了一個最純粹的好奇心榜樣。
因此在中學時,當再一次遇到老師對女孩的預設和偏見、甚至母親因爲她看了太多課外書而被喊到學校談話時,母親低下頭輕聲說“這是飛飛想要的嗎?這是我對她的期望嗎”。母親嘆了口氣帶着年少的李飛飛走出了教室,“可能我把你教得太好了,飛飛”,她無奈地說,“你和我一樣,都不屬於這裏”。
1992年,15歲的李飛飛跟隨父母居家遷往國外,定居在新澤西州一個叫做帕西帕尼的小鎮。作爲底層移民,她在貧困中艱難度過了青春期,整個高中階段,她不僅在中餐廳打工,還會每週給人做家務,還給人遛過狗。爲了勉強維持生計,一家人都承受着巨大的壓力和疲倦。

移民經歷讓他們陷入貧乏和卑微勞動的循環中,甚至在學校裏她親眼目睹了自己的朋友因爲在圖書館和一個美國學生髮生了輕微的肢體觸碰,而立刻被這些學生拖到走廊地板上、一邊罵一邊踢、直至血流滿地、重傷入院,從積極樂觀的人變成了屈辱、灰暗與痛苦滿面。

這些至暗時刻讓她更加努力埋頭學習,並幸運地遇見了對她亦師亦友的薩貝拉老師和他們一家,讓他們終於逐漸融入社區中。1995年她以全額獎學金被普林斯頓大學物理學專業錄取。

在《我看見的世界:李飛飛自傳》中裏,她寫道“我在中國的中產階級度過了田園詩般的童年,在美國的一貧如洗中度過了青春期。我生活在移民羣體中,他們聰明又勤奮,但從來沒有沿着經濟財富的臺階向上攀登過。我也曾經無助地目睹一個同學僅僅以爲一次不經意的觸碰而被打得遍體鱗傷——這一幕我至今無法忘懷...這些都是至暗時刻,但它們讓我更加珍視在一路上發現的人性的光輝。無論以何種形式,我都要感謝我在人生最低迷、最迷茫的日子裏遇到的那些人。我越來越有一種久違的感覺:我心懷感恩。”

追光大學時代,“我只需要找到那顆北極星”
目光轉向李飛飛的大學時代,這是一段年輕人逐漸找到自己的熱愛、逐漸清晰人生北極星的旅程。那是1996年大二的夏天,李飛飛得到了前往加州大學伯克利分校的一個實驗項目做助理的機會,這個實驗涉及神經科學、生物學以及視覺工作原理,而這短暫的一個暑假的經歷改變了她之後的種種人生選擇。那是她第一次接觸真正的科學,儘管有種繁重的任務和巨大的壓力,但是每天天黑時分走出實驗室的時候,她都感到全身心的滿足。
她在書裏寫道“在實驗室裏,我不再感覺自己是個移民。我沒有被孤立的感覺。我甚至不覺得自己貧窮。我只覺得自己是個科學家。在實驗室裏,時間失去了意義,我在工作中忘掉了自我。我突然確信我找到了自己的位置...我把自己的一部分留在了伯克利實驗室的黑暗中,從未離去。
她無比堅定地發覺自己熱愛科學,無比堅定地意識到自己希望成爲一名科學家。父母對於機會的無限追求是他們的人生北極星,這個願景讓他們即使在貧困生活中依舊煥發出無與倫比的活力,是他們生而爲人的定義。而對於年輕的李飛飛來說,她也開始了在天空中追求自己的北極星之旅,那是屬於一個科學家想要窮盡一切想要追逐的座標,無論是一個問題、一個假設或是一個賭注。“我只需要找到那顆北極星”。
在選擇讀研方向時,她開始決定同時研究神經科學與計算機科學,並選擇了加州理工學院繼續攻讀碩士和博士學位。正是在這期間,她深入接觸並研究計算機視覺,並於2004年完成了當時有史以來爲機器學習配置的最大規模集合“Caltech101”,裏面有超過9000個圖像、分佈在100個類別中。雖然這件事非常費力,但是對於當時的她來說,這恰恰是她想要的,“我的北極星在地平線上閃爍,比以往任何時候都更加明亮。而這也爲李飛飛後來發起享譽世界的ImageNet數據集項目奠定了重要基礎。

貧窮與夢想,人生重要十字路口的兩次選擇
可是與此同時,在故事的另一面,整個大學甚至研究生生涯,她一直在兩個世界中掙扎。一邊是岌岌可危的家庭財務情況、母親時常加重甚至緊急住院的病情,一邊是自己越發清晰和生長的對於科學研究的熱情、對於成爲一名科學家的夢想。
在大一那年期末,多年糾纏母親的疾病再次惡化,甚至已經危及生命,手術後醫生要求母親不可以再參與全職工作,但是爲了維持家庭的生活,術後兩週她就繼續開始了全職工作。“我們作爲一個家庭的前景仍然是一個懸而未決的問題,這意味着她的工作仍然是她別無選擇,只能每天承擔的風險”。
所以在後來本科畢業和研究生畢業時,在那兩次年少時重要的人生十字路口,她曾經面臨兩次現實與理想之間的選擇。
1999年李飛飛在普林斯頓大學的學習生涯即將結束,她面臨着繼續追求夢想攻讀研究生,還是加入華爾街獲得高薪工作的選擇。那時她收到了包括高盛、美林等華爾街巨頭拋出的橄欖枝,“他們承諾免除我們的債務,結束乾洗店的勞累,在母親的健康狀況日益惡化的情況下爲我的家庭提供保障。而對我的唯一要求是放棄科學”。
可是當她和母親提起這讓她糾結的選擇時,母親沒有多問,只是平淡地回答到,
“這是你想要的嗎?
“我的意思是...光是薪水就足夠改變我們的生活了,而且——”
“飛飛,這是你想要的嗎?”
“你知道我想要的是什麼,媽媽。我想成爲一名科學家。”
“那還有什麼好說的呢?”

第二次人生路口選擇發生在研究生即將畢業前夕,母親突然患上充血性心力衰竭,病情比想象中嚴重很多,而父母都沒有醫療保險,爲了治療母親,一家人不得不把已經經營了七年並且是救命稻草般經濟來源的乾洗店賣掉,可是即使如此,家裏的錢依然無法很好解決生存和母親的健康問題。
那時候她在書裏寫道“畢生的好奇心把我帶進來一個競爭激烈、薪酬低廉、無法保障長久職業生涯的領域,而我的父母現在需要我無法提供的支持。我每天都在追求自己的夢想,這讓我覺得自私至極,甚至過於魯莽。我的實驗室夥伴大多來自中產階級,有些甚至家境非常富裕。我越是反思與他們家庭之間的差異,就越難以否認這樣一個事實:成爲科學家是一種奢望,我負擔不起。
這一次命運再次爲她提供了另一個選擇,她得到了世界知名諮詢公司麥肯錫的工作邀約。這份工作可以幫助多年來瀕臨絕境的父母卸下長久揹負的重擔,但也意味着她需要放棄她的北極星、放棄她成爲科學家的夢想。可是當她回到家和母親談起這件事時,在母親的臉上她看到了曾經那熟悉的表情。
“我們真的要再次討論這個問題嗎?”我瞭解自己的女兒,她不是管理顧問,或者其他什麼職務,她是個科學家。”
“想想你的身體吧,媽媽!想想我們的開銷。搞學術能給我們帶來什麼呢?
“飛飛,你一直在說自己走的路很‘自私’,就好像你追求科學是在犧牲我們一樣”
“我怎麼能沒有這種感覺呢?我現在本來可以養活咱們全家,而且——”
“你沒明白我的意思,這從來就不是你一個人的路...這是我們共同的旅程。”“我再說最後一次:我們走到這一步,不是讓你現在放棄的。”


在這兩次重要的十字路口,她沒有放棄,走上了那條她想要的科學家之路。本科畢業後,2001年李飛飛開始進入加州理工學院攻讀碩士和博士,並在博士畢業後選擇繼續從事學術事業,成爲一名助理教授。也正是在那期間,她遇到了研究生的同學、未來攜手相伴的丈夫,她在書裏寫道“天哪,這傢伙真是個書呆子啊,我想。但他和我是同一類書呆子。”

ImageNet,一場長達六年的巨大賭注
目光來到2006年,李飛飛加入普林斯頓大學計算機系做助理教授,在那裏她開始啓動後來在人工智能領域舉世聞名的ImageNet數據集項目,而最開始這個項目的預計完成時間是整整十九年。
ImageNet項目是什麼?這是世界上最大的圖像識別數據庫,包含了分佈在2萬多個不同類別的1400萬張圖像,這些圖像是從總共近10億個候選圖像中挑選出來,並由一個由更多人組成的全球團隊進行手工標註。來自167個國家的超過48,000名貢獻者爲這個項目貢獻了努力。
深度學習的發展需要算法、算力、數據三駕馬車來拉動,算法決定了計算機用什麼方式識別事物;但算法又需要足夠大的算力來驅動;同時,算法的提升又需要大規模高質量的數據;三者相輔相成,缺一不可。李飛飛意識到,瓶頸可能不是算法本身的精度,而在於缺乏高質量、大規模的數據集,書裏寫道“也許存在這樣的可能性:讓算法能夠識別出任何東西的祕訣,就在於打造一個無所不包的數據訓練集。”而ImageNet項目正是李飛飛基於這一判斷應運而生。
可是這放在當時是一個無比龐大規模的項目,光是數據標註環節,就需要對數十億張候選圖像進行人工的數據標註,幾乎沒有同事相信她會做成。項目既缺乏參與者、也缺乏預算資金,花了很長時間才終於招到唯一一位博士生加入一起工作,而這個兩人團隊在評估完項目進度後,得到的結論是“完成這個項目差不多要19年”。
甚至是一位原本計劃能幫自己的終生職位寫推薦信的教授前輩也加入到了反對者的行列,“坦率地說,我覺得你們在這個想法上投入得過多了。科學的訣竅是跟隨着你的領域一起成長,不要太超前。”
在《我看見的世界:李飛飛自傳》這本書裏,李飛飛寫道“我幾乎可以看到我的北極星在逐漸黯淡下來,我的道路又陷入了黑暗之中”。這是一場職業生涯的巨大的賭注,所需要承擔的風險遠比自己意識到的要大,而且回頭已經爲時太晚。
故事的轉機發生在項目第二年,依託於互聯網技術的發展,依靠亞馬遜新提供的衆包平臺,李飛飛團隊得以通過招募來自全球168個國家、超過4萬多名的衆包團隊解決了瓶頸問題。2009年6月,歷時三年ImageNet數據集初始版本誕生。也是在這期間,她接受了斯坦福大學的工作邀請,前往斯坦福開啓了更宏大的人工智能領域探索之路。
可是故事並未如想象中那般順風順水,ImageNet首次亮相的時候反響平平,爲了提高知名度,他們決定舉辦ImageNet挑戰賽。結果前兩年辦的都也沒有太多水花,甚至參賽人數逐漸下降。甚至連李飛飛自己都陷入了挫敗和自我懷疑之中——“如果 ImageNet 是一個賭注,那麼是時候開始懷疑我們是否只是輸了”。
三駕馬車神奇交匯,歷史剛剛被創造出來

轉機出現在2012年,傑夫·辛頓(Geoffrey Hinton)和他的兩名學生——亞歷克斯·克里哲夫斯基(Alex Krizhevsky)和伊利亞·薩特斯基弗(Ilya Sutskever),前OpenAI首席科學家),在ImageNet圖像識別挑戰賽上拿了冠軍,並且發表論文介紹了冠軍算法AlexNet。AlexNet是一個突破性的卷積神經網絡,利用ImageNet數據集死而復生、栩栩如生,一舉開啓了人工智能歷史上重要的新一輪深度學習革命,推動了未來計算機視覺、語音識別、自然語言處理等領域的快速發展。

如果你曾讀過另一本人工智能領域的書籍《深度學習革命》,書籍開頭描寫的那段歷史便與本次事件息息相關。2012年12月,百度、谷歌、微軟和DeepMind等科技巨頭對辛頓及其兩名學生進行競拍,最終谷歌以4400萬美元的價格獲勝,成功收購了DNNresearch。

DNNresearch正是辛頓與其學生共同創立的一家專注於深度神經網絡研究的公司。谷歌此次收購標誌着深度學習領域的一個重要轉折點,谷歌也正是通過此次收購不僅獲得了辛頓團隊在深度學習方面的專業知識和技術,並進一步鞏固了其在人工智能領域的領先地位。

我們在前文中曾提到,人工智能的發展離不開三駕馬車——算法、算力、數據的同時拉動。 而正是在2006-2012年期間,算法層面,辛頓和他的學生們在Science上發表了論文第一次提出了有效解決梯度消失問題的解決方案,讓算法層面邁出了一大步。數據層面,李飛飛開始着手搭建ImageNet這一世界上最大的圖像識別數據集。算力層面,英偉達發佈Tesla架構的新款GPU,開發者利用GPU來訓練深度神經網絡的難度大幅度降低,望而生畏算力門檻被砍掉了一大截。

這三件事的發生吹散了深度學習上空的三朵烏雲,並在2012年的ImageNet挑戰賽上交匯,徹底改寫了高科技產業乃至整個人類社會的命運。但在2006年,無論是傑夫·辛頓、李飛飛、黃仁勳,還是其他推動深度學習發展的人,顯然都無法預料人工智能在此後的繁榮,更不用說他們所扮演的角色了。

這不僅是人工智能歷史上並行發展最終神奇交匯的六年,也是李飛飛從30歲到36歲的學術生涯黃金十年。她用自己的整整黃金六年下賭注,那顆支撐她一步步前行的北極星曾經逐漸暗淡甚至陷入黑暗,而在2012年的那個下午,坐在飛機上,她寫道“這一次,從起飛到着陸,我一直靜靜地坐着,腦子裏只回蕩着一個念頭:歷史剛被創造出來,而世界上只有少數人知道。”

人工智能還能做哪些事來幫助別人?

2012年ImageNet挑戰賽揭開了深度學習時代的大幕,是人工智能產業發展的重要轉折點。而對於科學家李飛飛來說,這並不是旅途的終點,而是一個更宏偉的開始。李飛飛在書中寫道“對北極星的追求是科學家最顯著特徵的象徵:好奇心如此不安,以至於永遠排斥滿足感。夜空中的星星,遠方的海市蜃樓,一條沒有盡頭的路。我意識到,這就是人工智能對我的意義。”那麼,下一顆讓人癡迷和追求的北極星在哪裏?

2013年的夏天,母親再次病危,這二十多年來家庭生活的許多篇章都在急診室、重症監護室、手術室候診室和其他醫院空間中度過。在病房裏,母親問道“飛飛,你到底是做什麼的?”“飛飛,人工智能還能做什麼來幫助人類呢?”

母親的疾病和提問引發了她對於人工智能在醫療保健領域的關注,而當她越瞭解醫院,瞭解醫生、護理人員、病人,她逐步開始意識到“如果人工智能要幫助人們,我們的思考就必須從人們本身開始。”人工智能最偉大的勝利不僅是科學的,還是人文的。人的尊嚴、人的快樂、人的安全、人的幸福,那是下一顆北極星——以人爲本的人工智能。 

從2013年到2018年,她開始擔任斯坦福大學人工智能實驗室第七任主任,也是首位擔任這一職務的女性。2015至2016年,她發起了AI4ALL項目,旨在通過向高中階段的女孩、有色人種和其他弱勢羣體開放大學實驗室,促進STEM(科學、技術、工程和數學)的更大程度的包容性,該項目也獲得了梅琳達·蓋茨和黃仁勳的投資與支持。2019年李飛飛擔任斯坦福大學以人爲本人工智能研究院(HAI)聯合院長,致力於確保人工智能技術能夠符合人類的價值觀和標準。 

而與此同時,人工智能行業的發展也在過去十年經歷了重要的里程碑式發展跨越,從2012年開始的神經網絡的復興和突破、大規模數據集的推出和應用、算法和算力及硬件的持續提升和進步,再到2018年以GPT系列爲代表的大型語言模型的出現,展現了AI在自然語言處理領域的巨大潛力。人工智能取得快速的突破發展,開始滲透到醫療、金融、交通、教育等各個領域。 

時光流轉,2022年11月30日OpenAI正式發佈chatgpt,此開始大模型在全球範圍內掀起了有史以來規模最大的人工智能浪潮。2024年站在世界人工智能浪潮最頂尖位置的科學家李飛飛再次提出她的未來北極星——空間智能。十多年前,在她的實驗室誕生的ImageNet使數百萬張高質量照片的數據庫成爲可能,幫助訓練計算機視覺。而今天,她正在做類似的事情,訓練計算機和機器人如何在3D世界中行動。空間智能不僅允許機器與彼此互動,而且還能與人類,以及真實或虛擬的3D世界互動。隨着這個未來成形,它將對許多生命產生深遠的影響。 

在《我看見的世界》這本書的結尾,李飛飛寫道“每一種新的追求、每一個新的癡迷,都懸掛在黑暗的地平線上,閃爍着耀眼的光芒,向不懈追求的人們招手致意。這就是爲什麼我最大的快樂在於知道旅程永遠不會結束,我永遠不會停歇。總會有新的事物等着我去追逐探索。對於科學家而言,想象力就如同佈滿北極星的璀璨星空。” 

她全新的旅途纔剛剛開始,璀璨的北極星永遠點亮着那片星空。

-End-

李飛飛的故事依然在繼續,而新一代年輕人的故事也開始撰寫。本週日,由中信出版集團和知潛主辦、由思矩MindMatrix聯合主辦李飛飛《我看見的世界》讀書會將在北京線下舉行,我們邀請到了多位優秀的AI及科研創業者、AI大廠或初創公司從業者前來交流,一同探索AI時代的未來。如果感興趣,歡迎掃描下方海報二維碼報名~

最後,如果你對於入行AI感興趣,也歡迎你查閱這篇文章:《AI入行第一課》,請拿好通往AI時代的船票,期待未來與你在AI這艘船上相遇。