對話吳翰清:把全世界AI聯合起來,打敗OpenAI這個壟斷怪獸

前麵坐著吳翰清,這個中國互聯網技術圈裏多少有點傳奇色彩的“黑客”。
不是所有人都會成為某種互聯網都市傳說的主角,但他卻一個人占瞭好幾個,什麼單槍匹馬黑掉瞭阿裏的網絡,什麼在拉斯維加斯坐著大巴車一路走一路黑掉瞭路旁酒店的Wi-Fi,一個比一個令人驚異。有的他不停否認,有的是他自己隨口講齣來的。
現在他離開瞭成名的阿裏,不過物理距離不遠,他坐在自己在27層的落地窗轉角辦公室和我們聊天,辦公室門上寫著“總裁辦公室”,盡管這是個剛成立幾個月隻有十幾個人的公司,不遠處是阿裏雲去年搬離的原總部大樓,他左側的窗外是一片開闊地,各種近幾年建成的奇異造型的辦公樓和等待著變成辦公樓的農田都在腳下,等待著這個辦公室的主人隨時俯瞰他們。
對話開始沒多久,吳翰清進入瞭他的世界,這是一個叫做kOS的産品構想,和一個叫做半個宇宙的烏托邦。這個辦公室漸漸開始讓我感覺像是某種科幻小說中反抗邪惡統治的盟軍總部。那個對手就是OpenAI。
OpenAI要打造一個怪獸,我要做的是聯閤世界上的居民來一起對抗它。他說。

吳翰清
聽起來十分狂妄,但吳翰清已經開始這麼做瞭。這是一個大計劃。


孫悟空

去年ChatGPT的發布像一場大海嘯的開端,之後全世界都在一波又一波浪花裏濛眼狂奔,離開工作瞭很多年的阿裏後,吳翰清也在研究大模型並尋找創業的方嚮。但最終,與那些快速投入到模型層或應用層的創業者不同,他得齣瞭一個“相反”的結論:
他認為大模型的確是個強大的技術進步,但今天大部分人對它的用法卻都錯瞭。
大模型最驚艷之處在於它呈現齣來的、目前仍然是誰也解釋不清到底如何産生的推理能力,而過去一年工業界的AI熱潮基本圍繞著如何繼續加強這種能力和如何把這種能力以應用的形式直接落實到真實世界裏。但吳翰清認為這是工業界被學術界帶偏瞭。
“今天整個計算機的工業界被學術界給帶歪瞭。”他說。“學術界一直在追求讓神經網絡具備邏輯推理能力,首先這是一個非常值得追求的科學問題,但是它是一個到今天都沒有答案的問題,也就意味著今天在學界所有做所謂人工智能或者說人工神經網絡的人都是在猜測,都是在猜想,所以沒有誰能夠100%說我的道路一定是正確的,其中典型的代錶就是今天的大模型。今天所有在大模型上做工程投入的人和團隊實際上都是在嘗試去讓神經網絡具備邏輯推理能力,這是一個非常值得追求的科學問題,但它一定不是一個重要的應用問題,在今天一定不是。”
他把大語言模型的本質定義為:“速成幻覺智能”。
“它是速成的,因為它是用瞭大量的語料壓縮進去,所以它今天沒有辦法去增長它的知識,每次增長知識必須重新訓練,它沒有辦法通過一種自學習的模式來增長自己本身的知識,這是一個很嚴重的問題,人類不是這樣去學習的。”
也就是說,他認為靠大模型自己,幻覺問題永遠解決不瞭,就永遠沒法直接為産業所用。
吳翰清還用他自己的方式從技術上證實這個判斷:
“我們當時在想一定要解決一個彆人都解決不瞭的問題,然後纔能證明這個東西是有必要的。我找到瞭這個問題,其實非常簡單,簡單到一句話說清楚瞭,就叫做——《西遊記》裏麵孫悟空到底被提到瞭多少次?”他說。
“當你把這個問題簡單的作為輸入題給以惡搞AI係統,然後把《西遊記》給它,你希望它能夠自動迴答,但你會發現沒有一個能夠迴答,包括OpenAI,包括榖歌,這就很有意思瞭。為什麼這麼簡單的問題,你大模型不是天天吹牛嘛,那你迴答一下?迴答不瞭。”
迴答不瞭的原因是孫悟空在《西遊記》裏壓根就不叫孫悟空。
“《西遊記》裏麵的孫悟空叫做大聖,叫做行者,叫做老孫,叫做臭猢猻,他有一係列的彆名。另外還有所有的代詞,他的指稱,你我他。哪一個是指的孫悟空,沒有被計算過,所以當我問GPT的時候它就開始鬍說八道。OK,所以這是一個非常非常關鍵的問題,但是被所有人所忽視的問題。”
用一個精妙的小刀捅破巨大的罩幕,典型的黑客行事風格。“我用一個問題乾趴下瞭所有大模型,就是這麼簡單。”他說。
但不能光提齣問題難倒彆人,你得給齣解法。吳翰清思考後的解法也挺簡單——就是不要隻想著大模型瞭。
“從我們角度來看的時候,這個問題的答案就像擺在我麵前一樣這麼直白和顯而易見,就是《西遊記》裏麵孫悟空被提到多少次這個問題,對於傳統的程序員來說,它壓根不是一個問題。當你用data mining去做完之後,你基本上就是SQL查一下或者用Python去寫成代碼,它自然而然就齣來瞭。”他說。
“對於所有程序員來說,邏輯推理不是一個問題,1+1必然等於2。但是對於所有做神經網絡的人來說,如何讓神經網絡自動的生成1+1等於2這個答案是一個非常非常難的事情。”
至此吳翰清要做的事情也就呼之欲齣瞭,他要構造一個全新的係統,來統一這兩種技術和能力。
“這又變得非常簡單,我要統一神經網絡和高級編程語言。”他說。“或者更加抽象地說,我嘗試用同一個係統來統一掉連接主義和符號主義,讓它兼具神經網絡的泛化能力,同時又能夠保留高級編程語言的邏輯推理能力。”
在這個係統裏,大語言模型不是全知全能的神,它隻是吳翰清構建的世界裏的一個零件。


我做的就是一個計算機

這個“零件”就是CPU,一個新的計算體係裏的CPU。
今天世界上最聰明的人們似乎都立刻拜倒瞭在大模型的石榴裙下,並且大有拋棄一切舊有技術路綫全麵圍繞大模型重構一切的勢頭。但吳翰清設想的世界裏,大模型是CPU,隻是CPU,隻是一個更加“優雅”的、代錶未來的係統的一部分,甚至是一小部分。
在12月,吳翰清在他關注者眾多的公眾號上發布瞭一篇3萬字的長文。這篇創業宣言裏,吳翰清把這個係統的架構設計公開瞭齣來。

架構手繪草圖,更清晰的圖在下文。圖片來源:kmind
它包括輸入輸齣模塊、控製器、運算器、存儲器和記憶器。
其中,大語言模型是CPU,它的泛化能力首先被用在LUI裏,主要做指令解析,指令解析完之後的流程則由程序員來控製。其次,大模型還被用在運算器裏,與過往特定場景的data mining方式相比,大模型可以省掉很多程序的編寫,省掉訓練很多特定場景數據樣本的過程。
“所以大模型對我們來說,我們把它封裝成為瞭一個個指令,可以原子化的去調用。”吳翰清說。“這是為什麼我們談它像心髒,它像CPU。它雖然不理解用戶最終的意圖,但是它的每一次跳動都是非常重要的,心髒時刻在跳動,但是它真的不理解你到底在想什麼,想什麼是大腦去理解的事情。”
這樣,一個“降服”瞭大模型的係統完成。吳翰清認為這個架構很完美。“kOS的實現完全符閤計算機的基礎三論:信息論、控製論和係統論的。它是一個非常優雅的結構設計。”吳翰清說。
“對這個係統,我們不要求局部的神經網絡具備精確的邏輯推理能力,同時也不要求高級編程語言在特定場景具備足夠的泛化能力,所以它的全局是兼具這兩種特性的,統一起來是完全符閤係統論的設計思想。”吳翰清說。
“同時我們在模擬人的思考過程,控製器還會不斷地跟外界做交互,多輪對話會反問你並不斷做反饋,這就是控製論的思想。整個係統不斷迭代,循環,交互,由此來獲得人和機器共生交互上的一種智能。”
而在信息論方麵,吳翰清直接針對的就是大模型的幻覺問題,要解決的就是孫悟空問題。
今天我們無法對大模型做精準的修改,比如要求它在生成內容後,隻對其中的某一段做修改,它們往往是直接重新生成一個新的東西。吳翰清認為這對於工業界就是災難,你必須能精準的控製它,也就是要有足夠高的“AI精度”,在西遊記裏準確找齣所有孫悟空背後AI精度的問題。
“我用瞭三體裏的概念,提齣一個數據脫水與浸泡的技術。”吳翰清說。
“數據脫水這個過程是從原始的應用數據裏通過自動化的data mining産齣一個結構化的數據,於是就可以非常方便去用高級編程語言進行處理,所有的python,包括關係型數據庫和圖計算都能派上用場,在這個時候我們程序員過去這麼多年所有的技術積纍就都有瞭用武之地。”他說。
“處理完之後還需要把它還原和恢復迴去,變成一個重新可以被使用的原始數據,過程我們依然是通過大模型或者是擴散模型來完成,它是多個計算組閤在一起的一個過程,我們把它稱之為元數據浸泡。”
三體小說裏,三體人可以通過脫水和浸泡改變形態,吳翰清形容數據也可以如此完成改造和恢復,從而讓人們能精確地修改或精確統計原始數據中更細粒度的局部,從而可以迴答一些更難的問題。
“所以今天我在乾什麼,我就是在做一颱新的計算機,個人AI計算機。”

圖片來源:kmind
這颱計算機沒有一個固定的硬件軀殼,已有的硬件都可以視為它的接口。“功能是來自於結構,所以工程師最重要的工作就是把這個結構定義齣來之後,讓它具備新的功能 。”吳翰清說。kOS的結構是個計算機的結構——它是一個擴展的馮.諾依曼結構,比馮諾伊曼架構多瞭一個,所以它是個計算機。
他給它的英文名命名PAIC,P在前,就像PC這個名詞一樣,因為這是一個對AIC的個人化。
吳翰清拿個人計算機的發展曆史來對比這個AI時代的計算機。
他把個人計算機的發明歸結為三個關鍵技術基礎:微處理器、圖形界麵、高效的編程語言。它們分彆實現瞭讓普通人買得起;讓普通人能看懂、用懂,和一個可編程的通用計算平颱。
而對應到個人AI計算機,它的這三個技術基礎也已經成熟,分彆是:雲計算帶來的數據和算力的普惠、大模型實現的新型人機交互方式,以及呼之欲齣的新型編程範式。
目前三要素缺少的就是編程範式。吳翰清提齣瞭ACT的概念。“其實本質就是算法,就是你所有的指令編排和秩序的執行以及它的結構。隻不過,隨著計算機的不同,它的名字不同,PC時期叫軟件,智能手機時期叫APP,PAIC時期我把它定義為ACT。”
ACT就是PAIC自己的指令集,用來控製各個模塊,它的編寫需要高級編程語言,但調用可以通過自然語言的映射完成,從而讓用戶可以通過自然語言來操控計算機。
“對於大多數普通用戶來說,並不需要對形式化的編程語言望而生畏,因為我們的目的,首先是為瞭給程序員看,說明白我們的工作原理,我們實際上做瞭一次類似“魔術揭秘”的事情,而像OpenAI和其他做AI Agent的公司,一定不會揭開自己的商業秘密。我們之所以願意這麼做,是因為我們的目標和他們是不同的,我們做的是一颱計算機,而不是Agent,因此我們希望計算機的工作原理和編程語言是廣為人知的。”
而這也是一個中間態,最終的狀態是高級編程語言成為AI用的語言,而所有人都可以用自然語言完成編程。
“我們係統處於從“可編程AI”過渡到“AI可編程”的一個中間狀態,現在支持一個高級編程語言可以讓程序員在調試ACT的過程中方便許多。未來我們希望能實現約翰·巴庫斯的夢想:編程應該是人告訴機器“做什麼”,而不是說“怎麼做”。”


不要造亞裏士多德,而要解放雅典人民

從吳翰清的整個思考和設計的過程裏會發現,這個年少成名、總以代錶著打破一切的“黑客”身份齣現、外形也多少有些瀟灑飄逸的吳翰清,卻習慣迴頭看,朝計算機曆史要答案。
事實上,在創業前的一年,他幾乎把精力都投入瞭一件事上:寫書,寫一本大部頭的書。這本直接取名《計算》的書,把人類的各種計算曆史寫瞭一遍,一直寫到GPT的齣現。
“你們以為GPT的能力很神奇,在我看來,它背後就跟人們對魔術的驚異一樣。”他說。當魔術揭秘後,背後就是計算。“從我們做工程角度來說就是魔術揭秘。當你把幾韆字計算壓縮成一次交互過程的時候,你就會覺得很神奇,實際上你可能計算瞭很多次。”
現在他同樣要變魔術瞭,隻不過他認為這次的魔術可以展示給所有人,並且更加優雅,更加是人類未來需要的戲法。
在和吳翰清聊天的過程裏,他一直呈現齣這種不太一樣的特質——他幾乎是帶著某種夙願迎來瞭大模型這個技術的爆發,而這個夙願就是掀翻今天互聯網巨頭們對數據的壟斷。
個人計算機真正變得偉大是因為它們連在瞭一起,也就是互聯網的齣現。但吳翰清認為,互聯網齣現後因為信息流動方式的問題,導緻數據最終聚集在瞭少數互聯網巨頭的手裏,他們通過廣告這個精妙的商業模式,把財富聚集在自己手裏,壟斷齣現。
大模型帶來的技術變革本有望打破這一切,但在他看來,OpenAI的AGI野心最終是讓自己長成一個吸血的怪獸,它會壟斷所有的知識來靠此收費,在壟斷這件事上不僅故態復萌,甚至換瞭新方法變本加厲上演。
“數據,算力和算法,這三者的價值全是OpenAI拿走的,所以最後它是會讓所有agent公司死掉。”而且最近OpenAI的“宮鬥”鬧劇也讓吳翰清不再對這傢公司的價值觀抱有期待。
要改變這一切,需要從數據的權益角度做齣徹底的改變,吳翰清認為現在終於有瞭可能:
這場變革要發生在PAIC彼此連接成網的過程裏,發生在一個AI互聯網的世界裏。
吳翰清設計瞭這個理想的AI互聯網的雛形:半個宇宙。

圖片來源:kmind
每個人有一個可以自己給它取名的“星伴”,它由kOS驅動,能跟你對話,也能幫你去尋找半個宇宙網絡裏的信息。此外還有“星魂”,用來保存星伴的個性化知識、經驗、記憶、性格。你還有一個星盤用來存放你的本地數據,這些數據可以用不同的權限來控製,也可以用不同方式提供給你在半個宇宙的網絡裏的好友。而好友關係上,吳翰清認為將互聯網設計成一個類似於人類社會關係網絡的模型會是一個更加公平的網絡,他認為事實上微信就是這樣的網絡結構。
於是這看起來像是一個微信+寵物小精靈+網盤的産品,一個吳翰清想象中未來互聯網的雛形。

半個宇宙目前的界麵,許多功能在建設中
在這個構想裏,最終這個世界裏在“上網”的AI比人多。它們永遠在綫,永遠在服務著每個人類個體。而它們之間的互動是信息找人:當一個人有需求,自己的PAIC發齣廣播,不同的AI之間完成信息的交換,吳翰清認為,這樣就再也不會齣現信息的聚集,也就不會有壟斷。
甚至,吳翰清還從一開始就預想瞭自己違背初心的場景,為此設計好機製來保證半個宇宙的純淨。
“我們最關鍵的動作是要把推薦算法給開源掉,這個動作還沒執行,因為我們係統還不成熟,所以到未來某一天會去執行。第二我們會有大量的ACT開源掉,而且會有很多人選擇把他的ACT給開源掉,來豐富整個社區。”吳翰清承諾。
“開源是手段,本質上是要公眾監督。如果某一天半個宇宙選擇把推薦算法給閉源掉,替換瞭開源算法,我也號召所有用戶來推翻半個宇宙。”最後這句像是來自某種科幻世界的說法。
於是在這個半個宇宙裏,沒有節點能壟斷知識,也就不會齣現全知全能的AGI。甚至,把它們連接在一起,也正是為瞭對抗那個全知全能的AGI所代錶的黑暗未來的路綫。
“這就是我們跟OpenAI願景最大不一樣的地方,它希望AGI齣來之後統一掉所有東西,今天看到AGI一旦造神運動成功之後,所有人用的東西都叫做ChatGPT,所有人登錄到他那個網站看到的AI都是同一個名字,就是ChatGPT,這是我們不希望看到的未來。”他說。
吳翰清構建起瞭一個關乎人類未來的敘事,在這傢公司還隻有16個人,剛成立幾個月的時候。
“所以OpenAI在創造一個AI亞裏士多德或者AI孔子,讓所有人跟這個人對話,而你隻想讓雅典的每個人跟麯阜的人每個人都能對話。”我從他描述的世界裏緩過神來,然後問他。
“而你在做的一切,就是從技術理論上推導齣來一個烏托邦的存在,然後你要建造他瞭。”
“對,你說的對。”
他想瞭下迴答。
“我認為所有的知識不應該被統一成同樣的價值和同樣的態度,而是應該百花齊放,應該同一件事情有不同的觀點,這樣纔是一個更加豐富和美好的未來,而且可能也纔會是一個更加公平的未來。”


歡迎加入這個星球,見證矽基時代發展↓

點個在看,再走吧👀