華文網

記2016年集智-凱風研讀營|統一之路:量子糾纏、時空幾何與機器學習

金秋十月。密雲郊區的古北水鎮。

我與吳令飛漫步在曲徑通幽的小路上。

紅黃綠三種顏色爭先恐後地擠入畫面,

仿佛在張揚那秋色特有的張力與活性。

古北小鎮的風景

普遍聯繫

萬事萬物是普遍聯繫的,這種觀點並不新奇,然而令人意想不到的是這一哲學觀點正在引發一場從微觀到宏觀的科學範式轉變。

更令人意想不到的是,我們正在舉行的凱風-集智研讀營——一個僅僅由16個年輕學者參與的為期5天的小型研討會——正在見證這一變革。

我的眼前不禁又浮現出尤亦莊在講臺上的奕奕神采。這個總是低頭沉思的大男孩在講起物理的時候就仿佛換了一個人,聲音高亢而洪亮。更有意思的是他講的內容。

在回程的大巴上,尤亦莊抓緊時間寫論文

用著名物理學家文小剛的話說,現在的理論物理學正在經歷一場革命,這場革命不但有望統一相對論和量子力學,更有可能統一微觀與宏觀、物質與資訊。而這一革命背後,正是從物件導向的物理學到面向關係的物理學的範式轉變。在新的圖景下,我們的宇宙是一台大型的量子電腦。

生命、智慧、人類社會都不過是這台大型電腦上湧現出來的Pattern。

一切都要從量子糾纏說起。所謂的量子糾纏是指兩個量子比特存在著的一種很強的聯繫,在這種聯繫下它們仿佛就是一個整體,甚至這兩個比特已然相隔萬里。這就是讓大科學家愛因斯坦也唏噓不已、不願意接受的量子糾纏:兩個明明分離的部分卻表現得像一個整體。

正是因為量子糾纏的存在,

量子體系可以擁有比經典系統更強的資訊存儲能力,因為資訊不僅可以存儲在獨立的量子比特中,還可以存儲在兩個比特的糾纏——即關係之中。而且,糾纏存儲的資訊是兩個比特,足足比經典的相關性增加了一比特的存儲量。

“我就不明白,量子糾纏與經典的相關性究竟有什麼聯繫?”,吳令飛一邊嚓嚓地踩著落葉一邊問道,“比如,我有一對手套,我把其中的一支送到月球上,

當我看到我自己手中的手套是左手的時候,我自然可以推知月球上的手套必然是右手,這不是也是一種糾纏嗎?”

“嗯,這個問題的確問得好……”我一邊沉思著一邊回憶著尤亦莊給出的解釋,複述給吳令飛,“然而,在手套這個例子中,當你得知了手套的左右屬性後,你就不能在這二者的聯繫中獲得更多資訊了。而假設手套是量子的,你不僅可以從一支量子手套的測量中獲得另一支手套是右手的資訊,你還可以測量手套的第二個屬性,從而獲得額外的一比特的資訊。也就是說,量子的兩比特糾纏會比經典的兩比特相關包含更多的資訊,這恰恰是貝爾不等式所推導出的內容。”

“物理學家都是外星人嗎?”,當尤亦莊講到我們可以用張量網路來表示量子糾纏的時候,苑明理脫口而出這句話。的確,張量網路不僅可以巧妙地用網路圖形表示複雜的高階張量計算,而且可以簡單輕鬆地表達處於複雜糾纏的量子體系。如下圖:

張量網路示例,節點表示量子比特,連線表示糾纏

網路中的節點都是量子比特,連邊就表示這兩個量子比特之間的糾纏,連邊的權重表示了糾纏熵。有了這種工具,我們就可以輕而易舉地研究多體之間的糾纏關係,還可以進行複雜的張量計算。

一個量子系統的演化完全可以用這個網路的演化來表示。有意思的是張量網路的演化會服從一些類似社會網路中的規則:連結具有一定的傳遞性,即如果A和B相連,且B和C相連,那麼A就很可能會與C相連。有了這種傳遞性,一個網路在演化的過程中就會更容易地形成長程連接。所以當我們製備了一個量子體系,那麼由於它與環境的退相干(de-coherence)作用,它就會與環境建立越來越多的連結。

既然資訊都存儲在了這些糾纏之中,那麼一個體系的熵就可以形象地表現為該系統與外界發生的聯繫數量(也就是張量網路中的連邊)。所以,當我們想知道某一個系統(張量網路中的一個子區域)的熵的時候,我們只需要知道當我們把該系統完全清晰地劃分出來,所需要切斷它與外界的連邊總權重之和。

於是,結合前面兩點,我們就能得出熱力學第二定律。我們知道,熱力學第二定律可以表述為:任何一個孤立系統的演化都趨於熵增,也就是存在著一個時間箭頭,它的指向為熵增。而與其矛盾的是,微觀世界的物理學(無論是牛頓經典力學還是量子力學)中的演化都是時間反演對稱的,即不存在時間箭頭。那麼,我們觀察到的熵增現象是怎麼回事兒呢?

對一個張量網路的局部進行測量必然會切斷一些聯繫,這些被切斷的糾纏總量就是系統的熵

人們曾試圖從牛頓經典力學推導出熱力學第二定律,但都沒有成功。而最近幾年的物理學進展卻使得我們可以從量子糾纏的角度重新推導熱力學第二定律。一方面,任何一個量子體系的糾纏都在逐漸趨向于長程弱聯繫;另一方面,我們每一次測量都只能測量到整個系統中的一小部分,於是,我們就不得不割裂這一小部分與系統外界的量子糾纏。而我們知道,這些被割裂邊的權重之和就是被測量體系的熵。所以,我們就會得到熵會不斷增加的結論。

讓我們換一種表述方法,其實所謂的熵增並不存在。因為,當系統按照量子力學薛定諤方程的模式進行演化的時候,系統會建立越來越多的長程聯結,即系統的每一個局部的資訊都會彌散在整個系統之中。而我們人類無法對整個系統(宇宙)進行測量,而只能測量到系統之中的一小部分,於是,我們就無法還原彌散在整個系統之中的資訊,而得到熵不斷增加的結論。

小鎮裡面的遊人開始漸漸多了起來,一些遊客與我擦肩而過,時不時還會發生一些身體上的接觸。“他們在帶走我身上的資訊”,我突然冒出了這樣一個念頭。可不是嗎,假如我是一個量子比特,我與這些人的每一次碰撞實際上就是一起糾纏事件,而每一次糾纏都會使得我身上的資訊被不斷分散在整個人群之中。假如我想讓我某一天的生活重新來過,我只需要將與我相互作用過的每一個人集合起來,收集我身上的資訊,原則上講就能夠讓時間停止甚至逆轉。

我突然想起了前段時間聽到過的一個MIT學生的非常有創意的項目構思:利用機器學習技術,我們也許可以通過地面上的一張小紙片的微小震動模式來推斷房間中人們發聲所說出來的語言是什麼,也許未來不需要竊聽器就可以盜取資訊,因為這些資訊實際上都分佈到了環境的每一個角落。

雙曲幾何

當然,量子糾纏、張量網路這一套東西的威力還不僅如此,除了匯出熱力學第二定律外,它還能推出更多激動人心的東西。

在物理中,有兩個東西比較相似,一個是量子糾纏,一個是蟲洞。這兩種東西都具有非局域特性,同時,也都非常不穩定。

所謂的蟲洞,是一種時空結構,可以直接從愛因斯坦的廣義相對論中得到。這種結構可以通過空間中的特殊通道,將兩個原本相隔非常遠的空間重新聯通到一起。不過,這種結構是非常不穩定的,它的壽命也極其短暫。

再來看量子糾纏,它也具有非局域特性,而且也是極其不穩定的。為了避免退相干,人們需要精心製備實驗條件,這也是為什麼量子電腦製造極其困難的原因。我們很難長時間維持一個長程的糾纏。

正是由於量子糾纏和蟲洞之間的相似性,這使得人們大膽猜測,量子糾纏實際上就是蟲洞。當兩個相隔很遠的量子比特處於相互糾纏狀態的時候,它們彼此之間實際上有著空間中的蟲洞相連。

於是一個存在長程關聯的無引力的共形場可以等價於一個局域的量子引力場,這就是物理上著名的AdS/CFT對應。因為長程關聯(糾纏)系統中的糾纏全部對應為了超空間連接的蟲洞,於是,在新的AdS空間中增加了很多新的聯繫,這些聯繫就使得新空間成為一種雙曲空間。如果我們將長程關聯的共形場看作一個圓環,那麼對應的引力場就是一個彭加來原盤(雙曲空間的一個模型),如下圖所示:

AdS/CFT對偶。這是雙曲空間的Poincare圓盤模型,圖中每個三角形都是等面積的三角形。於是,越靠近邊緣,三角形的數量程指數增長,表明空間的面積越大。圓環邊界上的共形場論和體空間中的量子引力理論是一一對應的

如上圖所示,這是AdS/CFT變換的示意圖,邊界上存在著一個沒有引力的但是處於臨界狀態的相互關聯的共形場,而邊界內部則是一個雙曲空間(AdS空間)。於是,在新的空間中,長程的相互聯繫消失了,空間成為了雙曲的。

從數學上說,雙曲空間就是曲率為負的空間。它實際上可以看成是樹這種結構的離散版本。在這種空間中,空間的度規會隨著距離的增大而呈指數增長。

這種AdS/CFT對應不僅能夠讓我們看到引力理論和處於臨界狀態的長程關聯系統之間的聯繫,而且還能夠幫助我們找到理解普遍存在的臨界現象的方式,即雙曲空間。所謂的臨界現象是指系統在一定條件下所展現出來的一系列無標度效應,例如系統的各個變數呈現冪律分佈和冪律相關,系統存在著尺度對稱性(即分形特性)。最重要的是,臨界系統都存在著長程關聯,即關聯強度隨著尺度呈現冪律方式的衰減。

由於臨界系統中的長程關聯,所以經過這種變換,在雙曲空間中,我們就可以將這些長程關聯消除掉。然而,它的代價就是增加了一個新的維度,即系統的標度。於是,沿著雙曲空間Poincare圓盤的半徑方向,我們可以對邊界上的臨界系統做持續不斷的重整化操作。

複雜網路

如果說一個認識僅僅對理論物理問題有啟發,那麼我對它的興趣就不會很大,因為我畢竟不是搞物理的。然而,體-邊界對偶這套東西恰恰可以應用到複雜系統之中。認識到這一點,還要從三年前的一次集智活動談起。

時間回到了2013年的一個夏天,集智照常舉辦公開活動。這次,是我自己主講,內容是複雜網路。當時,尤亦莊還是清華大學高等研究院的博士生,對複雜網路正興趣十足。我大致列舉了近些年來複雜網路發展的幾個關鍵文章,其中講到了一個希臘小夥Fragkiskos Papadopoulos做的工作,他提出了一個在雙曲空間上生長的網路模型,如下圖所示:

Papadopoulos雙曲網路模型

如圖,這是一個在雙曲空間Poincare圓盤模型上生長的網路。其中,每一個節點(對應著1,2,3……這樣的編號)都有兩個座標,一個是它的極徑(到中心點的距離),另一個是它的極角,每一個節點都按照雙曲空間中距離最近的方式進行連接。

每當一個新節點誕生的時候,它的極徑就被設定為ln t,其中t就是當前時刻,而它的極角可以隨機地從0到2π之間選定一個數值。每一個新節點誕生都會帶來m條新的連邊(m是一個參數),這些連邊就將這個新節點連接到離它最近的m個近鄰上。注意,這裡面的距離是雙曲空間中的距離。在圖中,紅色的類似於舌頭一樣的區域就是一個以新節點20為中心的雙曲圓,即區域中的點到20節點的雙曲距離都是相等的。也就是說,空間在徑向和圓周方向並不對稱。於是,新節點會連接更老的節點(ln t更小),或者是極角和自己更相近的節點。

該模型將這兩個座標賦予了實際含義:極徑表示的是節點的流行度,越老的節點就越流行——因為它們可以競爭得到更多的連接。而極角則被解釋為流行性,即在極角方向上越靠近的節點,它們彼此越相似。所以,一個新點進入系統後,要麼連接那些很有威望的老節點,要麼連接和自己相似的節點。流行性和相似度構成了一對競爭。

最有意思的是,該模型可以複現出著名的優先連接模型(Preferential attachment),也能夠得到小世界的特性。而且,這個模型的各種變種幾乎可以複現所有已知的複雜網路模型。

然而,在三年前的那次講座中,我自己卻沒有認識到這個模型的重要性,以為這些都只不過是酷炫的數學以及一些奇技淫巧。其實,之所以這樣認識,完全是因為我當時對所謂的雙曲幾何這種概念非常陌生。

“這不就是Anti de Sitter空間嗎?”坐在台下聽講座的尤亦莊馬上興奮了起來,他興致高昂地說道,“原來複雜網路學者們已經走到了前面!”

會後,我們就對雙曲幾何進行了更深入地探討。原來,我們在很多複雜系統中看到的那些諸如標度律、冪律分佈、分形幾何等臨界現象,都可能暗示著它的背後存在著雙曲幾何。然而,由於時間倉促,我對這些高深的理論物理知識仍然一知半解。

時間拉回了今天,當我聽過了尤亦莊的精彩講座之後,終於對什麼是張量網路有了比較全面的瞭解,也對尤亦莊當時所說的臨界系統與雙曲幾何的關係有了更深刻的認識。

在很多複雜系統中,層級現象都非常地普遍。如果我們將層級作為一種新的維度(也就是雙曲幾何中的徑向維度),那麼我們就可以將複雜系統按照層級進行展開,這樣,每一層就構成了一個尺度的相似性空間。而複雜系統之所以會展現出各種各樣的臨界現象,恰恰是因為它背後存在著雙曲幾何機制。於是,經過體-邊界對偶關係,利用新的層級維度,我們就可以將普遍存在的長程相互作用化簡為局域的相互作用。

然而這種奇怪的雙曲幾何真的存在於我們身邊的複雜系統嗎?我們怎麼沒有體會到彎曲的時空呢?

有意思的,董磊的報告讓我們看到,由於現代城市中的疏運交通網絡的作用,我們的空間已經被彎曲變形了,最終的形狀真的有可能具有一種雙曲結構。如下圖所示:

左圖是倫敦市的形態和路網的分佈,右圖是從市中心出發,市民出行的等時間線熱度圖。也就是說,同種顏色的區域到市中心的出行時間都一樣

於是,假如我們根據等時線來重新定義度規,就會得到扭曲變形後的城市地圖。這種方法可以很好地展現出城市交通的自然演化對空間扭曲程度的影響。

機器學習

然而,儘管這套理論可以自圓其說,而且似乎能讓我們看到它和理論物理的深刻聯繫,但是,它究竟如何指導我們的實踐呢?這恐怕離不開機器學習技術!

當下,機器學習大火。越來越多的機器學習、深度學習技術被用來解決人們日常生活中的問題。其中,網路嵌入(network embedding)就與我們討論的幾何與網路的主題緊密相關。

這還要從誕生於2013年的一項自然語言處理技術Word2Vec說起。Word2Vec是一套將單詞嵌入到高維空間中的技術,通過訓練一個神經網路,得到每個單詞的向量。每個單詞的向量和它所出現的上下文單詞有關,相似的單詞會出現在相似的地方。

更令人驚奇的是,這種技術不僅僅能夠精確地計算單詞之間的相似性,還能夠得到單詞之間的抽象關係。例如,一個著名的公式是:v(男人)-v(國王) ≈ v(女人)-v(王后)。

其中v(x)表示x這個單詞的詞向量。也就是說,機器會自己學習到男人相對于國王相當於女人相對于王后。所以,除了將每個單詞進行了向量表示以外,Word2Vec還可以隱式地學習到“最高權力”這種關係。

後來,有人將這套東西用到了複雜網路上。為什麼自然語言處理的技術能夠用到複雜網路上呢?原來,網路上有個東西叫做隨機遊走。即我們可以放一個隨機遊走的粒子到網路上,然後讓它沿著網路的連邊隨機的跳轉,這樣這個粒子就可以走出來一個節點的序列,例如:3→1→2→5→7→….我們便可以將這樣一個序列看作一句話,每一個節點的編號看作是一個單詞。於是,我們便可以將大量這樣的粒子隨機遊走出來的節點序列扔給Word2Vec做訓練,就得到了每一個節點的向量表示。這就叫網路嵌入,即將每個節點嵌入到了一個高維的空間中。於是,我們利用機器學習的方式,建立了一種網路和幾何之間的關係。這一套演算法叫做DeepWalk,它可以很好地表示網路,並且,相似的節點(處於相同社區的節點)都會被聚集在一起。有大量的網路嵌入演算法被總結成了流行學習這樣一個分支(吳令飛在研讀營中做了專門的介紹)。

然而,這種方法也不是十全十美,其中一個最大的問題就是它無法區分不同層次的節點。比如,在自然語言中,“The, a”這種單詞經常出現,於是它們也會被嵌入到整個網路所有節點的中心位置。然而,我們明顯地知道這種單詞是與其它的單詞不同的。同樣地,在複雜網路中,有一些核心節點僅僅是因為處在了Hub的位置才與所有的節點都相連,而實際上它們並不與其它的節點相似。但是,DeepWalk演算法卻並不能區分這種位於高層次的節點。

因此,我們應該將雙曲幾何模型中的流行性考慮到機器學習演算法過程中。也許,我們通過將這種層次性的因素過濾掉之後,就可以更好地將同層次的節點嵌入到合適的向量空間中,而且在這樣做的過程中,我們或許可以自然地得到網路相似性空間的維度。

目前所有的網路嵌入演算法都是將維度作為一個外生變數引入的,我們並不能先驗地確定一個具體的空間維數。但是,如果我們將節點的層次性因素去掉之後,不斷提升嵌入空間的維度,就有可能得到誤差曲線的一個相變,於是這個臨界的維度值就應該是網路本身特徵空間的維度值。

統計物理

這個時候,張潘在白板上推導公式的場景再一次浮現在我的眼前。他從一個統計物理學家的特殊視角統一了幾大類計算問題。在他看來,所謂的極大似然估計和貝葉斯統計推斷不過是統計物理系統在不同溫度譜系上的特例。當我們將溫度這個閥門調節到0的時候,我們就得到了極大似然估計方法;而當我們將溫度調節到1的時候,就得到了貝葉斯統計推斷。物理學家強大的地方就在於,一旦他們看懂了一個問題,他們就能一下子把握住該問題的本質並作出推廣。

具體來講,很多計算問題的求解都存在著相變。比如,對於圖的染色問題,不同的網路對應著不同的難度。於是,我們便可以利用ISING模型來對這類組合優化問題進行建模,從而將統計物理學家發明的各類巧妙的近似方法(例如cavity方法)應用其中。

我猜,網路的空間嵌入也存在著類似的相變。為了求得每個節點在表示空間中的位置,我們就要去優化節點的位置變數,讓它們的總誤差最小。這很像ISING模型(嚴格說,應該是POTTS模型),其中節點是自旋,誤差是能量;也許維度D就是一個序參量,對它的調節會導致相變。於是,物理學家發明的一大套高明的技巧就可以被用來分析這一現象。

於是,我們看到了一條統一的道路:從量子糾纏到複雜網路,再到雙曲空間、機器學習和統計物理。當我看清了整個道路,就有了一種打通了七經八脈的感覺。也許,跨學科交叉的意義就在於此,它能讓你看到不同學科之間的深刻聯繫。

結語

五天時間一晃而去,儘管我們是在緊張的討論和學習中度過的,但是每一個人都對此次研讀營留下了深刻的印象。在最後的總結晚宴過程中,每一個人都表達了這次活動的效果遠遠超出預期的感受。

再見了,集智-凱風研讀營;再見了古北水鎮;再見了,令人尊敬的學者們;再見了,親愛的朋友們。

張江

於2016年10月

參考資料

[1] 尤亦莊關於本次研讀營課程的講義:

http://wiki.swarma.net/index.php/2016%E7%A0%94%E8%AF%BB%E8%90%A5%E4%B9%8B%E5%BC%A0%E9%87%8F%E7%BD%91%E7%BB%9C

[2] 關於量子資訊與量子計算:Michael Nielson &Issac L.Chuang, Quantum computation and quantum information, Cambridge University Press,2001

[3] 關於張量網路:https://arxiv.org/pdf/1106.1082v1.pdf

[4] 複雜網路的雙曲模型:Papadopoulos F, Kitsak M, Serrano MÁ, et al. Popularity versus similarity in growing networks[J]. Nature, 2012,489(7417): 537-540.

[5] 雙曲幾何:

http://wiki.swarma.net/index.php/%E5%8F%8C%E6%9B%B2%E7%A9%BA%E9%97%B4%E6%A8%A1%E5%9E%8B

[6] Word2Vec的相關論文:T. Mikolov, J. Kopecky´, L. Burget,O. Glembek and J. Cˇ ernocky´. Neural network based language models for higlyinflective languages, In: Proc. ICASSP 2009.]

[7] DeepWalk演算法: Bryan Perozzi, Rami Al-Rfou (2014)."DeepWalk: Online Learning of Social Representations". KDD.

[8] 演算法的統計物理(張潘總結的非常好的綜述材料):

http://wiki.swarma.net/index.php/2016%E7%A0%94%E8%AF%BB%E8%90%A5%E4%B9%8B%E7%BB%9F%E8%AE%A1%E7%89%A9%E7%90%86%EF%BC%8C%E7%BD%91%E7%BB%9C%E4%B8%8E%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0

編輯:Dandelion

推薦閱讀

記2017集智-凱風研讀營:機器學習、理論物理、計算社會學、複雜網路的碰撞

集智QQ群|292641157

商務合作|zhangqian@swarma.org

投稿轉載|wangting@swarma.org

◆ ◆ ◆

加入“沒有圍牆的研究所”


你還可以測量手套的第二個屬性,從而獲得額外的一比特的資訊。也就是說,量子的兩比特糾纏會比經典的兩比特相關包含更多的資訊,這恰恰是貝爾不等式所推導出的內容。”

“物理學家都是外星人嗎?”,當尤亦莊講到我們可以用張量網路來表示量子糾纏的時候,苑明理脫口而出這句話。的確,張量網路不僅可以巧妙地用網路圖形表示複雜的高階張量計算,而且可以簡單輕鬆地表達處於複雜糾纏的量子體系。如下圖:

張量網路示例,節點表示量子比特,連線表示糾纏

網路中的節點都是量子比特,連邊就表示這兩個量子比特之間的糾纏,連邊的權重表示了糾纏熵。有了這種工具,我們就可以輕而易舉地研究多體之間的糾纏關係,還可以進行複雜的張量計算。

一個量子系統的演化完全可以用這個網路的演化來表示。有意思的是張量網路的演化會服從一些類似社會網路中的規則:連結具有一定的傳遞性,即如果A和B相連,且B和C相連,那麼A就很可能會與C相連。有了這種傳遞性,一個網路在演化的過程中就會更容易地形成長程連接。所以當我們製備了一個量子體系,那麼由於它與環境的退相干(de-coherence)作用,它就會與環境建立越來越多的連結。

既然資訊都存儲在了這些糾纏之中,那麼一個體系的熵就可以形象地表現為該系統與外界發生的聯繫數量(也就是張量網路中的連邊)。所以,當我們想知道某一個系統(張量網路中的一個子區域)的熵的時候,我們只需要知道當我們把該系統完全清晰地劃分出來,所需要切斷它與外界的連邊總權重之和。

於是,結合前面兩點,我們就能得出熱力學第二定律。我們知道,熱力學第二定律可以表述為:任何一個孤立系統的演化都趨於熵增,也就是存在著一個時間箭頭,它的指向為熵增。而與其矛盾的是,微觀世界的物理學(無論是牛頓經典力學還是量子力學)中的演化都是時間反演對稱的,即不存在時間箭頭。那麼,我們觀察到的熵增現象是怎麼回事兒呢?

對一個張量網路的局部進行測量必然會切斷一些聯繫,這些被切斷的糾纏總量就是系統的熵

人們曾試圖從牛頓經典力學推導出熱力學第二定律,但都沒有成功。而最近幾年的物理學進展卻使得我們可以從量子糾纏的角度重新推導熱力學第二定律。一方面,任何一個量子體系的糾纏都在逐漸趨向于長程弱聯繫;另一方面,我們每一次測量都只能測量到整個系統中的一小部分,於是,我們就不得不割裂這一小部分與系統外界的量子糾纏。而我們知道,這些被割裂邊的權重之和就是被測量體系的熵。所以,我們就會得到熵會不斷增加的結論。

讓我們換一種表述方法,其實所謂的熵增並不存在。因為,當系統按照量子力學薛定諤方程的模式進行演化的時候,系統會建立越來越多的長程聯結,即系統的每一個局部的資訊都會彌散在整個系統之中。而我們人類無法對整個系統(宇宙)進行測量,而只能測量到系統之中的一小部分,於是,我們就無法還原彌散在整個系統之中的資訊,而得到熵不斷增加的結論。

小鎮裡面的遊人開始漸漸多了起來,一些遊客與我擦肩而過,時不時還會發生一些身體上的接觸。“他們在帶走我身上的資訊”,我突然冒出了這樣一個念頭。可不是嗎,假如我是一個量子比特,我與這些人的每一次碰撞實際上就是一起糾纏事件,而每一次糾纏都會使得我身上的資訊被不斷分散在整個人群之中。假如我想讓我某一天的生活重新來過,我只需要將與我相互作用過的每一個人集合起來,收集我身上的資訊,原則上講就能夠讓時間停止甚至逆轉。

我突然想起了前段時間聽到過的一個MIT學生的非常有創意的項目構思:利用機器學習技術,我們也許可以通過地面上的一張小紙片的微小震動模式來推斷房間中人們發聲所說出來的語言是什麼,也許未來不需要竊聽器就可以盜取資訊,因為這些資訊實際上都分佈到了環境的每一個角落。

雙曲幾何

當然,量子糾纏、張量網路這一套東西的威力還不僅如此,除了匯出熱力學第二定律外,它還能推出更多激動人心的東西。

在物理中,有兩個東西比較相似,一個是量子糾纏,一個是蟲洞。這兩種東西都具有非局域特性,同時,也都非常不穩定。

所謂的蟲洞,是一種時空結構,可以直接從愛因斯坦的廣義相對論中得到。這種結構可以通過空間中的特殊通道,將兩個原本相隔非常遠的空間重新聯通到一起。不過,這種結構是非常不穩定的,它的壽命也極其短暫。

再來看量子糾纏,它也具有非局域特性,而且也是極其不穩定的。為了避免退相干,人們需要精心製備實驗條件,這也是為什麼量子電腦製造極其困難的原因。我們很難長時間維持一個長程的糾纏。

正是由於量子糾纏和蟲洞之間的相似性,這使得人們大膽猜測,量子糾纏實際上就是蟲洞。當兩個相隔很遠的量子比特處於相互糾纏狀態的時候,它們彼此之間實際上有著空間中的蟲洞相連。

於是一個存在長程關聯的無引力的共形場可以等價於一個局域的量子引力場,這就是物理上著名的AdS/CFT對應。因為長程關聯(糾纏)系統中的糾纏全部對應為了超空間連接的蟲洞,於是,在新的AdS空間中增加了很多新的聯繫,這些聯繫就使得新空間成為一種雙曲空間。如果我們將長程關聯的共形場看作一個圓環,那麼對應的引力場就是一個彭加來原盤(雙曲空間的一個模型),如下圖所示:

AdS/CFT對偶。這是雙曲空間的Poincare圓盤模型,圖中每個三角形都是等面積的三角形。於是,越靠近邊緣,三角形的數量程指數增長,表明空間的面積越大。圓環邊界上的共形場論和體空間中的量子引力理論是一一對應的

如上圖所示,這是AdS/CFT變換的示意圖,邊界上存在著一個沒有引力的但是處於臨界狀態的相互關聯的共形場,而邊界內部則是一個雙曲空間(AdS空間)。於是,在新的空間中,長程的相互聯繫消失了,空間成為了雙曲的。

從數學上說,雙曲空間就是曲率為負的空間。它實際上可以看成是樹這種結構的離散版本。在這種空間中,空間的度規會隨著距離的增大而呈指數增長。

這種AdS/CFT對應不僅能夠讓我們看到引力理論和處於臨界狀態的長程關聯系統之間的聯繫,而且還能夠幫助我們找到理解普遍存在的臨界現象的方式,即雙曲空間。所謂的臨界現象是指系統在一定條件下所展現出來的一系列無標度效應,例如系統的各個變數呈現冪律分佈和冪律相關,系統存在著尺度對稱性(即分形特性)。最重要的是,臨界系統都存在著長程關聯,即關聯強度隨著尺度呈現冪律方式的衰減。

由於臨界系統中的長程關聯,所以經過這種變換,在雙曲空間中,我們就可以將這些長程關聯消除掉。然而,它的代價就是增加了一個新的維度,即系統的標度。於是,沿著雙曲空間Poincare圓盤的半徑方向,我們可以對邊界上的臨界系統做持續不斷的重整化操作。

複雜網路

如果說一個認識僅僅對理論物理問題有啟發,那麼我對它的興趣就不會很大,因為我畢竟不是搞物理的。然而,體-邊界對偶這套東西恰恰可以應用到複雜系統之中。認識到這一點,還要從三年前的一次集智活動談起。

時間回到了2013年的一個夏天,集智照常舉辦公開活動。這次,是我自己主講,內容是複雜網路。當時,尤亦莊還是清華大學高等研究院的博士生,對複雜網路正興趣十足。我大致列舉了近些年來複雜網路發展的幾個關鍵文章,其中講到了一個希臘小夥Fragkiskos Papadopoulos做的工作,他提出了一個在雙曲空間上生長的網路模型,如下圖所示:

Papadopoulos雙曲網路模型

如圖,這是一個在雙曲空間Poincare圓盤模型上生長的網路。其中,每一個節點(對應著1,2,3……這樣的編號)都有兩個座標,一個是它的極徑(到中心點的距離),另一個是它的極角,每一個節點都按照雙曲空間中距離最近的方式進行連接。

每當一個新節點誕生的時候,它的極徑就被設定為ln t,其中t就是當前時刻,而它的極角可以隨機地從0到2π之間選定一個數值。每一個新節點誕生都會帶來m條新的連邊(m是一個參數),這些連邊就將這個新節點連接到離它最近的m個近鄰上。注意,這裡面的距離是雙曲空間中的距離。在圖中,紅色的類似於舌頭一樣的區域就是一個以新節點20為中心的雙曲圓,即區域中的點到20節點的雙曲距離都是相等的。也就是說,空間在徑向和圓周方向並不對稱。於是,新節點會連接更老的節點(ln t更小),或者是極角和自己更相近的節點。

該模型將這兩個座標賦予了實際含義:極徑表示的是節點的流行度,越老的節點就越流行——因為它們可以競爭得到更多的連接。而極角則被解釋為流行性,即在極角方向上越靠近的節點,它們彼此越相似。所以,一個新點進入系統後,要麼連接那些很有威望的老節點,要麼連接和自己相似的節點。流行性和相似度構成了一對競爭。

最有意思的是,該模型可以複現出著名的優先連接模型(Preferential attachment),也能夠得到小世界的特性。而且,這個模型的各種變種幾乎可以複現所有已知的複雜網路模型。

然而,在三年前的那次講座中,我自己卻沒有認識到這個模型的重要性,以為這些都只不過是酷炫的數學以及一些奇技淫巧。其實,之所以這樣認識,完全是因為我當時對所謂的雙曲幾何這種概念非常陌生。

“這不就是Anti de Sitter空間嗎?”坐在台下聽講座的尤亦莊馬上興奮了起來,他興致高昂地說道,“原來複雜網路學者們已經走到了前面!”

會後,我們就對雙曲幾何進行了更深入地探討。原來,我們在很多複雜系統中看到的那些諸如標度律、冪律分佈、分形幾何等臨界現象,都可能暗示著它的背後存在著雙曲幾何。然而,由於時間倉促,我對這些高深的理論物理知識仍然一知半解。

時間拉回了今天,當我聽過了尤亦莊的精彩講座之後,終於對什麼是張量網路有了比較全面的瞭解,也對尤亦莊當時所說的臨界系統與雙曲幾何的關係有了更深刻的認識。

在很多複雜系統中,層級現象都非常地普遍。如果我們將層級作為一種新的維度(也就是雙曲幾何中的徑向維度),那麼我們就可以將複雜系統按照層級進行展開,這樣,每一層就構成了一個尺度的相似性空間。而複雜系統之所以會展現出各種各樣的臨界現象,恰恰是因為它背後存在著雙曲幾何機制。於是,經過體-邊界對偶關係,利用新的層級維度,我們就可以將普遍存在的長程相互作用化簡為局域的相互作用。

然而這種奇怪的雙曲幾何真的存在於我們身邊的複雜系統嗎?我們怎麼沒有體會到彎曲的時空呢?

有意思的,董磊的報告讓我們看到,由於現代城市中的疏運交通網絡的作用,我們的空間已經被彎曲變形了,最終的形狀真的有可能具有一種雙曲結構。如下圖所示:

左圖是倫敦市的形態和路網的分佈,右圖是從市中心出發,市民出行的等時間線熱度圖。也就是說,同種顏色的區域到市中心的出行時間都一樣

於是,假如我們根據等時線來重新定義度規,就會得到扭曲變形後的城市地圖。這種方法可以很好地展現出城市交通的自然演化對空間扭曲程度的影響。

機器學習

然而,儘管這套理論可以自圓其說,而且似乎能讓我們看到它和理論物理的深刻聯繫,但是,它究竟如何指導我們的實踐呢?這恐怕離不開機器學習技術!

當下,機器學習大火。越來越多的機器學習、深度學習技術被用來解決人們日常生活中的問題。其中,網路嵌入(network embedding)就與我們討論的幾何與網路的主題緊密相關。

這還要從誕生於2013年的一項自然語言處理技術Word2Vec說起。Word2Vec是一套將單詞嵌入到高維空間中的技術,通過訓練一個神經網路,得到每個單詞的向量。每個單詞的向量和它所出現的上下文單詞有關,相似的單詞會出現在相似的地方。

更令人驚奇的是,這種技術不僅僅能夠精確地計算單詞之間的相似性,還能夠得到單詞之間的抽象關係。例如,一個著名的公式是:v(男人)-v(國王) ≈ v(女人)-v(王后)。

其中v(x)表示x這個單詞的詞向量。也就是說,機器會自己學習到男人相對于國王相當於女人相對于王后。所以,除了將每個單詞進行了向量表示以外,Word2Vec還可以隱式地學習到“最高權力”這種關係。

後來,有人將這套東西用到了複雜網路上。為什麼自然語言處理的技術能夠用到複雜網路上呢?原來,網路上有個東西叫做隨機遊走。即我們可以放一個隨機遊走的粒子到網路上,然後讓它沿著網路的連邊隨機的跳轉,這樣這個粒子就可以走出來一個節點的序列,例如:3→1→2→5→7→….我們便可以將這樣一個序列看作一句話,每一個節點的編號看作是一個單詞。於是,我們便可以將大量這樣的粒子隨機遊走出來的節點序列扔給Word2Vec做訓練,就得到了每一個節點的向量表示。這就叫網路嵌入,即將每個節點嵌入到了一個高維的空間中。於是,我們利用機器學習的方式,建立了一種網路和幾何之間的關係。這一套演算法叫做DeepWalk,它可以很好地表示網路,並且,相似的節點(處於相同社區的節點)都會被聚集在一起。有大量的網路嵌入演算法被總結成了流行學習這樣一個分支(吳令飛在研讀營中做了專門的介紹)。

然而,這種方法也不是十全十美,其中一個最大的問題就是它無法區分不同層次的節點。比如,在自然語言中,“The, a”這種單詞經常出現,於是它們也會被嵌入到整個網路所有節點的中心位置。然而,我們明顯地知道這種單詞是與其它的單詞不同的。同樣地,在複雜網路中,有一些核心節點僅僅是因為處在了Hub的位置才與所有的節點都相連,而實際上它們並不與其它的節點相似。但是,DeepWalk演算法卻並不能區分這種位於高層次的節點。

因此,我們應該將雙曲幾何模型中的流行性考慮到機器學習演算法過程中。也許,我們通過將這種層次性的因素過濾掉之後,就可以更好地將同層次的節點嵌入到合適的向量空間中,而且在這樣做的過程中,我們或許可以自然地得到網路相似性空間的維度。

目前所有的網路嵌入演算法都是將維度作為一個外生變數引入的,我們並不能先驗地確定一個具體的空間維數。但是,如果我們將節點的層次性因素去掉之後,不斷提升嵌入空間的維度,就有可能得到誤差曲線的一個相變,於是這個臨界的維度值就應該是網路本身特徵空間的維度值。

統計物理

這個時候,張潘在白板上推導公式的場景再一次浮現在我的眼前。他從一個統計物理學家的特殊視角統一了幾大類計算問題。在他看來,所謂的極大似然估計和貝葉斯統計推斷不過是統計物理系統在不同溫度譜系上的特例。當我們將溫度這個閥門調節到0的時候,我們就得到了極大似然估計方法;而當我們將溫度調節到1的時候,就得到了貝葉斯統計推斷。物理學家強大的地方就在於,一旦他們看懂了一個問題,他們就能一下子把握住該問題的本質並作出推廣。

具體來講,很多計算問題的求解都存在著相變。比如,對於圖的染色問題,不同的網路對應著不同的難度。於是,我們便可以利用ISING模型來對這類組合優化問題進行建模,從而將統計物理學家發明的各類巧妙的近似方法(例如cavity方法)應用其中。

我猜,網路的空間嵌入也存在著類似的相變。為了求得每個節點在表示空間中的位置,我們就要去優化節點的位置變數,讓它們的總誤差最小。這很像ISING模型(嚴格說,應該是POTTS模型),其中節點是自旋,誤差是能量;也許維度D就是一個序參量,對它的調節會導致相變。於是,物理學家發明的一大套高明的技巧就可以被用來分析這一現象。

於是,我們看到了一條統一的道路:從量子糾纏到複雜網路,再到雙曲空間、機器學習和統計物理。當我看清了整個道路,就有了一種打通了七經八脈的感覺。也許,跨學科交叉的意義就在於此,它能讓你看到不同學科之間的深刻聯繫。

結語

五天時間一晃而去,儘管我們是在緊張的討論和學習中度過的,但是每一個人都對此次研讀營留下了深刻的印象。在最後的總結晚宴過程中,每一個人都表達了這次活動的效果遠遠超出預期的感受。

再見了,集智-凱風研讀營;再見了古北水鎮;再見了,令人尊敬的學者們;再見了,親愛的朋友們。

張江

於2016年10月

參考資料

[1] 尤亦莊關於本次研讀營課程的講義:

http://wiki.swarma.net/index.php/2016%E7%A0%94%E8%AF%BB%E8%90%A5%E4%B9%8B%E5%BC%A0%E9%87%8F%E7%BD%91%E7%BB%9C

[2] 關於量子資訊與量子計算:Michael Nielson &Issac L.Chuang, Quantum computation and quantum information, Cambridge University Press,2001

[3] 關於張量網路:https://arxiv.org/pdf/1106.1082v1.pdf

[4] 複雜網路的雙曲模型:Papadopoulos F, Kitsak M, Serrano MÁ, et al. Popularity versus similarity in growing networks[J]. Nature, 2012,489(7417): 537-540.

[5] 雙曲幾何:

http://wiki.swarma.net/index.php/%E5%8F%8C%E6%9B%B2%E7%A9%BA%E9%97%B4%E6%A8%A1%E5%9E%8B

[6] Word2Vec的相關論文:T. Mikolov, J. Kopecky´, L. Burget,O. Glembek and J. Cˇ ernocky´. Neural network based language models for higlyinflective languages, In: Proc. ICASSP 2009.]

[7] DeepWalk演算法: Bryan Perozzi, Rami Al-Rfou (2014)."DeepWalk: Online Learning of Social Representations". KDD.

[8] 演算法的統計物理(張潘總結的非常好的綜述材料):

http://wiki.swarma.net/index.php/2016%E7%A0%94%E8%AF%BB%E8%90%A5%E4%B9%8B%E7%BB%9F%E8%AE%A1%E7%89%A9%E7%90%86%EF%BC%8C%E7%BD%91%E7%BB%9C%E4%B8%8E%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0

編輯:Dandelion

推薦閱讀

記2017集智-凱風研讀營:機器學習、理論物理、計算社會學、複雜網路的碰撞

集智QQ群|292641157

商務合作|zhangqian@swarma.org

投稿轉載|wangting@swarma.org

◆ ◆ ◆

加入“沒有圍牆的研究所”