華文網

周子衡:關於“大資料”的幾則誤判|互聯網金融

文/北京磁雲唐泉金服科技有限公司首席經濟學家周子衡

什麼是“大資料”?

什麼是“大數據”?網路經濟時代,人們在經濟社會中的諸種活動通過網路帳戶體系來實現,這些活動也就是所謂的網路帳戶活動,其基本內容更多地體現為帳戶間的關係。這些帳戶活動及其帳戶關係是由數位網路程式所設定的、驅動的,且被即時地記錄下來。這就形成了所謂的“大資料”。因此,大資料來源於大量的網路帳戶的活動及其有效的記錄,

簡言之,大資料是網路帳戶資料。

有了大資料,人們對於經濟社會的認識與把握進入到一個全新的時代,特別是,當區塊鏈等技術的應用,使得資料的真實性、準確性、可追溯性等得以確保,這就使經濟社會進入到一個較資訊經濟更高位階的新階段,之所謂“數字經濟”。

那麼,“資訊經濟”中的“資訊”又是什麼?可以說,這些資訊是資料形態的,也可以是非資料形態的,即便是非常專業化的資訊,

也都是供“人”來解讀並由“人”來分析與處理的;“數位經濟”中的“數位”,就是一系列的數量繁巨、複雜多變的“資料”,識別、分析與處理這些資料則往往遠遠超出了人力的界限,也超出了人機結合的界限,必須交托計算程式自行處理,這就是所謂的“算力”問題。從這個意義上說,數位經濟是對資訊經濟的超越,是帳戶體系網路化擴展、深化,所帶來的程式化驅動與自運行的必然結果。

“大資料”是經濟社會中人們經濟活動網路化、帳戶化、數位化的反映而已,打個比方說,是經濟活動映射出的各類或多組“影子”而已。數字經濟時代,似乎“誰”“掌握”了大資料,就能夠對經濟活動乃至經濟社會做到“全知”,進而能夠“預知”經濟社會的未來,甚或能夠“全能性”地主宰經濟社會,這些都是關於“大資料”最為醒目的誤區所在;此外,有關“大資料”的誤區,還包括因肢解大資料所帶來的扭曲與謬誤。

大資料終將主宰經濟社會,

消滅經濟選擇的自由?

有人認為,大資料意味著“全知”,進而“全知”意味著“全能”,發展開去,大資料終將主宰經濟社會,消除個體差異,成就一元化的經濟體系。是為關乎大資料最大之謬誤!

“大資料”是“經濟自由”所投射下的數位影像,它無法反噬掉“經濟自由”,成為經濟社會的主宰。經濟社會中的大資料,是經濟活動的網路化、帳戶化、數位化的產物,

是經濟人自由意志的集合映射。換言之,沒有高度的經濟自由,沒有充分而多樣化的經濟選擇,不僅無所謂“大資料”可言,經濟資料更將急劇衰減乃至全面萎縮。

大資料就是社會經濟活動的一層“資料化的外衣”而已,不管它多麼帖服、合體或隨型,活動著的是裡面的“身體”,且這個“身體活動”是自由意志所決定的。如果認為,掌握了大資料就能影響乃至決定人們的經濟決策,將自身的意志貫徹到別人的頭上去,這就是本末倒置了,陷入到“人靠衣裝”、“佛靠金裝”的俗套了,甚或墮入“沐猴而冠”的把戲甚或“屎吃狗”的醜態中去了。

大資料是事物的表面,而非內裡。體檢報告上的“資料”反映出體檢者的身體狀況,但身體狀況並不是反過來由這些體檢資料所決定,更不是由那些填寫、保留、使用報告甚或拿著報告讀的人所決定的。大資料有價值、有功用,但是其自身並不具備所謂的“意志”,誰要是能夠給大資料添加上個“意志”,就好比為它“請”了個鬼神牌位,這種為大資料“施法”的愚蠢念頭,關乎科學意義上的“祛魅”。

那麼,是否有人能夠將自身的意志通過大資料來得以延展呢?這就像是在宣稱,即便不能神化大資料,但是可以神化掌握或擁有大資料地人。如此,便不是在講鬼故事,而是直接粉墨登場、客串來裝神扮鬼了。

養雞場可以為每只雞建立一個線上帳戶,由此產生所謂的“雞場大資料”。借此,場主似即可將自身的意志加諸於每只雞身上。真的如此嗎?對此,動物學家或養殖專家一定會對此嗤之以鼻。十幾個世紀之前,武則天曾強令百花在隆冬裡齊放,牡丹就是不從,這個典故眾所周知且耳熟能詳。動植物皆有其節律或意志,人類加諸於同類的意志尚不可為,何況施之於異類?

經濟社會的網路化、帳戶化及數位化,究竟是拓展了經濟自由的意志,還是反過頭來最終可以扼殺掉經濟自由呢?一種立場認為,技術始終是中立的。當真如此嗎?印刷出版、書報廣播、電報電話、鐵路與航太衛星、網路與資料技術,等等,這些技術創新、應用與普及也曾飽受爭議,甚或泛社會化與政治化,但最終都顯現出其巨大的價值傾向或道義立場。“大資料”本身是眾人自由意志活動的產物,是多樣化、差異化、自由化經濟選擇的反映。不管如何操弄議題,也不能使大資料反噬掉“經濟自由”。

究竟什麼才叫做“掌握了大資料”呢?直言之,正是一些謊稱掌握了大資料的人想對另一些被定義為沒有掌握大資料的人,施加無與倫比的權力意志。這個說法,沒有任何細思極恐的效果,反倒是格外地尷尬與搞笑。大資料時代,不乏刻舟求劍者的出現,其自認為是掌握了大資料的人,就此自詡為“全知者”,便放言可以隨意地支配與運用“大資料”,如此便似乎從“全知者”縱身一躍為“全能者”,幻想著可以用大資料消滅經濟選擇的自由。這就好比用經濟自由消滅經濟自由,用大資料反噬掉大資料。其如果不是“演”過了頭,那就一定是“扯”過了頭。

大資料能夠預知未來?

“全知”並非“全能”,“大資料”並不能“全能性”地預設未來,但是能否“先知”般地預知未來?同樣,做不到。因為,大資料在時間上是有約束條件的。

《舊約·傳道書》有雲,“日光之下,並無新事。”但舊事究竟如何重現?只要充分地瞭解已發生的事物,未來便無所遁形嗎?人們所熟悉的先知們,並不是所謂的歷史學家,也談不上什麼數學家。依憑歷史資料,能夠預知未來嗎?如果可行,那麼,先知們便無處不在、無時不在。我們或可文學性宣稱,歷史昭示著未來,但這在哲學上是危險的,將其上升為一種數理性的邏輯,更是艱困的,甚或根本無法企及的。即便歷史資料足夠全面、完整、有效,甚或及時,在邏輯上,也難以推斷出或確立起“歷史決定未來”的命題。

大資料是全量資料,源於事實,也是事實,它並非既有經濟理論變數性的函數分析,並不能在時間軸上理所應當地延展開去。在時間軸上,大資料終歸是局部的,遠非全量,它是實然的,是已發生的,即其性質上仍然是歷史資料而已。問題再一次提出,通過歷史資料能夠“預知”未來呢?

大資料本身不是先知,也沒有誰能通過大資料成為先知。基於大資料並不能建構所謂的“歷史規律”,更談不上把同大資料有所謂“關係”的某人或某類人嵌入到這一所謂的歷史規律中去,進而使其發揮主觀能動性,擔綱某種角色。歷史資料對於未來有一定的作用,但是根本上講,歷史資料並不能決定未來,換言之,未來並不是由歷史決定的。沒人能夠憑依大資料而可預知未來,成為先知。

歷史資料在多大程度上影響到未來呢?依憑大資料,如何更有效地預測未來呢?這只是相對以往諸般遠非那麼有效的預測而言的,終歸有所助益,然而,畢竟只是概率意義上的“預測”而已,絕非“預知”。人類經濟社會,就像是一盤永遠下不完的棋,沒人能夠準確地預判輸贏,遑論精確到輸贏多少。有了大資料,便無所不知,無所不能,這無疑是一種妄想——大資料既不是主宰世界的上帝,也不是預知未來的先知。

上帝究竟是在擲骰子,還是在作計畫?沒人知道,包括那些真假先知們。

大資料包攬一切資訊?

資料的標準化與格式化,決定了大資料不是“全息”的。

全知是指在一定標準或口徑下的全量資料,但並不意味著包攬所有資訊。資訊的完整性是一個抽象而複雜的問題。資料資訊往往是靜態的,是在一定時間點下的結論,其被有效地獲取甚或表達出來,就意味著一部分資訊是確定的、靜態的,而另一部分則不確定、動態的。這就好像貓的眼睛一樣,當你用相機去拍攝它時,它便發生變化,也就是必然丟失掉或隱去一部分資訊。所以,全知是就物件自身而言的,並非是與物件有關的全部資訊而言的。

現實中,人們對於大資料的感受確是非常豐滿有力、醒目而刺激的,這種情況一時間使人們感性上誤以為這就是全息的。事實上,這種情形以往也反復出現過,有如第一次聽到電話聽筒裡傳來另一端親友的話語,便以為那是真聲音;第一次看到大螢幕會被其上迎面開來的列車景象嚇到。確實,我們對於資料的感性認識,與對其的理性認知是兩回事。

資料與資料不同,這不僅體現在資料性質上,而且體現在資料階層與資料結構上。資料性質的不同,產生了資料結構問題,與資料關係問題,而資料關係又在影響著資料性質與結構。換言之,資料並非是均質的、平衡的。資料結構和資料關係,往往更是我們難以把握的。這就需要作謹慎有效的資料獲取、深刻全面的資料分析,以及有效的資料採擷。我們很難用一組兔子的資料來驗證另一組鴨子的狀況,或者說,這樣做是風險極大的。資料的界限和聯繫是非常複雜多變的。所有的資料之間存在著某種關係,但是,這些關聯需要不斷地被認識與發掘,而絕非是可以通過人為預設來加以限定或排除的。

事實上,大資料是在有限條件下的一種全量式的資料獲得,但是,它不是全息性質的,也根本做不到全息。如果認為,有了大資料的加持,經濟社會就成為全息的,甚或透明的世界,這實在是一種“幻覺”。慮不及此,類似“喜鵲叫喜,烏鴉叫喪”之類的“聯繫判斷”都可以得到所謂的“大資料”的支援。大資料使人們更趨謙卑,而非使人燥妄,那種有了大資料,便認為大資料無所不包,可以無所不知、無所不能,實為一大“虛妄”。上帝擲骰子嗎?假先知們跳出來爭辯那骰子究竟有多少個面,是為令人無語的怪誕行徑。

“大資料”當作“小資料”用?

經濟社會中,如果取得的資料樣本有限,就需要確立有效的分析框架,建立模型,確立函數關係,做回歸分析。然而,如果樣本不僅是充分的,而且是完整的,是全量的,那麼資料分析就要擺脫既有的舊模式了。從全樣本的大資料中,收窄樣本數量,只選取部分樣本用來分析,是一種縮量的方法,縮量樣本分析後的結論又要適用於總量,這就是對大資料的“小用”。

舉例來說,如果能夠獲得一個城鎮全部機動車以及全部外埠入城車輛的運行狀況,我們就可依所設議題來直接抓取資料,獲得結論。抽樣建模分析及其回歸分析,就不僅累贅,而且極有可能反鑄成大錯。簡單來說,大資料,就是扳手指頭數不過來的狀況,交給機器與程式去“扳”,不僅數得過來,而且數出來了。大資料往往更多地可以直接抓取並使用,而非在數理化、模型化、函數化等“加工”後再使用。

大資料具有完整性和全域性的特質,如果採用部分局部資料,然後試圖得出超出部分局部資料範圍的結論,這種既有的思維慣性,並不適用於大資料的邏輯和現實。大資料不能當作小資料用,小資料終歸拼不出完整的大資料。印度盲人摸象的故事講的就是避免以偏概全的道理,如果不是“摸”,而是帶著刀子去割,割下來再摸,再好的資料技術也拼不活那頭大象了。

編輯:丁開豔

歡 迎 訂 閱

深刻|思想|前瞻|實踐

專注于經濟金融政策解讀與建言的

智庫型全媒體平臺

更多原創請點擊下方閱讀原文

將自身的意志貫徹到別人的頭上去,這就是本末倒置了,陷入到“人靠衣裝”、“佛靠金裝”的俗套了,甚或墮入“沐猴而冠”的把戲甚或“屎吃狗”的醜態中去了。

大資料是事物的表面,而非內裡。體檢報告上的“資料”反映出體檢者的身體狀況,但身體狀況並不是反過來由這些體檢資料所決定,更不是由那些填寫、保留、使用報告甚或拿著報告讀的人所決定的。大資料有價值、有功用,但是其自身並不具備所謂的“意志”,誰要是能夠給大資料添加上個“意志”,就好比為它“請”了個鬼神牌位,這種為大資料“施法”的愚蠢念頭,關乎科學意義上的“祛魅”。

那麼,是否有人能夠將自身的意志通過大資料來得以延展呢?這就像是在宣稱,即便不能神化大資料,但是可以神化掌握或擁有大資料地人。如此,便不是在講鬼故事,而是直接粉墨登場、客串來裝神扮鬼了。

養雞場可以為每只雞建立一個線上帳戶,由此產生所謂的“雞場大資料”。借此,場主似即可將自身的意志加諸於每只雞身上。真的如此嗎?對此,動物學家或養殖專家一定會對此嗤之以鼻。十幾個世紀之前,武則天曾強令百花在隆冬裡齊放,牡丹就是不從,這個典故眾所周知且耳熟能詳。動植物皆有其節律或意志,人類加諸於同類的意志尚不可為,何況施之於異類?

經濟社會的網路化、帳戶化及數位化,究竟是拓展了經濟自由的意志,還是反過頭來最終可以扼殺掉經濟自由呢?一種立場認為,技術始終是中立的。當真如此嗎?印刷出版、書報廣播、電報電話、鐵路與航太衛星、網路與資料技術,等等,這些技術創新、應用與普及也曾飽受爭議,甚或泛社會化與政治化,但最終都顯現出其巨大的價值傾向或道義立場。“大資料”本身是眾人自由意志活動的產物,是多樣化、差異化、自由化經濟選擇的反映。不管如何操弄議題,也不能使大資料反噬掉“經濟自由”。

究竟什麼才叫做“掌握了大資料”呢?直言之,正是一些謊稱掌握了大資料的人想對另一些被定義為沒有掌握大資料的人,施加無與倫比的權力意志。這個說法,沒有任何細思極恐的效果,反倒是格外地尷尬與搞笑。大資料時代,不乏刻舟求劍者的出現,其自認為是掌握了大資料的人,就此自詡為“全知者”,便放言可以隨意地支配與運用“大資料”,如此便似乎從“全知者”縱身一躍為“全能者”,幻想著可以用大資料消滅經濟選擇的自由。這就好比用經濟自由消滅經濟自由,用大資料反噬掉大資料。其如果不是“演”過了頭,那就一定是“扯”過了頭。

大資料能夠預知未來?

“全知”並非“全能”,“大資料”並不能“全能性”地預設未來,但是能否“先知”般地預知未來?同樣,做不到。因為,大資料在時間上是有約束條件的。

《舊約·傳道書》有雲,“日光之下,並無新事。”但舊事究竟如何重現?只要充分地瞭解已發生的事物,未來便無所遁形嗎?人們所熟悉的先知們,並不是所謂的歷史學家,也談不上什麼數學家。依憑歷史資料,能夠預知未來嗎?如果可行,那麼,先知們便無處不在、無時不在。我們或可文學性宣稱,歷史昭示著未來,但這在哲學上是危險的,將其上升為一種數理性的邏輯,更是艱困的,甚或根本無法企及的。即便歷史資料足夠全面、完整、有效,甚或及時,在邏輯上,也難以推斷出或確立起“歷史決定未來”的命題。

大資料是全量資料,源於事實,也是事實,它並非既有經濟理論變數性的函數分析,並不能在時間軸上理所應當地延展開去。在時間軸上,大資料終歸是局部的,遠非全量,它是實然的,是已發生的,即其性質上仍然是歷史資料而已。問題再一次提出,通過歷史資料能夠“預知”未來呢?

大資料本身不是先知,也沒有誰能通過大資料成為先知。基於大資料並不能建構所謂的“歷史規律”,更談不上把同大資料有所謂“關係”的某人或某類人嵌入到這一所謂的歷史規律中去,進而使其發揮主觀能動性,擔綱某種角色。歷史資料對於未來有一定的作用,但是根本上講,歷史資料並不能決定未來,換言之,未來並不是由歷史決定的。沒人能夠憑依大資料而可預知未來,成為先知。

歷史資料在多大程度上影響到未來呢?依憑大資料,如何更有效地預測未來呢?這只是相對以往諸般遠非那麼有效的預測而言的,終歸有所助益,然而,畢竟只是概率意義上的“預測”而已,絕非“預知”。人類經濟社會,就像是一盤永遠下不完的棋,沒人能夠準確地預判輸贏,遑論精確到輸贏多少。有了大資料,便無所不知,無所不能,這無疑是一種妄想——大資料既不是主宰世界的上帝,也不是預知未來的先知。

上帝究竟是在擲骰子,還是在作計畫?沒人知道,包括那些真假先知們。

大資料包攬一切資訊?

資料的標準化與格式化,決定了大資料不是“全息”的。

全知是指在一定標準或口徑下的全量資料,但並不意味著包攬所有資訊。資訊的完整性是一個抽象而複雜的問題。資料資訊往往是靜態的,是在一定時間點下的結論,其被有效地獲取甚或表達出來,就意味著一部分資訊是確定的、靜態的,而另一部分則不確定、動態的。這就好像貓的眼睛一樣,當你用相機去拍攝它時,它便發生變化,也就是必然丟失掉或隱去一部分資訊。所以,全知是就物件自身而言的,並非是與物件有關的全部資訊而言的。

現實中,人們對於大資料的感受確是非常豐滿有力、醒目而刺激的,這種情況一時間使人們感性上誤以為這就是全息的。事實上,這種情形以往也反復出現過,有如第一次聽到電話聽筒裡傳來另一端親友的話語,便以為那是真聲音;第一次看到大螢幕會被其上迎面開來的列車景象嚇到。確實,我們對於資料的感性認識,與對其的理性認知是兩回事。

資料與資料不同,這不僅體現在資料性質上,而且體現在資料階層與資料結構上。資料性質的不同,產生了資料結構問題,與資料關係問題,而資料關係又在影響著資料性質與結構。換言之,資料並非是均質的、平衡的。資料結構和資料關係,往往更是我們難以把握的。這就需要作謹慎有效的資料獲取、深刻全面的資料分析,以及有效的資料採擷。我們很難用一組兔子的資料來驗證另一組鴨子的狀況,或者說,這樣做是風險極大的。資料的界限和聯繫是非常複雜多變的。所有的資料之間存在著某種關係,但是,這些關聯需要不斷地被認識與發掘,而絕非是可以通過人為預設來加以限定或排除的。

事實上,大資料是在有限條件下的一種全量式的資料獲得,但是,它不是全息性質的,也根本做不到全息。如果認為,有了大資料的加持,經濟社會就成為全息的,甚或透明的世界,這實在是一種“幻覺”。慮不及此,類似“喜鵲叫喜,烏鴉叫喪”之類的“聯繫判斷”都可以得到所謂的“大資料”的支援。大資料使人們更趨謙卑,而非使人燥妄,那種有了大資料,便認為大資料無所不包,可以無所不知、無所不能,實為一大“虛妄”。上帝擲骰子嗎?假先知們跳出來爭辯那骰子究竟有多少個面,是為令人無語的怪誕行徑。

“大資料”當作“小資料”用?

經濟社會中,如果取得的資料樣本有限,就需要確立有效的分析框架,建立模型,確立函數關係,做回歸分析。然而,如果樣本不僅是充分的,而且是完整的,是全量的,那麼資料分析就要擺脫既有的舊模式了。從全樣本的大資料中,收窄樣本數量,只選取部分樣本用來分析,是一種縮量的方法,縮量樣本分析後的結論又要適用於總量,這就是對大資料的“小用”。

舉例來說,如果能夠獲得一個城鎮全部機動車以及全部外埠入城車輛的運行狀況,我們就可依所設議題來直接抓取資料,獲得結論。抽樣建模分析及其回歸分析,就不僅累贅,而且極有可能反鑄成大錯。簡單來說,大資料,就是扳手指頭數不過來的狀況,交給機器與程式去“扳”,不僅數得過來,而且數出來了。大資料往往更多地可以直接抓取並使用,而非在數理化、模型化、函數化等“加工”後再使用。

大資料具有完整性和全域性的特質,如果採用部分局部資料,然後試圖得出超出部分局部資料範圍的結論,這種既有的思維慣性,並不適用於大資料的邏輯和現實。大資料不能當作小資料用,小資料終歸拼不出完整的大資料。印度盲人摸象的故事講的就是避免以偏概全的道理,如果不是“摸”,而是帶著刀子去割,割下來再摸,再好的資料技術也拼不活那頭大象了。

編輯:丁開豔

歡 迎 訂 閱

深刻|思想|前瞻|實踐

專注于經濟金融政策解讀與建言的

智庫型全媒體平臺

更多原創請點擊下方閱讀原文