您的位置:首頁>正文

當機器學習與社交網路在一起時 你的小秘密就會被讀出來

(原標題:5 secrets machine learning knows about you from your social media posts)

網易科技訊 3月29日消息, 據VentureBeat報導, 當Cambridge Analytica等大資料公司宣稱自己影響到2016年美國總統大選後, 它們立刻成為媒體關注的重點。

這些公司通過社交媒體貼文和協力廠商資料推斷出使用者的性格特徵, 並利用高度可操縱化的廣告影響民意。 利用購物習慣、雜誌訂閱、Facebook“點贊”以及其他高達5000項輸入等大量資料, Cambridge Analytica等公司可以對美國2.2億成年人的性格作出預測。

有了這些非常詳細的“檔案”,

Cambridge Analytica就可以針對你的性格進行“行為微定位”。 但是這家公司並非唯一這樣做的機構。 財富500強企業的品牌行銷員、數字廣告上以及各種各樣的分析公司, 都在通過分析社交媒體和公開貼文尋找影響消費者的更好機會。 初步研究顯示, 針對消費者性格推出的廣告, 在Facebook上獲得點擊率高達63%。

如果你在Facebook或Twitter上非常活躍, 你的社交媒體資料可能洩露你的很多資訊, 這些資訊可被廣告商利用。 美國賓夕法尼亞大學電腦科學教授賴爾·昂加爾(Lyle Ungar)利用他的職業發展統計和機器學習方法從文本中提取洞見, 重點關注你的Facebook和Twitter貼文, 特別是與你的健康和福祉有關的內容。

經過對你社交媒體行為進行數年研究, 昂加爾及其團隊可以對你做出以下五項推測:

1.年齡和性別

女性來自金星, 男性來自火星。 當你分析男女在社交媒體上使用的語言時, 這種區別就更加明顯。 女性更多使用情緒詞彙、第一人稱, 更多提及心理和社交過程。 而男性大量使用髒話和遊戲術語, 他們的佔有欲更強, 比如總會加上“我的妻子”、“我的女友”, 女性則只使用丈夫或男友。

在自我表達過程中, 男女在年齡方面的差異也很大。 即使使用類似短語, 也可以看出你是否足夠“成熟”。 昂加爾及其團隊在MyPersonality專案中分析了7.5萬份Facebook資料, 才得出上訴結論。 如果你覺得好奇, 可以在昂加爾的網站(http://www.wwbp.org/agegender.html)上嘗試下年齡或性別預測, 看看其預測模型是否足夠準確。

2.性格特徵

麥爾斯-布瑞格斯性格類型指標(Myers-Briggs)可能很受歡迎, 開放性、盡責性、外向性、宜人性以及神經質等五大性格特徵, 在預測中表現出更高的預測價值。 但性格特徵畢竟不是實物, 你不可能精確到小數點後多少位。 在最好的情況下, 在進行實際預測時, 研究人員會發現“弱陽性”和“負相關性”。

如果你想知道自己在神經質測試中得分多少,IPIP-300是可用到的更全面測試之一。你也可以使用昂加爾的社交媒體資料分析法。除了年齡和性別,性格特徵在我們的語言表達中也截然不同。顯然,外向性的人等不及參加派對,而內向性的人多沉迷於動漫、互聯網以及遊戲等。

即使個人資料中的照片選擇,也會洩露我們的性格特徵。性格非常開放的人更有可能選擇藝術性和非正統性照片,而且這些照片都不是他們自己的面孔。他們也有更好的審美感,選擇對比對、清晰度以及飽和度更高的照片。而盡責性的人則會做出相反的選擇,他們通常張貼自己的正面照,而且只有臉部。外向性的人傾向於張貼自己與其他人的合影。

3.職業

如果你沒有與職業社交網站LinkedIn上的人聯繫,你可能不會去看他們的資料和當前職位。事實證明,他們在Twitter上的公開發言也可能隱秘地揭示這個資訊。這並不令人感到驚訝。高管們通常會寫有關商業或金融新聞方面的東西,而低級職員會用更多時間討論個人興趣愛好,而非與工作相關的主題。昂加爾的同事丹尼爾·彼得洛(Daniel Preotiuc-Pietro)及其團隊能夠通過分析Twitter上的用語,非常準確地分析出某人的職業。

4.自戀與精神變態者

通過社交媒體語言,你還可以發現令人毛骨悚然的東西。自戀者追求聲望、地位以及其他人的豔羨,而精神變態者缺乏悔念、敏感性,對道德毫不關心。喜好權謀的人故意操縱和利用其他人實現自己的目標。這些人類行為的陰暗面可被合併稱為“黑暗三弦”。正如預期的那樣,精神變態者更多使用攻擊性和暴力語言,比如殺戮、憤怒以及其他負面情緒用語。權謀者大量使用垃圾郵件和廣告貼文。行為分析也可發現這些性格特徵。自戀者更有可能發佈涉及地理位置的推文,不太可能發佈重複性貼文或標籤,這顯示他們對推文進行了精心策劃。

5.死於心臟病的可能性

在2015年研究論文中,昂加爾及其團隊描述了一種模式,只使用Twitter上的資料就能預測心臟病的死亡率,甚至比其他傳統因素(包括人口、社會經濟)與健康危險因素(比如吸煙、糖尿病、高血壓以及肥胖)相結合的方法更準確。在人際關係惡劣和慢性壓力下,心臟病會加重。昂加爾及其團隊追蹤反映負面社會交往、負面情緒(比如憤怒)以及脫離社會的語言,這些標誌都是心血管疾病死亡的更精確預兆。(小小)

標籤: 機器學習 機器學習服務 社交網路 社交網路廣告 互聯網安全( 責任編輯:範義虎)

如果你想知道自己在神經質測試中得分多少,IPIP-300是可用到的更全面測試之一。你也可以使用昂加爾的社交媒體資料分析法。除了年齡和性別,性格特徵在我們的語言表達中也截然不同。顯然,外向性的人等不及參加派對,而內向性的人多沉迷於動漫、互聯網以及遊戲等。

即使個人資料中的照片選擇,也會洩露我們的性格特徵。性格非常開放的人更有可能選擇藝術性和非正統性照片,而且這些照片都不是他們自己的面孔。他們也有更好的審美感,選擇對比對、清晰度以及飽和度更高的照片。而盡責性的人則會做出相反的選擇,他們通常張貼自己的正面照,而且只有臉部。外向性的人傾向於張貼自己與其他人的合影。

3.職業

如果你沒有與職業社交網站LinkedIn上的人聯繫,你可能不會去看他們的資料和當前職位。事實證明,他們在Twitter上的公開發言也可能隱秘地揭示這個資訊。這並不令人感到驚訝。高管們通常會寫有關商業或金融新聞方面的東西,而低級職員會用更多時間討論個人興趣愛好,而非與工作相關的主題。昂加爾的同事丹尼爾·彼得洛(Daniel Preotiuc-Pietro)及其團隊能夠通過分析Twitter上的用語,非常準確地分析出某人的職業。

4.自戀與精神變態者

通過社交媒體語言,你還可以發現令人毛骨悚然的東西。自戀者追求聲望、地位以及其他人的豔羨,而精神變態者缺乏悔念、敏感性,對道德毫不關心。喜好權謀的人故意操縱和利用其他人實現自己的目標。這些人類行為的陰暗面可被合併稱為“黑暗三弦”。正如預期的那樣,精神變態者更多使用攻擊性和暴力語言,比如殺戮、憤怒以及其他負面情緒用語。權謀者大量使用垃圾郵件和廣告貼文。行為分析也可發現這些性格特徵。自戀者更有可能發佈涉及地理位置的推文,不太可能發佈重複性貼文或標籤,這顯示他們對推文進行了精心策劃。

5.死於心臟病的可能性

在2015年研究論文中,昂加爾及其團隊描述了一種模式,只使用Twitter上的資料就能預測心臟病的死亡率,甚至比其他傳統因素(包括人口、社會經濟)與健康危險因素(比如吸煙、糖尿病、高血壓以及肥胖)相結合的方法更準確。在人際關係惡劣和慢性壓力下,心臟病會加重。昂加爾及其團隊追蹤反映負面社會交往、負面情緒(比如憤怒)以及脫離社會的語言,這些標誌都是心血管疾病死亡的更精確預兆。(小小)

標籤: 機器學習 機器學習服務 社交網路 社交網路廣告 互聯網安全( 責任編輯:範義虎)

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示