-
獨家|武漢大學教授王瓊:大資料時代的媒介創新(精華筆記)
[導讀]本文選自鏑次中繼資料新聞研究中心創辦人、武漢大學媒體發展研究中心研究員、新聞傳播學院副教授、珞珈青年學者王瓊老師于2017年6月12日在清華大資料“應用·創新”系列講座——資料與媒介創新講座上的分享。資料的使用與價值已經成為清華學
2017-06-18 2 -
獨家|一文讀懂特徵工程
本文結構1. 概述機器學習被廣泛定義為“利用經驗來改善電腦系統的自身性能”。事實上,“經驗”在電腦中主要是以資料的形式存在的,因此資料是機器學習的前提和基礎。資料來源多種多樣,它可以是結構資料,如數值型、分類型,也可以是非結構資料,如文本
2017-06-18 3 -
數據蔣堂|不要對自助BI期望過高
作者:蔣步星本文長度為1800字,建議閱讀5分鐘本文分三個層面討論自助BI是否能夠真正滿足用戶需求。從早期的多維分析(OLAP)到近年來的敏捷BI,BI產品廠商一直在強調自助能力,宣稱可以由業務人員自己分析資料,而使用者方也常常有強烈的此
2017-06-17 0 -
獨家|手把手教線性回歸分析(附R語言實例)
本文長度為8619字,建議閱讀15分鐘本文為你介紹線性回歸分析。通常在現實應用中,我們需要去理解一個變數是如何被一些其他變數所決定的。回答這樣的問題,需要我們去建立一個模型。一個模型就是一個公式之中,一個因變數(dependent var
2017-06-12 5 -
資料蔣堂|報表的資料計算層,從四個方面分析獨立計算層的優勢
作者:蔣步星本文長度為1600字,建議閱讀4分鐘本文從四個方面分析獨立計算層的優勢。[導讀]我們在上一期【資料蔣堂】報表應用的三層結構一文中解釋了報表應用結構中資料計算層的必要性,以及可以使用報表工具自訂資料來源介面來實現計算層。本期我們
2017-06-10 0 -
獨家|淺談使用者行為資料的價值挖掘(PPT)
演講者:李丹楓本文長度為8765字,建議閱讀15分鐘本文探討分享了使用者行為資料的價值挖掘以及如何用使用者行為資料做金融風控。[導讀]如今,資料的概念已經被無限放大,人、事、物每天都在被資料化,從擁有資料、使用資料,到資料與人、場景、業務
2017-06-10 0 -
首席資料分析師教你怎麼一步步提升Kaggle競賽模型的精確度
作者:Werner Chao翻譯:白靜術語校對:黃凱波本文長度為2800字,建議閱讀8分鐘線上心理健康公司KaJin Health首席資料分析師教你怎麼一步步提升Kaggle競賽模型的精確度。最近,Kaggle競賽非常受歡迎,很多人都試圖
2017-06-06 10 -
資料蔣堂|報表應用的三層結構
本文長度為1700字,建議閱讀3分鐘本文為你分析報表應用的三層結構。在傳統的報表應用結構中,報表工具一般都是與資料來源直接連接,並沒有一個中間的資料計算層。確實,大部分情況下的報表開發並不需要這一層,相關的資料計算在資料來源和呈現環節分別
2017-06-04 0 -
獨家|一文讀懂數據視覺化
前言資料視覺化,是指將相對晦澀的的資料通過可視的、交互的方式進行展示,從而形象、直觀地表達資料蘊含的資訊和規律。早期的資料視覺化作為諮詢機構、金融企業的專業工具,其應用領域較為單一,應用形態較為保守。步入大資料時代,各行各業對資料的重視程
2017-06-01 6 -
獨家|基於百度時空大資料的城市計算(講座精華筆記)
[導讀]本文整理自2017年5月24日,百度自動駕駛事業部創始團隊成員、高級技術顧問秦偉俊博士在清華大資料“技術·前沿”系列講座之“基於百度時空大資料的城市計算”上的演講內容精華。一、城市計算的目標和概覽今天我從城市動力學(Urban D
2017-05-27 0 -
資料蔣堂|列式存儲的另一面,唯讀的分析計算任務探討列缺的缺點
作者:蔣步星本文長度為2400字,建議閱讀3分鐘本文針對唯讀的分析計算任務探討列存的缺點。列存是常見的資料存儲技術,在許多場景下也確實很有效,因而也被不少資料倉庫類產品採用,在業內列存也常常就意味著高性能。可是,列存真有這麼好嗎?搜索一下
2017-05-27 1 -
獨家|不容小覷,資料語言勢必預測未來(附圖文實錄)
[導讀]從智庫大資料、資訊大資料、傳統文化大資料、意識形態大資料、中文語義大資料到社會治理大資料等多個方面,基於資料線上,使我們與世界的關係發生了巨大的變化,而媒介這種傳播載體,從傳統形態轉變至新形態,也積極地見證並參與了這場全球互連資料
2017-05-25 1 -
獨家|教育研究的資料、證據和價值(三個小研究案列及困惑)
[導讀]本內容選自北京師範大學智慧學習研究院院長、長江學者黃榮懷教授,在2017年4月28日“清華大學資料之上的教育研究:清華大學教育大資料論壇”上的發言。黃榮懷老師的主要研究方向為教育技術、教育資訊化、智慧學習環境和智慧城市等。現任北京
2017-05-24 3 -
獨家|清華大學教育大資料論壇:教育研究的資料、證據和價值
[導讀]本內容選自北京師範大學智慧學習研究院院長、長江學者黃榮懷教授,在2017年4月28日“清華大學資料之上的教育研究:清華大學教育大資料論壇”上的發言。黃榮懷老師的主要研究方向為教育技術、教育資訊化、智慧學習環境和智慧城市等。現任北京
2017-05-18 1 -
獨家|一文讀懂聚類演算法
1. 聚類的基本概念1.1 定義聚類是資料採擷中的概念,就是按照某個特定標準(如距離)把一個資料集分割成不同的類或簇,使得同一個簇內的資料物件的相似性盡可能大,同時不在同一個簇中的資料物件的差異性也盡可能地大。也即聚類後同一類的資料盡可能
2017-05-14 3 -
獨家|60年人工智慧簡史
選自:KDnuggets News作者:決策科學家和資料分析師 Francesco Corea翻譯:王偉玲校對:葉龔兵本文長度為3400字,建議閱讀6分鐘本文對過去60年人工智慧的發展概況進行了簡要介紹。通過這篇文章,我們可以複習一下人工
2017-05-12 1 -
DataVisor:基於Spark平臺的智慧大資料網路反欺詐
[導讀]為了讓清華大學大資料能力提升專案的學生在基礎學習和科研的基礎之上,更好地瞭解大資料技術行業領域中的應用,清華-青島資料科學研究院支援開設了金融大資料方向《量化金融信用與風控分析》課程(課號:80470193)。本課程由清華大學交叉
2017-05-11 7 -
獨家|馬甯宇清華演講:運用大資料提升政府治理的貴州實踐
[前記]本文整理自在清華大學《大資料治理與政策》課上特邀演講者馬寧宇(清華大學自動化系校友、現任貴州省政府副秘書長、省大資料發展管理局局長)題為《運用大資料提升政府治理的貴州實踐》的報告的聽課筆記。2015年2月,首個國家大資料產業發展集
2017-05-09 1 -
資料蔣堂|1T數據到底有多大?
作者:蔣步星本文共1495字,建議閱讀3分鐘。本文蔣步星老師從時間與空間上講解了1T資料到底有多大。一英里不是個很長的距離,一立方英里相對於地球也不會讓人覺得是個很大的空間。然後我說,這個空間內能裝下全世界所有人,你會不會覺到很驚訝?不過
2017-05-09 3 -
獨家|一文讀懂關聯分析
前言關聯分析是資料採擷中一項基礎又重要的技術,是一種在大型資料庫中發現變數之間有趣關係的方法。說到資料採擷的案例,相信很多人都會首先想到沃爾瑪超市發現購買尿布的顧客通常也會購買啤酒,於是把啤酒和尿布放在一起銷售同時提高了兩者的銷量的案例。
2017-05-07 1