close
新書推薦-「視覺化資料:100%全腦吸收大數據,直入神經元」書評
閱讀心得,心得感想,書評
內容簡介
◎千言萬語不如一圖,將文字及數字化為精簡的圖表,是處理巨量資料的第一步
◎我們常見的長條圖、餅狀圖、折線圖是怎麼來的?
◎當2維的圖表無法直接被感官吸收時,3維的圖表如何製作?
◎文字數字能視覺化,音樂呢?視訊呢?
◎視覺化的基礎為數學,這些數學公式的重要性為何?
◎目前全球領先的資料視覺化的機構及學術單位有哪些?
隨著資料時代的來臨,巨量資料的分析、採擷與視覺化已經成為資訊技術發展的迫切需求。面對目前科學視覺化、資訊視覺化、可視分析研究和應用的新形勢,需要發展新的複雜資料的處理、分析與視覺化方法,並圍繞實際科學和社會問題的求解設計高效的人機互動介面。
本書從研究者的角度,介紹了資料視覺化的定義、方法、功效和實用軟體,將目前全球最流行的資料視覺化做了一個最完整的介紹,也是技術性最強,實用性最接近真正應用的工具及理論書!
可作為初學者入門的精靈,是有關科學研究和教育人員從事視覺化研究和開發的一本實用的參考書。
◎我們常見的長條圖、餅狀圖、折線圖是怎麼來的?
◎當2維的圖表無法直接被感官吸收時,3維的圖表如何製作?
◎文字數字能視覺化,音樂呢?視訊呢?
◎視覺化的基礎為數學,這些數學公式的重要性為何?
◎目前全球領先的資料視覺化的機構及學術單位有哪些?
隨著資料時代的來臨,巨量資料的分析、採擷與視覺化已經成為資訊技術發展的迫切需求。面對目前科學視覺化、資訊視覺化、可視分析研究和應用的新形勢,需要發展新的複雜資料的處理、分析與視覺化方法,並圍繞實際科學和社會問題的求解設計高效的人機互動介面。
本書從研究者的角度,介紹了資料視覺化的定義、方法、功效和實用軟體,將目前全球最流行的資料視覺化做了一個最完整的介紹,也是技術性最強,實用性最接近真正應用的工具及理論書!
可作為初學者入門的精靈,是有關科學研究和教育人員從事視覺化研究和開發的一本實用的參考書。
目錄
基礎篇
01 資料視覺化簡介
1.1 視覺化釋義
1.2 視覺化簡史
1.3 資料視覺化詳解
1.3.1 資料科學的發展
1.3.2 資料視覺化的意義
1.3.3 資料視覺化分類
1.3.4 資料視覺化與其他學科領域的關係
1.4 資料視覺化研究挑戰
02 視覺感知與認知
2.1 視覺感知和認知
2.1.1 視覺感知和認知的定義
2.1.2 視覺感知處理過程
2.1.3 格式塔理論
2.2 顏色
2.2.1 顏色刺激理論
2.2.2 色彩空間
2.3 視覺編碼原則
2.3.1 相對判斷和視覺假像
2.3.2 標記和視覺通道
2.3.3 視覺通道的概念
2.3.4 視覺通道的特性
03 資料
3.1 資料釋義
3.1.1 資料基礎
3.1.2 資料科學及過程
3.2 資料取得和前置處理
3.2.1 資料取得
3.2.2 資料前置處理
3.3 資料組織與管理
3.3.1 資料清洗與精簡
3.3.2 資料整合與整合
3.3.3 資料庫
3.3.4 資料倉儲
3.4 資料分析與採擷
3.4.1 探索式資料分析
3.4.2 連線分析處理
3.4.3 資料採擷
3.5 資料工作流
3.6 資料科學的挑戰
04 資料視覺化基礎
4.1 資料視覺化基本框架
4.1.1 資料視覺化流程
4.1.2 資料視覺化設計
4.2 視覺化中的資料
4.2.1 資料認知
4.2.2 資料類型
4.3 視覺化的基本圖表
4.3.1 原始資料繪圖
4.3.2 簡單統計值標繪
4.3.3 多視圖協調連結
4.4 視覺化設計原則
4.4.1 資料到視覺化的直觀對映
4.4.2 視圖選擇與互動設計
4.4.3 資訊密度——資料的篩選
4.4.4 美學因素
4.4.5 動畫與過渡
4.4.6 視覺化隱喻
4.4.7 顏色與透明度
4.5 視覺化理論發展
4.5.1 圖形符號學
4.5.2 關係資料的圖形表示
4.5.3 圖形語法
4.5.4 基於資料類型的研究
4.5.5 基於資料狀態模型的研究
4.5.6 多維關聯式資料庫視覺化分析系統
時空資料篇
05 視覺感知與認知
5.1 一維純量場視覺化
5.2 二維純量場視覺化
5.2.1 顏色對映
5.2.2 等高線分析
5.2.3 高度圖
5.3 3D 純量場資料視覺化
5.3.1 空間資料表達
5.3.2 空間資料特徵計算
5.3.3 間接體繪製
5.3.4 規則3D 純量場的直接體視覺化
5.3.5 不規則體資料的體視覺化
06 地理資訊視覺化
6.1 地圖投影
6.1.1 墨卡托投影
6.1.2 亞爾勃斯投影
6.1.3 方位角投影
6.2 點資料的視覺化
6.3 線資料的視覺化
6.4 區域資料的視覺化
6.4.1 Choropleth 地圖
6.4.2 Cartogram
6.4.3 規則形狀地圖
6.4.4 多元關係地圖
6.5 地理資訊視覺化的應用
6.5.1 地球與生存環境
6.5.2 城市與日常生活
6.5.3 地理時空資料
6.5.4 複雜地理資料的可視分析
6.6 地理資訊視覺化的其他挑戰
6.6.1 地圖標記
6.6.2 地圖綜合
6.6.3 線上地圖
07 大規模多變數空間資料場視覺化
7.1 大規模空間純量場資料的即時體視覺化
7.1.1 大規模空間純量場資料的單機繪製
7.1.2 大規模空間純量場資料的平行繪製
7.1.3 時變空間純量場資料加速繪製方法
7.2 時變異質空間資料場的特徵追蹤與視覺化
7.2.1 時變空間純量場資料的特徵分析
7.2.2 異質資料的特徵融合
7.2.3 時變空間純量場資料的特徵追蹤
7.3 空間向量場資料視覺化
7.3.1 圖示法
7.3.2 幾何法
7.3.3 紋理法
7.3.4 拓撲法
7.4 空間張量場資料視覺化
7.4.1 張量場的數學描述
7.4.2 基於幾何的方法
7.4.3 基於紋理的方法
7.4.4 基於拓撲的方法
7.4.5 高階張量場視覺化
7.5 多變數空間資料場視覺化
7.5.1 多變數空間資料場的資料分析與表達
7.5.2 多變數空間資料場的視覺化與互動
08 時變資料視覺化
8.1 時間屬性的視覺化
8.1.1 線性和週期時間視覺化
8.1.2 日曆時間視覺化
8.1.3 分支和多角度時間視覺化
8.1.4 時間屬性的動態視覺化
8.2 多變數時變類型資料視覺化
8.2.1 基於線表示的視覺化
8.2.2 基於圖結構的視覺化
8.2.3 時間序列資料的視覺化互動
8.3 串流資料視覺化
8.3.1 串流資料視覺化模型
8.3.2 串流資料處理技術
8.3.3 串流資料視覺化案例
8.3.4 平行流計算框架
非時空資料篇
09 層次和網路資料視覺化
9.1 層次資料
9.1.1 層次資料的視覺化
9.1.2 節點- 連結法
9.1.3 空間填充法
9.1.4 其他方法
9.2 網路資料
9.2.1 網路和圖
9.2.2 網路資料視覺化
9.2.3 網路資料的地圖隱喻視覺化
9.2.4 超圖及其視覺化
9.2.5 動態網路資料視覺化
9.2.6 圖視覺化的視覺效果
9.2.7 圖視覺化中的互動
9.2.8 網路資料視覺化的挑戰
10 文字和文件視覺化
10.1 文字視覺化釋義
10.1.1 文字資訊的層級
10.1.2 文字視覺化的研究內容
10.1.3 文字視覺化流程
10.2 文字資訊分析基礎
10.2.1 分詞技術和詞幹分析
10.2.2 向量空間模型
10.2.3 主題取出
10.3 文字內容視覺化
10.3.1 基於關鍵字的文字內容視覺化
10.3.2 時序性的文字內容視覺化
10.3.3 文字特徵的分佈模式視覺化
10.3.4 情感分析視覺化
10.3.5 文件資訊檢索視覺化
10.3.6 軟體視覺化
10.4 文字關係視覺化
10.4.1 以圖為基礎的文字關係視覺化
10.4.2 文件集合關係視覺化
10.5 文字多層面資訊的可視表達
10.6 歸納
11 跨媒體資料視覺化
11.1 影像
11.1.1 影像網格
11.1.2 時空採樣
11.1.3 基於相似性的影像集視覺化
11.1.4 基於海塞圖的社交影像視覺化
11.2 視訊
11.2.1 視訊概要視覺化
11.2.2 視訊立方
11.2.3 視訊可視摘要
11.3 聲音與音樂
11.3.1 聲樂波形視覺化
11.3.2 聲樂結構的視覺化
11.4 超媒體
11.4.1 微博視覺化
11.4.2 社群網站視覺化
11.4.3 數位生活視覺化
12 複雜高維多中繼資料的視覺化
12.1 高維多中繼資料
12.1.1 空間對映法
12.1.2 圖示法
12.1.3 基於像素圖的方法
12.2 非結構化與異質資料的視覺化
12.2.1 非結構化資料
12.2.2 異質資料
12.3 大尺度資料的視覺化
12.3.1 基於平行的大尺度資料高解析度視覺化
12.3.2 大尺度資料的分而治之視覺化與分析
12.4 資料不確定性的視覺化
12.4.1 不確定性的基本定義
12.4.2 不確定性的來源
12.4.3 不確定性的視覺化方法
使用者篇
13 視覺化中的互動
13.1 互動準則
13.1.1 互動延遲時間
13.1.2 互動成本
13.1.3 互動場景變化
13.2 互動分類
13.2.1 按低階互動操作分類
13.2.2 按互動運算符號與空間分類
13.2.3 按互動工作分類
13.3 互動技術
13.3.1 選擇
13.3.2 導覽
13.3.3 重配
13.3.4 編碼
13.3.5 抽象/ 具象
13.3.6 過濾
13.3.7 連結
13.3.8 概覽+ 細節
13.3.9 焦點+ 上下文
13.4 互動與硬體裝置
13.4.1 互動環境
13.4.2 互動裝置
14 視覺化評測
14.1 評測流程
14.2 影響評測效度的因素
14.2.1 參與使用者
14.2.2 測試工作
14.2.3 資料類型
14.2.4 評測指標
14.3 評測方法
14.4 評測實例分析
14.5 歸納
15 針對領域的資料視覺化
15.1 高性能科學計算
15.1.1 高性能科學視覺化的挑戰
15.1.2 重要資訊的分析和顯示
15.1.3 原位視覺化
15.1.4 未來挑戰
15.2 生命科學
15.2.1 臨床醫學影像
15.2.2 其他影像
15.2.3 電生理訊號
15.2.4 OMICS 組學
15.3 其他科學與藝術
15.3.1 氣候學與氣象中的視覺化
15.3.2 針對藝術的表意性視覺化
15.4 網路與系統安全的視覺化
15.4.1 基於可視轉換的蟲洞攻擊視覺化
15.4.2 可信計算的視覺化
15.4.3 安全性記錄檔資料的視覺化
15.5 商業智慧視覺化
15.5.1 商業智慧
15.5.2 商業智慧中的資料視覺化
15.5.3 未來趨勢
15.6 金融資料視覺化
15.6.1 金融視覺化圖表元素
15.6.2 金融資料可視分析
16 視覺化研究與開發資源
16.1 視覺化軟體
16.1.1 醫學視覺化軟體
16.1.2 科學視覺化軟體
16.1.3 資訊視覺化軟體
16.1.4 可視分析軟體
16.2 視覺化開發工具
16.2.1 應用程式開發工具
16.2.2 Web 應用程式開發工具
16.3 資料分析和資料採擷軟體與開發工具
16.4 視覺化資料集資源
16.5 視覺化資訊資源
16.6 視覺化研究機構
16.6.1 中國大陸視覺化科學研究機構
16.6.2 海外視覺化科學研究機構
01 資料視覺化簡介
1.1 視覺化釋義
1.2 視覺化簡史
1.3 資料視覺化詳解
1.3.1 資料科學的發展
1.3.2 資料視覺化的意義
1.3.3 資料視覺化分類
1.3.4 資料視覺化與其他學科領域的關係
1.4 資料視覺化研究挑戰
02 視覺感知與認知
2.1 視覺感知和認知
2.1.1 視覺感知和認知的定義
2.1.2 視覺感知處理過程
2.1.3 格式塔理論
2.2 顏色
2.2.1 顏色刺激理論
2.2.2 色彩空間
2.3 視覺編碼原則
2.3.1 相對判斷和視覺假像
2.3.2 標記和視覺通道
2.3.3 視覺通道的概念
2.3.4 視覺通道的特性
03 資料
3.1 資料釋義
3.1.1 資料基礎
3.1.2 資料科學及過程
3.2 資料取得和前置處理
3.2.1 資料取得
3.2.2 資料前置處理
3.3 資料組織與管理
3.3.1 資料清洗與精簡
3.3.2 資料整合與整合
3.3.3 資料庫
3.3.4 資料倉儲
3.4 資料分析與採擷
3.4.1 探索式資料分析
3.4.2 連線分析處理
3.4.3 資料採擷
3.5 資料工作流
3.6 資料科學的挑戰
04 資料視覺化基礎
4.1 資料視覺化基本框架
4.1.1 資料視覺化流程
4.1.2 資料視覺化設計
4.2 視覺化中的資料
4.2.1 資料認知
4.2.2 資料類型
4.3 視覺化的基本圖表
4.3.1 原始資料繪圖
4.3.2 簡單統計值標繪
4.3.3 多視圖協調連結
4.4 視覺化設計原則
4.4.1 資料到視覺化的直觀對映
4.4.2 視圖選擇與互動設計
4.4.3 資訊密度——資料的篩選
4.4.4 美學因素
4.4.5 動畫與過渡
4.4.6 視覺化隱喻
4.4.7 顏色與透明度
4.5 視覺化理論發展
4.5.1 圖形符號學
4.5.2 關係資料的圖形表示
4.5.3 圖形語法
4.5.4 基於資料類型的研究
4.5.5 基於資料狀態模型的研究
4.5.6 多維關聯式資料庫視覺化分析系統
時空資料篇
05 視覺感知與認知
5.1 一維純量場視覺化
5.2 二維純量場視覺化
5.2.1 顏色對映
5.2.2 等高線分析
5.2.3 高度圖
5.3 3D 純量場資料視覺化
5.3.1 空間資料表達
5.3.2 空間資料特徵計算
5.3.3 間接體繪製
5.3.4 規則3D 純量場的直接體視覺化
5.3.5 不規則體資料的體視覺化
06 地理資訊視覺化
6.1 地圖投影
6.1.1 墨卡托投影
6.1.2 亞爾勃斯投影
6.1.3 方位角投影
6.2 點資料的視覺化
6.3 線資料的視覺化
6.4 區域資料的視覺化
6.4.1 Choropleth 地圖
6.4.2 Cartogram
6.4.3 規則形狀地圖
6.4.4 多元關係地圖
6.5 地理資訊視覺化的應用
6.5.1 地球與生存環境
6.5.2 城市與日常生活
6.5.3 地理時空資料
6.5.4 複雜地理資料的可視分析
6.6 地理資訊視覺化的其他挑戰
6.6.1 地圖標記
6.6.2 地圖綜合
6.6.3 線上地圖
07 大規模多變數空間資料場視覺化
7.1 大規模空間純量場資料的即時體視覺化
7.1.1 大規模空間純量場資料的單機繪製
7.1.2 大規模空間純量場資料的平行繪製
7.1.3 時變空間純量場資料加速繪製方法
7.2 時變異質空間資料場的特徵追蹤與視覺化
7.2.1 時變空間純量場資料的特徵分析
7.2.2 異質資料的特徵融合
7.2.3 時變空間純量場資料的特徵追蹤
7.3 空間向量場資料視覺化
7.3.1 圖示法
7.3.2 幾何法
7.3.3 紋理法
7.3.4 拓撲法
7.4 空間張量場資料視覺化
7.4.1 張量場的數學描述
7.4.2 基於幾何的方法
7.4.3 基於紋理的方法
7.4.4 基於拓撲的方法
7.4.5 高階張量場視覺化
7.5 多變數空間資料場視覺化
7.5.1 多變數空間資料場的資料分析與表達
7.5.2 多變數空間資料場的視覺化與互動
08 時變資料視覺化
8.1 時間屬性的視覺化
8.1.1 線性和週期時間視覺化
8.1.2 日曆時間視覺化
8.1.3 分支和多角度時間視覺化
8.1.4 時間屬性的動態視覺化
8.2 多變數時變類型資料視覺化
8.2.1 基於線表示的視覺化
8.2.2 基於圖結構的視覺化
8.2.3 時間序列資料的視覺化互動
8.3 串流資料視覺化
8.3.1 串流資料視覺化模型
8.3.2 串流資料處理技術
8.3.3 串流資料視覺化案例
8.3.4 平行流計算框架
非時空資料篇
09 層次和網路資料視覺化
9.1 層次資料
9.1.1 層次資料的視覺化
9.1.2 節點- 連結法
9.1.3 空間填充法
9.1.4 其他方法
9.2 網路資料
9.2.1 網路和圖
9.2.2 網路資料視覺化
9.2.3 網路資料的地圖隱喻視覺化
9.2.4 超圖及其視覺化
9.2.5 動態網路資料視覺化
9.2.6 圖視覺化的視覺效果
9.2.7 圖視覺化中的互動
9.2.8 網路資料視覺化的挑戰
10 文字和文件視覺化
10.1 文字視覺化釋義
10.1.1 文字資訊的層級
10.1.2 文字視覺化的研究內容
10.1.3 文字視覺化流程
10.2 文字資訊分析基礎
10.2.1 分詞技術和詞幹分析
10.2.2 向量空間模型
10.2.3 主題取出
10.3 文字內容視覺化
10.3.1 基於關鍵字的文字內容視覺化
10.3.2 時序性的文字內容視覺化
10.3.3 文字特徵的分佈模式視覺化
10.3.4 情感分析視覺化
10.3.5 文件資訊檢索視覺化
10.3.6 軟體視覺化
10.4 文字關係視覺化
10.4.1 以圖為基礎的文字關係視覺化
10.4.2 文件集合關係視覺化
10.5 文字多層面資訊的可視表達
10.6 歸納
11 跨媒體資料視覺化
11.1 影像
11.1.1 影像網格
11.1.2 時空採樣
11.1.3 基於相似性的影像集視覺化
11.1.4 基於海塞圖的社交影像視覺化
11.2 視訊
11.2.1 視訊概要視覺化
11.2.2 視訊立方
11.2.3 視訊可視摘要
11.3 聲音與音樂
11.3.1 聲樂波形視覺化
11.3.2 聲樂結構的視覺化
11.4 超媒體
11.4.1 微博視覺化
11.4.2 社群網站視覺化
11.4.3 數位生活視覺化
12 複雜高維多中繼資料的視覺化
12.1 高維多中繼資料
12.1.1 空間對映法
12.1.2 圖示法
12.1.3 基於像素圖的方法
12.2 非結構化與異質資料的視覺化
12.2.1 非結構化資料
12.2.2 異質資料
12.3 大尺度資料的視覺化
12.3.1 基於平行的大尺度資料高解析度視覺化
12.3.2 大尺度資料的分而治之視覺化與分析
12.4 資料不確定性的視覺化
12.4.1 不確定性的基本定義
12.4.2 不確定性的來源
12.4.3 不確定性的視覺化方法
使用者篇
13 視覺化中的互動
13.1 互動準則
13.1.1 互動延遲時間
13.1.2 互動成本
13.1.3 互動場景變化
13.2 互動分類
13.2.1 按低階互動操作分類
13.2.2 按互動運算符號與空間分類
13.2.3 按互動工作分類
13.3 互動技術
13.3.1 選擇
13.3.2 導覽
13.3.3 重配
13.3.4 編碼
13.3.5 抽象/ 具象
13.3.6 過濾
13.3.7 連結
13.3.8 概覽+ 細節
13.3.9 焦點+ 上下文
13.4 互動與硬體裝置
13.4.1 互動環境
13.4.2 互動裝置
14 視覺化評測
14.1 評測流程
14.2 影響評測效度的因素
14.2.1 參與使用者
14.2.2 測試工作
14.2.3 資料類型
14.2.4 評測指標
14.3 評測方法
14.4 評測實例分析
14.5 歸納
15 針對領域的資料視覺化
15.1 高性能科學計算
15.1.1 高性能科學視覺化的挑戰
15.1.2 重要資訊的分析和顯示
15.1.3 原位視覺化
15.1.4 未來挑戰
15.2 生命科學
15.2.1 臨床醫學影像
15.2.2 其他影像
15.2.3 電生理訊號
15.2.4 OMICS 組學
15.3 其他科學與藝術
15.3.1 氣候學與氣象中的視覺化
15.3.2 針對藝術的表意性視覺化
15.4 網路與系統安全的視覺化
15.4.1 基於可視轉換的蟲洞攻擊視覺化
15.4.2 可信計算的視覺化
15.4.3 安全性記錄檔資料的視覺化
15.5 商業智慧視覺化
15.5.1 商業智慧
15.5.2 商業智慧中的資料視覺化
15.5.3 未來趨勢
15.6 金融資料視覺化
15.6.1 金融視覺化圖表元素
15.6.2 金融資料可視分析
16 視覺化研究與開發資源
16.1 視覺化軟體
16.1.1 醫學視覺化軟體
16.1.2 科學視覺化軟體
16.1.3 資訊視覺化軟體
16.1.4 可視分析軟體
16.2 視覺化開發工具
16.2.1 應用程式開發工具
16.2.2 Web 應用程式開發工具
16.3 資料分析和資料採擷軟體與開發工具
16.4 視覺化資料集資源
16.5 視覺化資訊資源
16.6 視覺化研究機構
16.6.1 中國大陸視覺化科學研究機構
16.6.2 海外視覺化科學研究機構
序
推薦序
Big Data 時代來臨,從前習慣將資料分類,使用統計的方式找出規律。但在Big Data 時代,每一筆資料都要被重視(Every piece of data counts)。還好硬體技術不斷進步,再加上雲端時代的資源合理分配,電腦及網路幫了極大的忙,讓我們真的可以深入每一筆資料找出重點,而非簡單的分類及整合而已。
然而到了公元2020 年,我們將擁有44ZB 的資料量( 資料來源EMC),44ZB 的資料量是多少呢?
44 X 1,000,000,000,000,000,000,000 個位元組。在看慣了超大資料的我們可能對這後面的21 個0 沒什麼感覺,但換個方式來看,用最新的iPhone 6 64GB 的大小來裝這些資料疊起來,可以來回地球和月球15 次!數值只要一進入天文數字,就進入了數學家的領域,真正面對資料的使用者也就麻木了。事實上,到2020 年為止,就算莫爾定律可行,屆時的電腦計算能力,很可能剛剛好處理這些資料而已,硬體及軟體的能力也得隨著資料量一直演化。
就算電腦做到了,人腦呢? 目前世界上還沒出現Lucy 中的100% 全腦人類,你我都是平凡人,還是得不斷消化這些資料成為有用的資訊,這麼大量的資料及資訊,科學家不斷找出最適合人類吸收的方式。千語萬語不如一圖,有圖有真相,用視覺化的方式把資料映射到人腦中,一直是最好的方式。
技術及理論的書籍,極少出現在中文的出版物中,偏尋英文書籍,提到資料視覺化的書也寥寥無幾。這本由真正專業及投入資料視覺化的學者所撰寫的書,在2013 年底看到書時,就一頭栽入,就算不是數學或統計專業的讀者,也有強大的吸引力。這本難得一見的好書,絕對是你我應付大數據時代的重要工具之一。
今日我們面對全數位化的Big Data 世界,有如原始人面對浩瀚的無垠銀河,還好我們擁有了處理這些無限大資料的基礎,相信你我都不會迷失在這些0 與1 的巨流中。
胡嘉璽
Big Data 時代來臨,從前習慣將資料分類,使用統計的方式找出規律。但在Big Data 時代,每一筆資料都要被重視(Every piece of data counts)。還好硬體技術不斷進步,再加上雲端時代的資源合理分配,電腦及網路幫了極大的忙,讓我們真的可以深入每一筆資料找出重點,而非簡單的分類及整合而已。
然而到了公元2020 年,我們將擁有44ZB 的資料量( 資料來源EMC),44ZB 的資料量是多少呢?
44 X 1,000,000,000,000,000,000,000 個位元組。在看慣了超大資料的我們可能對這後面的21 個0 沒什麼感覺,但換個方式來看,用最新的iPhone 6 64GB 的大小來裝這些資料疊起來,可以來回地球和月球15 次!數值只要一進入天文數字,就進入了數學家的領域,真正面對資料的使用者也就麻木了。事實上,到2020 年為止,就算莫爾定律可行,屆時的電腦計算能力,很可能剛剛好處理這些資料而已,硬體及軟體的能力也得隨著資料量一直演化。
就算電腦做到了,人腦呢? 目前世界上還沒出現Lucy 中的100% 全腦人類,你我都是平凡人,還是得不斷消化這些資料成為有用的資訊,這麼大量的資料及資訊,科學家不斷找出最適合人類吸收的方式。千語萬語不如一圖,有圖有真相,用視覺化的方式把資料映射到人腦中,一直是最好的方式。
技術及理論的書籍,極少出現在中文的出版物中,偏尋英文書籍,提到資料視覺化的書也寥寥無幾。這本由真正專業及投入資料視覺化的學者所撰寫的書,在2013 年底看到書時,就一頭栽入,就算不是數學或統計專業的讀者,也有強大的吸引力。這本難得一見的好書,絕對是你我應付大數據時代的重要工具之一。
今日我們面對全數位化的Big Data 世界,有如原始人面對浩瀚的無垠銀河,還好我們擁有了處理這些無限大資料的基礎,相信你我都不會迷失在這些0 與1 的巨流中。
胡嘉璽
文章標籤
全站熱搜
留言列表