進行數據分析的目的與目標,想了解、回答與解的問題。
問題的發想,以及正確的提問。 **人事時地物、提問的角度與單位,Tableau---維度與度量、GA4---維度與指標。
A提問:練習句子的拆解
活動:兩人互動提問,進行問與答、層次深入(藉此獲得多個維度,並找出對應的定義、數據與可分析之處) 最近很流行的網路平台,那裏的商品很多非常便宜。
提問1:你覺得現在最紅的女明星是誰? 最近最紅的女歌手? 未來會當紅的女歌手?
B產出:產出與制定行動方案。
[探索資料 | Exploratory Data Analysis]
感興趣的問題(提問) ---> 取得資料 ---> 資料處理(清理與轉換) --->探索性分析 >> 統計分析(敘述性統計) & 資料視覺化 ***發覺隱藏在資料中的....結構、關聯、趨勢、知識.....
[數據分析四階段與類型]
描述性分析Descriptive Analysis | 資料之基礎整理與展示(總體描述),了解數據基本特徵與趨勢
診斷性分析Diagnosis Analysis | 識別與理解問題,找出潛在問題,以更有效解問題。
預測性分析Predictive Analysis | 一種統計技術,利用歷史資料預測未來可能結果。幫助決策,降低風險,最佳化資源分配,提高效率,如市場趨勢、顧客需求、產業變化。
處方性分析Prescriptive Analysis (Suggestive Analysis 建議性分析) | 針對數據分析結果進行詮釋,提出見解與洞察(行業know-how & why),根據數據分析所得結果提出對應建議方案(有價值的建議與方案)。
[常用圖形]
比較:直條或橫條圖。分類(非連續型資料),比較高低與差距,ex.區域數量、男女人數、類別銷售。
分布:直方圖(長條圖)。連續資料變化趨勢,ex.分數級距數量、各年齡層的平均收入高低。
重要:圓餅圖。資料間數值比例,ex.季別銷售、男女比例。
關聯:XY散佈圖。資料群間分布型態,兩個數據之相關、變數間關係、趨勢強弱,ex.身高與體重、英語分數與收入間之關係。
趨勢:折線圖。分類變化趨勢(非連續型資料),高低與差距,ex.歷年成績、四季銷售、月份觀光人次。
[地理角色] 縣市>州/省(分色) 鄉鎮市區>郡/縣 、經度/緯度。 縣市、鄉鎮 >建立階層,縣市直接點兩下出現地圖,點為中心。
經緯度-轉維度、再轉地理角色、經度-欄 緯度-列,以B01_測數執法設置點_維度與地理 為例。 縣市>州/省(色彩、標籤)
[關於地圖] 沖蝕 0>100 去掉地圖背景
[文字雲] EX1.先做好泡泡圖> 標記轉文字。 EX2. 商品名稱>色彩、商品名稱>文字、交易金額>大小 *標記>文字。
[新增圖形] 先準備好圖片,存放到Tableau儲存庫中的形狀資料夾內 (如下)
# /文件 /我的Tableau存放庫 / 圖形、新增資料夾放圖(網路上找的ICON)。 需自行新增與命名資料夾,再放入圖片檔!!
[TP多表格進行關聯] 直接在TP中,將三個表格進行關聯。
[資料轉換與清理]
(1)取消資料行樞紐:(以洲別、國家、多年份為例)
a.直接 資料>從表格/範圍 (會提示轉為表格)。 < ps. EXCEL資料表先轉為表格 > 資料>取得資料>從其他來源>從表格與範圍 >
b.進入Power Query - 洲別 國家 年份 (三個層次,可一次轉換)。
c.選需轉置之欄位-年份(洲別、國家不選) > 轉換 >取消資料行樞紐。 < ps. 取消其他資料行樞紐-數十個欄位時,改選洲別、國家,兩者公式效果一樣 >
(2)亂碼數據的處理:
文字資料處理(亂碼CSV):CSV亂碼先用記事本存成.txt,然後先打開EXCEL,再開.txt,會進入資料剖析即可。
可用筆記本開有亂碼的CSV檔,轉存時記得切換編碼為ANSI,存檔類型 選全部檔案,再存成.csv,再用EXCEL開啟。
## 表格 先拉 層級1 到列 數量(度量) 拉到表格內Abc >做成表格,再轉樹狀圖。 因為有建立階層> 做三個樹狀圖 標記/+大中小層集 (點+往下呈現)
依此類推 拿掉上一個階層, (不做階層也可以) A為階層1、B只保留 階層2、C只保留 階層3 (亦即C下鑽兩次)。 C:可以視狀況做進一步分組>色彩。
### 建立儀表板(大小:先自動) 拉入三個 樹狀ABC (整個檢視) ;還要設 連動效果(透明漏斗>白色漏斗)、A、B設漏斗;But 點B,A會只剩一個,以儀錶板輔助多層次地呈現 !
### p57 工具列 儀表板>動作 針對篩選條件 編輯 只管下一層。