Power BI 2023/04/2(五) 第六堂
取得資料import data > 處理資料(轉換資料)-處理欄位 新增欄位(自訂資料行 條件資料行) 刪欄位(移除資料行) 刪除列資料(橫的 移除資料列)
合併資料(合併查詢>變寬 附加查詢>變長-增加資料筆數) 切割字串(分割資料行/資料剖析)
建立量值DAX(新增量值 PBI核心 *公式計算 計算出一個數字) *新增資料行是多出一整個資料行。 建立資料關聯
選合適圖表 基本款圖表 擴充圖表... Power BI視覺效果 需要帳號連入(可以打包下載 分享他人) 選定圖表樣式>細節調整(標題調整) *
*輔助線 扇子切頁 >常數線 *善用分頁功能 *發行到雲端工作區(發行會停在最後分頁上 建議回到第一頁或主要頁再發行 使用365)
雲端工作區>檔案>內嵌報表>發表到Web(公開)
#日期格式是可以有階層的。
ChatGPT Power BI(Business Intelligence)+ AIGC Artificial Intelligence Generated Content ai.com #如何精確地提出需求
你是一個十分有經驗的Power BI設計師 請提供我一些設計圖表的建議 以下是我的資料
我的資料有YOUBIKE的站點、每個站點的地理位置、每個站的總提車格數、目前可租借數
請幫我寫一個可以計算空車率的DAX表示法。
prompt 請問生成一個醫療產業在病患資訊上的儀表板需要包含什麼資訊以及適用的圖表為何
有沒有辦法再提供更具體一點的想像? MidJourney 讓Dall-E生成dashboard模板 #Microsoft Bing image creator https://www.bing.com/create
Create a Power BI dashboard for the fashion industry 輔助創作 在Midjourney試試看(僅支援英文)
如何精準地提出需求? 讓ChatGPT幫我們下指令 #之後也可透過AI產生圖表(不一一自己拉)
1.Define Question> 2.Import Data> 3.Processing Data> 4.Design Dashboard> 5.Get Insight> 6.Publish Dashboard YT: Power BI ChatGPT
kaggle 搜 kaggle kkbox https://www.kaggle.com/competitions/kkbox-music-recommendation-challenge/data 下載4個即可 做關聯
譯碼簿(分析資料的第一簿) 瞭解資料
PowerBI取得資料 .CSV train member songs載入 >song_extra_info 轉換資料(使用第一行作為標頭) 關聯
train(msno)多:1(msno)members
train(song_id)多:1(song_id)songs
train(song_id)多:1(song_id)song_extra_info
song_extra_info(song_id)1:1(song_id)songs
管理關聯性
問題1: 撥放次數最高的歌是哪一首與歌手是誰? 1:23
>> song_id的計數
註冊日期 轉換資料PQ資料格式可強制換成日期 繪製註冊會員數與日期趨勢
PBI 放大鏡>參考線 可輸入 也可公式 取平均線
註冊日期 改成日期格式(ABC改成日期 PQ/常用 轉換 資料類型)
看時間區段內的註冊數、歌手篩選器、播放總次數字卡
train.csv
msno: user id
song_id: song id
source_system_tab: the name of the tab where the event was triggered. System tabs are used to categorize KKBOX mobile apps functions. For example, tab my library contains functions to manipulate the local storage, and tab search contains functions relating to search.
source_screen_name: name of the layout a user sees.
source_type: an entry point a user first plays music on mobile apps. An entry point could be album, online-playlist, song .. etc.
target: this is the target variable. target=1 means there are recurring listening event(s) triggered within a month after the user’s very first observable listening event, target=0 otherwise .
members.csv
user information.
msno
city
bd: age. Note: this column has outlier values, please use your judgement.
gender
registered_via: registration method
registration_init_time: format %Y%m%d
expiration_date: format %Y%m%d
songs.csv
The songs. Note that data is in unicode.
song_id
song_length: in ms
genre_ids: genre category. Some songs have multiple genres and they are separated by |
artist_name
composer
lyricist
language
song_extra_info.csv
song_id
song name - the name of the song.
isrc - International Standard Recording Code, theoretically can be used as an identity of a song. However, what worth to note is, ISRCs generated from providers have not been officially verified; therefore the information in ISRC, such as country code and reference year, can be misleading/incorrect. Multiple songs could share one ISRC since a single recording could be re-published several times.
Power BI 2023/04/26(三) 第五堂
資料探索 還是 資料驗證 有主題性 要呈現甚麼內容 想法 感官視覺(簡潔 更具視覺化)
單一畫面 數量 如何排列 美感 可以最互動 篩選器 圖表也可以點按。 互動性為優勢"
善用卡片>直接呈現數字 比起圖表更快 !!! ##還有按鈕
實價登錄 https://app.powerbi.com/home m365 我的工作區 新增資料集 csv 建立報表>自動建立(長條圖為主)
編輯 出現Desktop介面 可以調整視覺效果
使用 從頭開始 我的工作區 選資料表(圓筒) 建立報表>從頭開始 web版無法做關聯 僅有視覺效果
PBI Website好處 MAC可用 可分享共用 自動建立>加速探索 基本簡單功能(擴充套件 圖表 快速瀏覽)
PBI DESKTOP 取得 a_ f_的csv 載入 確認UTF-8
1. 調整欄位 使用第一列為標頭 移除頂端資料列 1(英文欄位) 轉換資料不會動到原始檔案。
2. PBI載入資料後,會建立專有資料模型,更新EXCEL檔,需重新整理。
3. 城市 PQ 新增資料行 自訂資料行 (由地址切 資料混亂不完整 不適合直接切) 用新增欄位-自訂資料行。 名稱: 城市 資料行公式: = "台北市" 記得加" "
#附加查詢: PQ 常用/合併 將查詢附加為新查詢 相同欄位兩份資料上下合併 資料筆數變多
(先確定欄位名稱一致) 附加查詢 會改動原資料表。用附加為新查詢。
情境:不同年度附加 注意年度欄位。 #欄位不一致: 順序不同 有多的欄位 應仍可附加查詢合併。
#合併查詢: PQ 欄位有新增 欄位變多。需有 聯結種類的選擇(有ID值 哪個表為主 也可完全)
合併後Table點開(展開) #輸入資料~可建新表格。
#條件資料行: 總價元 注意資料類型(整數) 才會有大於
分成3組 正常(如果>10000000) 普通(否則>5000000) Else其餘 不正常
#導入套件: 需登入帳號狀態。 視覺效果 ... 取得更多視覺效果。
Text Filter 新增 , Word Cloud 新增 文字雲可設定格式 停用字詞(停止某些詞 如介系詞 冠詞 你我他)
類似文字探勘的清理概念。 #詞雲圖 類別 與 值(才會區別大小 >計數 出現的次數, 出現頻率,資料筆數)
地圖 vs. 區域分布圖(給面積)
儀錶板
1. 主題性
2. 畫面清晰明瞭
3. 互動性
4. 善用卡片
#如何分享最好的Dashboard, 共用 發行! 發行至Power BI 成功
回到WEB PBI 我的工作區 找 報告。 #可以分享為網址。 檔案 發行至WEB 嵌入網頁。
檔案 內嵌報表 發佈到WEB(公開)。
升級PRO。
## Tableau的卡片!!?
## 製作可附加查詢的資料(多年度) 可合併查詢(薪資) 使用可第一列為標頭(實價登錄)
## 關於按鈕 PBI的 Tableau的按鈕
Power BI 2023/04/21(五) 第四堂
公開資料庫 Kaggle: 目標確立 做研究 腳踏車>加入天氣資料
CC License 資料的評估 https://www.kaggle.com/
https://www.kaggle.com/datasets/addhyay/superstore-dataset
取得資料 載入兩個資料表Orders Returns 模型>資料表>編輯查詢 使用第一個資料行作為標頭
拉關聯 Order ID--OrderID 多對多 會有問題
回到PQ Return 選兩欄 移除重複項目 再拉一次關聯 為多對1 退貨單為唯一
交叉篩選 單一(單向影響) 改雙者 (雙向)
儀錶板DashBoard:先定義版位,左邊為篩選器區 ,上方為量值(卡片) 中間主視覺 視覺效過勿過多4-5
如何分類 要篩選哪些? 地區 分類 如何切割 #量值 銷量 金額
#先思考-欄位的篩選>找到影響的因素 影響量值的因素
1.Category商品類別 2.Segment客戶類型 3.區域Region 4.OrderDate日期年份
1.Category商品類別>交叉篩選器>設定視覺效果格式 "下拉式清單"不用時放著 (磚也可避免太多)
複製2,3欄位 再拉OrderDate(篩選) 保留年 季月日刪掉 再運送方式ShipMode篩選
#考慮量值:Slaes, Profit 拉卡片 >平均出貨日, 毛利率(不直接存在 需要計算) 需新增量值 DAX。
新增量值 >回到資料檢視 資料表工具 新增資料行(新增欄位)
Transactions=Orders[Ship Date]-Orders[Order Date] 出貨日-訂單日 資料格式>小數 負數(-727,補0)
Transactions=IF(Orders[Ship Date]-Orders[Order Date]<0, 0, Orders[Ship Date]-Orders[Order Date])新增量值 Profit Margin(%)=SUM(Orders[Profit])/SUM(Orders[Sales])
兩個值 新增至卡片 Profit Margin(%)顯示為% 資料>該欄位>格式 改成%
#決定視覺
1. 哪個區是主要客戶 地區銷售額佔比 圓餅圖 圖例:Region 值:Sales
2. 兩個橫向直條圖 分類 不同客戶vs實際銷售額Sales
3. 散佈圖: X Ship Mode Y:Transactions 平均 (泡泡圖) 大小: Sales
視覺排版
1. 模組的邊框(方便對齊):視覺效果格式 一般 效果 視覺格式框線 開啟。
2. 全部模組加框 檢視 主題 佈景主題庫 下載更多設計 再選 JSON
Power BI 2023/04/19(三) 第三堂
新北市公共自行車租賃系統(YouBike) [LINK] 3+2碼郵遞區號 [LINK] 檢視資料 可選類型 CSV或XML
新北市郵遞區號 [LINK]
取得資料 資料原點 #UTF-8 載入或轉換資料 載入兩份資料
資料檢視 報表模組按鈕>轉換資料 進入PQ 關閉並套用
移除資料行 刪除多餘欄位
更改欄位名稱 PQ內>欄位 重新命名 或 報告檢視/資料行工具 更改欄位名稱
分隔資料行 >資料更新日期 資料類型-轉成文字 切割之前轉文字
分割>依字元數 4 字元數 一再重複不動 再分割日期 依字元數
保留 年 月 其餘分割欄位 移除資料行(刪除欄位)
合併資料行 連選兩個欄位(年,月) PQ 轉換>合併資料行 分隔符號>自訂 - 合併後欄位名:資料更新日期
報表檢視 更改資料表名 郵遞區號 ZIP 分割資料行 字元數3 保留3碼區號與City AREA 3欄 移除其他欄位ZIP 移除重複項目 篩選City 新北市 ZIP 248不勾選(郵局作業錯誤) 套用關閉 記得存檔 。
#PQ內的存檔是SAVE整個專案。
修改3個欄位名稱 Zip5.1 -> 區域號碼 City -> 縣市 Area -> 行政區域
建立關聯 場站行政區域---行政區域
新增資料行 DAX: 新增量值僅計算 新增資料行(資料檢視/多一個欄位)
DAX宣告區:出租率 = [當下空車位數]/[總停車格]
DAX宣告區:空車率 = [當時可借車位數]/[總停車格
[新增量值] 報表檢視 也有 快速量值
資料檢視 資料表工具 >新增量值(小計算機) 新增的量值不會出現在資料表 只能在公式列操作
總車位數 = CALCULATE(SUM('youbike_txt資料格式'[總停車格]))
總空車數 = CALCULATE(SUM('youbike_txt資料格式'[當下空車位數]))
總可借車位數 = CALCULATE(SUM('youbike_txt資料格式'[當時可借車位數]))
總站數 = DISTINCTCOUNT('youbike_txt資料格式'[站點代號])
平均總平均總車位數 = [總車位數]/[總站數]
整體空車率 = CALCULATE([總可借車位數]/[總車位數],'youbike_txt資料格式'[當下是否有暫停營運]=1)
整體總出租率 = [總空車數]/[總車位數]
視覺效果 畫布設定 桌布背景色 透明度不要100%
卡片 篩選器 地圖(經緯度)
Power BI 2023/04/14(五) 第二堂
下載安裝PBI DESKTOP 選語言 https://powerbi.microsoft.com/zh-tw/desktop/ 選>查看下載或語言選項 下載 x64版本 副檔名 .pbix
https://data.gov.tw/dataset/137993 #任務:EXCEL打開亂碼解決
載入資料 商業資料庫 前5個資料表 模型區>自動關聯
#關於資料檔路徑 PowerQuery資料表編輯 找不到檔案 選項及設定 /資料來源設定 /檔案路徑修改 以正常進行編輯查詢
資料區:DAX函式宣告區(函數) #地圖 設定 安全性 要勾選 地圖功能。
千分位顯示: 點資料表>金額欄位 工具列可改顯示格式 資料行工具