小編最近一直用 Impala 在分析產品的 API log,雖然有下 SQL 做了一些圖表 (DAU, MAU) 出來,但如果要讓非資訊人員自己下指令產生這些圖表的話,真的是會要了他們老命。尤其這些圖表如果是要給 PM、行銷看的話,每隔幾天就要叫工程師跑圖表,工程師真的會累死 Orz。
雖然有 ELK 這種整套都弄好好的系統,但這種系統還是工程師比較知道如何操作。小編想了一下,自己寫一套讓大家一鍵產生圖表還比較方便,於是就花了兩三天做了這個「窮人版 ELK」。
本來小編是想直接用 Cloudera HUE 產出來的圖表拿來處理,但因為 HUE 的報表是用 D3 產生出來的,所以如果真要跟 HUE 串接的話,除了 auth 那段要解決之外,還要處理 D3 產出來的互動式圖表。看了一下實在太花功夫,所以小編就放棄這段,直接重頭開始刻。
這次開發用了下面幾套工具,一直 pipe 來 pipe 去的,小編頭都快昏了 Orz。如果要跟數據打交道的話,真的要好好學一下 Linux 上的各種文字處理工具:
1. impala-shell:用 Impala 下 SQL 指令,將資料拉回來,參數 -B 可以將結果產生成 CSV 格式
2. csv2json:因為這次用的圖表工具只吃 JSON 格式,所以先將資料從 CSV 轉為 JSON,才能繼續下一步
3. json2highcharts:自己開發的程式,因為小編這次用的圖表工具 highcharts,無論是資料或設定檔 (像是顯示直條圖或折線圖) 都是 JSON 格式,所以要把這些資料跟設定檔轉成 highcharts 能吃的格式,所以又做了一次 JSON 轉換
4. highcharts-export-server:最後一步就是要呼叫產生圖表的工具了,小編找了蠻多的能在 command line 執行的圖表工具,有要裝 cairo 的,有要裝 png lib 的,還有一些要重頭 make 的,實在都太麻煩。後來看到這套是使用 phantomjs,直接跑 browser render,雖然肥了一點但不用管 dependency 就是爽 XDD
把這 4 步都執行完之後就會產生圖表了。但為了方便之後產生新類型的圖表,小編打算只要讓工程師把寫好的 DSL 丟到 server 上,非資訊人員就可以直接用網頁操作了。下一篇再來講如何開發 DSL 好了 (又是一連串的文字處理 Orz)。
* backend-log-explorer:https://github.com/mitaketw/backend-log-explorer
* 想了解在執行 Impala 之前,這些資料做了什麼處理嗎?推薦強者小編同事的文章:https://www.facebook.com/groups/616369245163622/permalink/1329521563848383/
#log #impala #highcharts #elk #資料分析
同時也有56部Youtube影片,追蹤數超過4萬的網紅吳老師教學部落格,也在其Youtube影片中提到,從EXCEL VBA自動化到Python程式開發入門第3次上課(For迴圈敘述&變化題與奇數加總&奇數加總運算子與邏輯&輸出99乘法表&正向三角形&反向三角形&While迴圈比較與修改程式&練習題質數判斷&練習題MonthCAI) 01_上周重點與For迴圈敘述 02_For迴圈變化題與奇數加總 ...
「json csv比較」的推薦目錄:
json csv比較 在 吳老師excel函數與vba大數據教學 Facebook 八卦
東吳推廣部開新課:
從EXCEL VBA到Python開發
上課日期
2020-02-10 時數 32節
上課內容:
因應大數據分析、物聯網與AI智慧辦公室的需求,能更容易的學會網路爬蟲、機器學習、物聯網、影像辨識、自動圖像報表等需求,其中以EXCEL VBA與Python程式開發最為熱門,因此將VBA的自動化延伸到PYTHON設計,讓學員能夠比較兩個工具的長處,並能相互協同應用。
教學內容
單元01_建置Python開發環境與程式測試
單元02_基本語法與結構控制件
單元03_迴圈資料結構與自訂函數
單元04_串列、字典與檔案與資料庫處理
單元05-1_開放資料處理CSV和JSON資料處理(停車與PM2.5)
單元05-2_開放資料處理練習題_新北市開放資料JSON
單元05-3_GOOGLE雲端當CSV來源與CSV處理
單元05-4_網頁資料擷取基礎與外匯
單元05-5_網頁資料擷取台彩與股市資料
單元05-6_擷取網頁上櫃股票行情
單元06_使用Pandas與處理_Excel_試算表
單元07_VBA與Phython連結MYSQL資料庫
單元08_視覺化報表使用圖表繪製Matplotlib
備註:本課程上課即時錄製教學,並於課後提供學員線上數位學習。
https://www.ext.scu.edu.tw/courses1.php?gid=7f9f1389-1fa1-11ea-abcd-000c29ad6982
json csv比較 在 吳老師excel函數與vba大數據教學 Facebook 八卦
開課訊息:東吳推廣部 從EXCEL VBA到Python開發
上課日期 2020-12-2 時數 32節
上課內容:
因應大數據分析、物聯網與AI智慧辦公室的需求,能更容易的學會網路爬蟲、機器學習、物聯網、影像辨識、自動圖像報表等需求,其中以EXCEL VBA與Python程式開發最為熱門,因此將VBA的自動化延伸到PYTHON設計,讓學員能夠比較兩個工具的長處,並能相互協同應用。
教學內容
單元01_建置Python開發環境與程式測試
單元02_基本語法與結構控制件
單元03_迴圈資料結構與自訂函數
單元04_串列、字典與檔案與資料庫處理
單元05-1_開放資料處理CSV和JSON資料處理(停車與PM2.5)
單元05-2_開放資料處理練習題_新北市開放資料JSON
單元05-3_GOOGLE雲端當CSV來源與CSV處理
單元05-4_網頁資料擷取基礎與外匯
單元05-5_網頁資料擷取台彩與股市資料
單元05-6_擷取網頁上櫃股票行情
單元06_使用Pandas與處理_Excel_試算表
單元07_VBA與Phython連結MYSQL資料庫
單元08_視覺化報表使用圖表繪製Matplotlib
備註:本課程上課即時錄製教學,並於課後提供學員線上數位學習。
連結:
https://www.ext.scu.edu.tw/courses_search.php?key=%E5%90%B3%E6%B8%85%E8%BC%9D
吳老師 109/5/22
函數東吳進修推廣部, EXCEL, EXCEL VBA 函數,程式設計,PYTHON,大數據分析,網路爬蟲,
json csv比較 在 吳老師教學部落格 Youtube 的評價
從EXCEL VBA自動化到Python程式開發入門第3次上課(For迴圈敘述&變化題與奇數加總&奇數加總運算子與邏輯&輸出99乘法表&正向三角形&反向三角形&While迴圈比較與修改程式&練習題質數判斷&練習題MonthCAI)
01_上周重點與For迴圈敘述
02_For迴圈變化題與奇數加總
03_For迴圈奇數加總運算子與邏輯
04_用For迴圈輸出99乘法表
05_用For迴圈輸出正向三角形
06_用For迴圈輸出反向三角形
07_For迴圈與While迴圈比較與修改程式
08_練習題質數判斷
09_練習題MonthCAI
完整影音
http://my.sce.pccu.edu.tw/MS/Detail.aspx?ProdId=8IS4_A7040&Source=BPromote
教學論壇(之後課程會放論壇上課學員請自行加入):
https://groups.google.com/forum/#!forum/tcfst_python_2018
懶人包:
EXCEL函數與VBA http://terry28853669.pixnet.net/blog/category/list/1384521
EXCEL VBA自動化教學 http://terry28853669.pixnet.net/blog/category/list/1384524
課程簡介:入門
建置Python開發環境
基本語法與結構控制
迴圈、資料結構及函式
VBA重要函數到Python
檔案處理
資料庫處理
課程簡介:進階
網頁資料擷取與分析、Python網頁測試自動化、YouTube影片下載器
處理 Excel 試算表、處理 PDF 與 Word 文件、處理 CSV 檔和 JSON 資料
實戰:PM2.5即時監測顯示器、Email 和文字簡訊、處理影像圖片、以 GUI 自動化來控制鍵盤和滑鼠
上課用書:
參考書目
Python初學特訓班(附250分鐘影音教學/範例程式)
作者: 鄧文淵/總監製, 文淵閣工作室/編著?
出版社:碁峰? 出版日期:2016/11/29
Python程式設計入門
作者:葉難
ISBN:9789864340057
出版社:博碩文化
出版日期:2015/04/02
吳老師 106/9/9
EXCEL,VBA,Python,自強工業基金會,EXCEL,VBA,函數,程式設計,線上教學,PYTHON安裝環境

json csv比較 在 吳老師教學部落格 Youtube 的評價
自強_從EXCEL VBA自動化到Python程式開發入門02(範例計算圓面積與修改預設編碼與匯入math模組&修改格式到小數點第2位&用Random產生亂數&用FOR重複輸出與加總&break與continue&九九乘法表&for迴圈輸出星號三角形&星號三角形&While迴圈敘述&練習題_質數判斷與MonthCAI與搖骰子遊戲與猜拳小遊戲)
上課內容:
01_重點回顧與IF練習題說明
02_範例計算圓面積與修改預設編碼與匯入math模組
03_修改格式到小數點第2位
04_用Random產生亂數當成半徑來源
05_用FOR重複輸出與加總
06_用FOR重複加總奇數與變化題
07_break與continue敘述說明
08_九九乘法表輸出單欄說明
09_九九乘法表輸出全部內容
10_for迴圈輸出星號三角形
11_for迴圈輸出反向與顛倒星號三角形
12_While迴圈敘述與For迴圈的比較
13_將FOR九九乘法表改為While
14_練習題_質數判斷與MonthCAI與搖骰子遊戲與猜拳小遊戲
完整影音
http://goo.gl/aQTMFS
教學論壇(之後課程會放論壇上課學員請自行加入):
https://groups.google.com/forum/?hl=zh-TW#!forum/tcfst_python_2017
懶人包:
EXCEL函數與VBA http://terry28853669.pixnet.net/blog/category/list/1384521
EXCEL VBA自動化教學 http://terry28853669.pixnet.net/blog/category/list/1384524
課程簡介:入門
建置Python開發環境
基本語法與結構控制
迴圈、資料結構及函式
VBA重要函數到Python
檔案處理
資料庫處理
課程簡介:進階
網頁資料擷取與分析、Python網頁測試自動化、YouTube影片下載器
處理 Excel 試算表、處理 PDF 與 Word 文件、處理 CSV 檔和 JSON 資料
實戰:PM2.5即時監測顯示器、Email 和文字簡訊、處理影像圖片、以 GUI 自動化來控制鍵盤和滑鼠
上課用書:
參考書目
Python初學特訓班(附250分鐘影音教學/範例程式)
作者: 鄧文淵/總監製, 文淵閣工作室/編著?
出版社:碁峰?出版日期:2016/11/29
Python程式設計入門
作者:葉難
ISBN:9789864340057
出版社:博碩文化
出版日期:2015/04/02
吳老師 106/9/15
EXCEL,VBA,Python,新北市勞工大學,EXCEL,VBA,函數,程式設計,線上教學,PYTHON安裝環境

json csv比較 在 吳老師教學部落格 Youtube 的評價
從EXCEL VBA自動化到Python程式開發入門第3次上課(For迴圈敘述&變化題與奇數加總&奇數加總運算子與邏輯&輸出99乘法表&正向三角形&反向三角形&While迴圈比較與修改程式&練習題質數判斷&練習題MonthCAI)
01_上周重點與For迴圈敘述
02_For迴圈變化題與奇數加總
03_For迴圈奇數加總運算子與邏輯
04_用For迴圈輸出99乘法表
05_用For迴圈輸出正向三角形
06_用For迴圈輸出反向三角形
07_For迴圈與While迴圈比較與修改程式
08_練習題質數判斷
09_練習題MonthCAI
完整影音
http://my.sce.pccu.edu.tw/MS/Detail.aspx?ProdId=8IS4_A7040&Source=BPromote
教學論壇(之後課程會放論壇上課學員請自行加入):
https://groups.google.com/forum/#!forum/tcfst_python_2018
懶人包:
EXCEL函數與VBA http://terry28853669.pixnet.net/blog/category/list/1384521
EXCEL VBA自動化教學 http://terry28853669.pixnet.net/blog/category/list/1384524
課程簡介:入門
建置Python開發環境
基本語法與結構控制
迴圈、資料結構及函式
VBA重要函數到Python
檔案處理
資料庫處理
課程簡介:進階
網頁資料擷取與分析、Python網頁測試自動化、YouTube影片下載器
處理 Excel 試算表、處理 PDF 與 Word 文件、處理 CSV 檔和 JSON 資料
實戰:PM2.5即時監測顯示器、Email 和文字簡訊、處理影像圖片、以 GUI 自動化來控制鍵盤和滑鼠
上課用書:
參考書目
Python初學特訓班(附250分鐘影音教學/範例程式)
作者: 鄧文淵/總監製, 文淵閣工作室/編著?
出版社:碁峰? 出版日期:2016/11/29
Python程式設計入門
作者:葉難
ISBN:9789864340057
出版社:博碩文化
出版日期:2015/04/02
吳老師 106/9/9
EXCEL,VBA,Python,自強工業基金會,EXCEL,VBA,函數,程式設計,線上教學,PYTHON安裝環境

json csv比較 在 29.如何找到開放資料及將json格式轉換成csv格式(Office 2010 ... 的八卦
在數位時代全面E化後,政府與企業徵才首重Office軟體的使用,而且跨軟體間的整合應用,絕對是必備的工作技巧。本課程目標是教授Office 中的四大軟體 ... ... <看更多>