2022年3月14日 星期一

[工作心得]分析作業

 分析作業

在大量數據的時代,透過資料視覺化檢視成果已經是人人都需要具備的能力了,然而現在的市場也具備許許多多資料視覺化的工具,但也產生了一個奇怪的狀況,就是這些工具的推動計畫都是往工具提供了多少圖表,當然為了推工具這是正常的現象,可是卻少了資料分析最重要的關鍵能力,就是數據本身的研究,反而只會想到數據拿到手就是丟到工具內使用產出分析圖,進而導致錯誤的分析報告。

其實想分析數據時需要有一些重點觀念要先培養起來,以下分享希望對各位有其幫助。

一、數據的取得

各種分析動作最基本就是需要取得數據,沒有數據資料先去培養一堆工具技能其實是沒有用的,就像要去安裝一道門,戴上了工具箱,卻沒有去把門板一同帶到現場,這樣就是經驗老道的師傅也是無用武之力吧!所以我們決定要題目時,關鍵點是先取得相關數據,有了數據就像有了門板會知道還需要哪些東西,那些東西值得分析與加工,每個欄位每筆資料特性是甚麼,才能進行下一步。

二、數據的整理

收集到數據後第一件事就是要開始進行整理,畢竟數據取的後需要進行一些整理,因為收集到的數據可能會有短少,需要先把這些缺值找出來才能先將排除依些遺漏,導致於後期分析出來的結果失焦或者不具代表性,因此我們可以避免掉不少失誤,同時也是一種反向驗證資料的正確性與有效性。

三、數據分類/分群

依據不同的議題會有不一樣的資料整理狀況,分類與分群是最常見的狀況,透過分類分群可以開始聚焦問題,並且可以透過各式各樣的分類分群方法來找出我們需要了解的問題與對焦的方向。

四、分析工具的應用

各種分析工具表格類excel、統計類sas、視覺化PowerBI等等各式各樣的工具,而這些其實彼此之間都是相輔相成的,因此不需要說換了工具就認為一切都要從頭來過,這樣的作業方式其實是循序漸進的,原始資料可能在excel之中,再透過sas找出一些統計結果並找出方向,最後透過powerbi視覺化工具回朔追蹤找出發生這類問題時有無徵兆,來進行預測推演得到一個行為模式的結論,進而就可以如大數據分析般,可以找到一些特定行為模式,藉此來預防問題的發生。


最後總結一下,"分析"看似困難,其實難的地方是甚麼,就是不知道目標,若有想探查的目標,這些分析動作與工具,就會成為助力,反之 ,在沒有目標的情況下學習工具,就會呈現出一種為了推廣工具而使用工具的狀況,或許當下被推廣者會覺得好用,往往到實際上線應用就會發現有許多的應用方向其實是混淆自己要探索的焦點,反而造成困擾,因此需要有一個標的物是各種分析作業前需要具備的。


沒有留言:

張貼留言

[資安]社交工程

 社交工程 在資訊安全領域中所提出的"社交工程"議題,其實也可以說"溝通"一詞的另一個說詞。 人在討論交換訊息時的行為,正是所謂的社交工程的過程一模一樣,主要差異在於行為與意圖。 有心人士預計要蒐集他人的各種資訊使用的對話溝通方式,其中我們...