新人入職場,會經(jīng)常聽到老員工或者leader說,“這個業(yè)務我們要看XXX數(shù)據(jù)”“這個需求出個數(shù)據(jù)”等話題,很多新人初入職場的時候會很迷茫——數(shù)據(jù)是什么數(shù)據(jù)?哪些數(shù)據(jù)重要?我要怎么去分析數(shù)據(jù)才是有價值的?實際上,隨著大數(shù)據(jù)的發(fā)展,現(xiàn)在似乎越來越多的業(yè)務需要“數(shù)據(jù)意識”“數(shù)據(jù)分析”的能力,特別是大企業(yè)更是如此。簡單的來講,就是大企業(yè)的用戶多,產生的數(shù)據(jù)多,因此除了傳統(tǒng)的問卷調研、訪談等手段,還能通過大量的數(shù)據(jù)進行分析。這樣同樣能夠起到了解用戶反饋、產品效益的目的,甚至在很多情況下還會更準確、更省時間。
也因此,許多企業(yè)在招聘時會偏好有“數(shù)據(jù)分析”能力的候選人;同時很多打工人也發(fā)現(xiàn),原有的Excel技能很難滿足自己的工作需求,有一定的數(shù)據(jù)能力能夠大大提升自己的辦公效率,開始自學數(shù)據(jù)分析。
今天,小助手就和大家分享下,除了常規(guī)的Excel,還有什么數(shù)據(jù)分析的工具值得用、值得學,主要分了三個等級
1.入門級:非數(shù)分方向的同學,如果僅是有一定的數(shù)據(jù)分析需求的話,學會這個就非常夠用了;
2.進階級:非數(shù)分方向的同學,如果對自己要求較高,又經(jīng)常需要匯報演講,那這個就很合適;
3.專業(yè)級:數(shù)分方向的同學可以研究,非專業(yè)人士沒什么太大必要。
入門級:MySQL/ORACLE/POSTGRESQL
SQL基本上是數(shù)據(jù)方向上所有崗位的必備技能,重要程度和Excel不相上下。做數(shù)據(jù)分析專業(yè)的同學常常會稱自己為SQL民工也是因為同樣的原因。對于非數(shù)分崗位的同學,其實能夠掌握sql就非常足夠了。
SQL入門比較容易,概括起來就是在數(shù)據(jù)庫里搜索調取想要的數(shù)據(jù),在數(shù)據(jù)庫里增刪改查新舊數(shù)據(jù)。總而言之,要想入行數(shù)據(jù)分析,SQL是必要技能。
進階級:TABLEAU/POWERBI:
作為可視化工具的Tableau和PowerBI在數(shù)據(jù)分析中也是不可或缺的一部分。Tableau的上手非?,只要拖拽處理過的數(shù)據(jù)后便會產出很多精美的可視化圖像。
數(shù)據(jù)可視化簡單明了,用圖表來識別問題,在做數(shù)據(jù)分析和演講時都會讓你在工作上非常加分。適合有數(shù)據(jù)分析需求,又需要做匯報的同學。
專業(yè)級:PYTHON:
除了SQL外,如果需要更成熟的數(shù)分技能,Python也一定會要求(當然大多數(shù)非數(shù)分崗的打工人還不需要這么專業(yè))。Python也是一款比較容易上手的數(shù)據(jù)分析軟件。寫作語法和英語比較相似,比起Java,C++等SDE必須要會的軟件更容易上手。
用Python清理數(shù)據(jù)和處理數(shù)據(jù)時往往比較方便快捷,同時,有很多數(shù)據(jù)科學家也會在Python中編寫模型。Python可以進行爬蟲,寫游戲,可以說是數(shù)據(jù)分析師一定要會的數(shù)據(jù)分析工具了。
專業(yè)級:R Programming:
隨著Python的廣泛應用,用R的分析師近幾年好像有所減少,但R多數(shù)被用于統(tǒng)計計算和圖形的編程語言的免費軟件。
R語言在統(tǒng)計學家和數(shù)據(jù)挖掘者中廣泛用于開發(fā)統(tǒng)計軟件和數(shù)據(jù)分析,同時R語言作為一個老牌分析軟件,其Library做的非常的完善,如果同學們在使用R語言時遇到任何問題都基本可以在Library里找到答案。
專業(yè)級:APACHE SPARK
Apache Spark是大數(shù)據(jù)分析軟件,用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎。
它提供Java,Scala,Python和R中的高級API,以及支持常規(guī)執(zhí)行圖的優(yōu)化引擎。 和Hadoop MapReduce一樣,用于在集群上使用并行的分布式算法來處理和生成大數(shù)據(jù)集。但Spark的執(zhí)行速度比MapReduce快100倍,如果你想要進入大數(shù)據(jù)領域的分析師,Spark是一定要會的技能之一。
專業(yè)級:BIGML:
BigML是另一種廣泛使用工具,它提供了一個完全可交互的,可用于處理機器學習算法。
BigML提供了使用云計算滿足行業(yè)需求的標準化軟件。通過它,公司可以在公司的各個部門中使用機器學習算法。
例如,它可以將這一軟件用于銷售預測,風險分析和產品創(chuàng)新。 BigML專門從事預測建模。它使用各種各樣的機器學習算法,例如聚類,分類,時間序列預測等。