任何組織或個人只要搶先一步掌握大數據, 就會奠定至關重要的競爭優勢, 就像在小數
據時代占據先機進行數據分析的人能在競爭者中脫穎而出一樣。
因此,數據分析師將會成為一個黃金職業。

步驟1 從識別問題開始
一位定量分析師所做的工作始于認識一個問題或決策, 然后才開始解決問題。
如果你不能針對下面的大部分問題給出肯定的回答, 那你的項目可能從一開始就會陷入困境:
- 哪些高管和定量分析項目的成功息息相關?
- 他們是否對存在的問題和問題的解決方案有一個大概的了解?
- 他們是否有能力提供必要的資源? 是否有能力推進定量分析項目成功所必須的業務變革?
- 他們是否都支持在決策制定過程中使用分析和數據?
- 你所推薦的分析案例和交流方式是否與他們常用的思維與決策方式相一致?
- 你是否計劃向他們提供定期反饋和階段性成果報告?

步驟2 回顧之前的問題
一旦問題被識別, 就應該對所有與之相關的之前的發現進行調查。 回顧之前的發現仍然屬于分析( 構建問題) 的*階段中的一個步驟, 因為調查之前的發現能幫助分析師和決策者思考他們想解決的問題到目前為止是如何被構建的, 以及這個問題可能以何種不同的方式被概念化。
你可以嘗試問如下問題:
- 你已經很好地構建問題了嗎?
- 你是否已經定義了一個清晰的問題或機會來解決企業里非常重要的問題?
- 你是否已經考慮了多種選擇方式來解決問題?
- 你是否已經識別出這個問題的利益相關者, 且針對這個問題你已經和這些利益相關者進行了廣泛的交流?
- 剛開始時, 你對問題是否有一個較廣泛的定義, 到后來縮小到一個需要解決、 需要應用數據以及明確可能出現的結果的非常確切的問題?

步驟3 簡化數據模型
" 簡化" 是要我們必須舍棄所有非必須的和無關緊要的細節, 并保留*重要的、 *有效的、 *關鍵的且會造成影響的特征。
每當你建立一個模型時, 都必須是有選擇性的。 你必須識別現實世界中與這個模型相關的因素, 并忽略其他不相關的因素。 你必須建立一個簡化的模型世界, 它能讓你聚焦于當下設法解決的問題。
你可以嘗試問如下問題:
- 我們需要同時分析多少變量? 分析一個變量( 單變量模型) 、 兩個變量( 雙變量模型) 還是三個或更多變量( 多變量模型) 的概率。
- 我們需要得到描述性或推論性問題的答案嗎? 描述統計學( Descriptive Statistics) 簡單地描述了你擁有的數據, 均值、 中值和標準差是描述統計學的典型案例。
- 在感興趣的變量中, 什么樣的測量水平是可行的?

步驟4 收集與測量數據
測量變量的4種方式為:
二元變量: 這種變量只有兩個值, 并且根據統計分析的目的, 通常*好是把它們身上存在或缺失某種東西的值定義為1或0。 這樣的例子可以是你要么是女性要么是男性( 沒有女
性特征被記錄為0, 女性則被記錄為1) , 或者你是否是美國公民。
分類( 或者稱為名義) 變量: 對于這種變量的值, 存在多種可能的分類, 比如眼睛的顏色、 冰激凌的口味。 因為這些因素很難被轉變成增加或減少會產生意義差別的數字, 所以針對分類數據有一類特殊的統計數據。
序變量: 這些變量有一些分配給它們的數字, 并且數字越大就意味著相應的變量存在的越多。 然而, 1和2之間的差別可能與5和6之間的差別不盡相同。
數值( 間隔和比率) 變量: 這些變量擁有標準的數值單位,比如以磅或千克計量的重量, 或以英尺或厘米計量的高度。數值越大就意味著相應的變量存在的越多。 另外, 數值變量
非常適用于像相關分析和回歸分析這樣的普通統計方法。

步驟5 數據分析
數據分析需要找到恒定的模式; 換言之, 就是蘊含在數據中的變量之間的關系。 當你看到模式浮現出來時, 解釋數字就會變得更加容易。 當你從變量中提煉出這些模式時, 解決問題就會變得更加容易。
分析的維度有如下3種:
兩個數值型數據變量: 如果你只是想將兩件能夠進行數值測量的事情聯系起來, 那么你很可能想要使用某種類型的相關分析。 這是你可以執行的*簡單的統計分析中的一種。
兩個或幾個類別變量: 如果你正在使用調查數據, 而且你的數據來自名詞定類變量( 比如, 男性/女性, 或者青年/中年/老年) , 那么你將需要使用一系列方法來進行分類數據分析。 這種分析類型的結果常常用表格的方式呈現。
兩個以上的數值型數據變量: 將相關分析擴展應用到擁有數值型變量的兩個以上的變量上就是回歸分析。 有時候, 它被稱為多元線性回歸分析( 因為你使用了多元變量來解釋另一
個變量的價值) 或者線性回歸分析( 因為變量之間的關系在整個變量范圍中保持相似) 。

步驟6 采取行動
你可嘗試按照如下的6個維度提供你數據的分析結果:
- 1. 對這個商業問題的理解;
- 2. 如何估量它的商業影響力;
- 3. 哪些數據是可以用的;
- 4. *初的解決方案;
- 5. *終的解決方案;
- 6. 該解決方案的商業影響力。
基于數據、 分析的分析性思維會在商業和社會中扮演越來越重要的角色。 我們需要很多慣于使用分析性思維的管理人員和專業人員,希望你也可以成為數據分析師。