探索性數(shù)據(jù)分析(EDA),你會使用嗎?
有人在發(fā)現(xiàn)這些特征后會迸出一些新的想法:通用電氣、埃克森美孚都是美國的企業(yè),中國企業(yè)的表現(xiàn)又如何的呢?我們可以在使用“泡泡圖”的同時,在JMP中調(diào)用“數(shù)據(jù)篩選”功能就可以得到類似圖三的界面。
本文引用地址:http://2s4d.com/article/113459.htm從中可以清晰地觀察到,自2004年以來的7年間,共有392個次的中國企業(yè)登上了福布斯排行榜。雖然在數(shù)量上、市值、銷售額等經(jīng)營指標上與世界頂級企業(yè)有一定差距,但以中石油Petro China、中石化Sinopec China Petroleum等位代表的一批國有大型企業(yè)發(fā)展速度很快,令世界矚目。
圖二 JMP軟件中動態(tài)泡泡圖與數(shù)據(jù)篩選的配合使用
實際上,探索性數(shù)據(jù)分析還遠遠不止這些。分析人士完全可以在數(shù)據(jù)分析的初期不受太多理論條件的束縛,充分展開想象的翅膀,多角度、多層面地對現(xiàn)有數(shù)據(jù)的規(guī)律進行可視化的探索,新的線索往往就會自然而然地出現(xiàn)了,為下一步的統(tǒng)計建模與預(yù)測等精細化分析奠定良好的基礎(chǔ)。
總之,探索性數(shù)據(jù)分析強調(diào)靈活地探求線索和證據(jù),重在發(fā)現(xiàn)數(shù)據(jù)中可能隱藏著的有價值的信息,比如數(shù)據(jù)的分布模式、變化趨勢,可能的交互影響,異常變化等等,而傳統(tǒng)的統(tǒng)計方法則側(cè)重于評估已經(jīng)發(fā)現(xiàn)的證據(jù),通常要求分析人員具備一定的統(tǒng)計學(xué)基礎(chǔ)。根據(jù)不同的業(yè)務(wù)目的和數(shù)據(jù)資源選用不同的技術(shù),或者綜合使用這兩類技術(shù),將會使我們更快地獲得更多的發(fā)現(xiàn)。對于大都不具備統(tǒng)計學(xué)功底但數(shù)據(jù)分析任務(wù)卻越來越多的企業(yè)人員(如市場分析人員、質(zhì)量管理人員等)來說,重視、學(xué)習(xí)并用好探索性數(shù)據(jù)分析往往能事半功倍。
評論