探索性數(shù)據(jù)分析(EDA),你會使用嗎?
有人在發(fā)現(xiàn)這些特征后會迸出一些新的想法:通用電氣、??松梨诙际敲绹钠髽I(yè),中國企業(yè)的表現(xiàn)又如何的呢?我們可以在使用“泡泡圖”的同時,在JMP中調用“數(shù)據(jù)篩選”功能就可以得到類似圖三的界面。
本文引用地址:http://m.butianyuan.cn/article/113459.htm從中可以清晰地觀察到,自2004年以來的7年間,共有392個次的中國企業(yè)登上了福布斯排行榜。雖然在數(shù)量上、市值、銷售額等經營指標上與世界頂級企業(yè)有一定差距,但以中石油Petro China、中石化Sinopec China Petroleum等位代表的一批國有大型企業(yè)發(fā)展速度很快,令世界矚目。
圖二 JMP軟件中動態(tài)泡泡圖與數(shù)據(jù)篩選的配合使用
實際上,探索性數(shù)據(jù)分析還遠遠不止這些。分析人士完全可以在數(shù)據(jù)分析的初期不受太多理論條件的束縛,充分展開想象的翅膀,多角度、多層面地對現(xiàn)有數(shù)據(jù)的規(guī)律進行可視化的探索,新的線索往往就會自然而然地出現(xiàn)了,為下一步的統(tǒng)計建模與預測等精細化分析奠定良好的基礎。
總之,探索性數(shù)據(jù)分析強調靈活地探求線索和證據(jù),重在發(fā)現(xiàn)數(shù)據(jù)中可能隱藏著的有價值的信息,比如數(shù)據(jù)的分布模式、變化趨勢,可能的交互影響,異常變化等等,而傳統(tǒng)的統(tǒng)計方法則側重于評估已經發(fā)現(xiàn)的證據(jù),通常要求分析人員具備一定的統(tǒng)計學基礎。根據(jù)不同的業(yè)務目的和數(shù)據(jù)資源選用不同的技術,或者綜合使用這兩類技術,將會使我們更快地獲得更多的發(fā)現(xiàn)。對于大都不具備統(tǒng)計學功底但數(shù)據(jù)分析任務卻越來越多的企業(yè)人員(如市場分析人員、質量管理人員等)來說,重視、學習并用好探索性數(shù)據(jù)分析往往能事半功倍。
評論