了解預測分析已成為從數據中發(fā)現客戶需求和商業(yè)機會的關鍵條件。但是,建立良好的預測模型的第一步在于概述數據,其來源和關鍵的數據關系。這些第一步將需要良好的業(yè)務資源來組織詳細信息。IT可以是至關重要的資源,可以快速突出有效利用數據的機會。
當負責準備預測模型時,分析師必須詢問什么是該計劃的最佳方法。當IT人員進入初始階段時,答案可以解決項目的不同方面,從一開始就揭示出可能不太明顯的想法。
進行數字盤點
評估預測分析模型的最佳方法來自評估項目初期是否有一些關鍵資源。
通??梢岳斫?,分析師必須首先確定預測模型必須對數據回答什么問題。畢竟,模型應該顯示數據如何與設定的目標進行統(tǒng)計關聯。
分析人員應首先請IT專業(yè)人員或IT團隊的成員參加有關是否可以立即獲得所需數據的初步討論。
假設一位分析師希望衡量航空公司對航班提供的服務變化的調查結果。分析師可以從與客戶相關的活動中創(chuàng)建數據和元數據的列表,IT團隊可以依次驗證數據在數據庫中的顯示方式或在API中的調用方式。
此列表可能是一個討論點,它揭示了項目如何驅動IT資源。解決方案必須允許以最適合目標和資源的方式擴展數據集成。技術市場上存在很多選擇,但是在許多情況下,IT團隊成員的見解可以表明如何最好地利用這些選擇。IT部門的討論可以為下一步的工作提供指導,詳細說明每個人如何解決預測模型的質量問題。分析人員可能會了解異常值,異常和其他異常情況如何影響質量。IT專業(yè)人員可以通過將這些顧慮與所請求的數據源可能產生的技術影響聯系在一起來提供幫助。
例如,記錄異??梢源龠M對哪些錯誤是技術性錯誤(例如傳感器問題)以及哪些是來自現實活動的分析人員的共識,分析師可以立即識別出這些錯誤。團隊可以共同采取行動解決問題,以保持模型的準確性。
以最低的成本選擇最佳功能
IT部門的參與也可以影響要素工程。特征工程是對變量的選擇,這些變量被懷疑是我們想要的模型輸出的最佳預測變量。預測模型的高級分析-通過SPSS中檢查的數據集或R或Python中創(chuàng)建的編程代碼-生成度量,使用戶可以比較所選變量的預測影響??梢詣h除統(tǒng)計上影響較小的變量。如果變量從決策角度來看在統(tǒng)計上接近,則該分析本質上可以是重復的。
當訪問數據存在復雜性時,IT可以提供其他方法來進行功能工程。企業(yè)可以使用IT維護自己的數據庫。因此,IT人員可以為變量設置數據的訪問權限。如果模型將用于機器學習訓練,則該安排尤其重要。減少探索性數據分析時間的初步努力越好,IT部門就可以更好地確定支持該分析數據所需的資源的優(yōu)先級,進而突出顯示受影響的業(yè)務運營。
例如,您可能想要檢查突出顯示哪些客戶群導致類別支出增加的指標,這對于零售商以查看提供促銷產品的產品或希望向其最佳客戶追加服務的公司來說是有用的分析。行業(yè)知識可以確定第二方或第三方數據是否會為客戶模型提供信息,以保留更長的客戶時間。IT可以幫助確定獲取該數據的成本以及任何正在進行的分析將影響哪些操作。
預測分析旨在模擬業(yè)務決策并查看結果。對于預測分析研究,IT可以幫助確定影響正在模擬的決策的運營權衡。這可以幫助減少技術債務以及與該決策相關的其他財務成本。最終結果是一個先進的分析過程,該過程真正使公司在快速了解客戶的過程中取得了進步。