系列前言
海鼎科技·專家課程
在接觸對接了行業(yè)千余家客戶的數字化需求之后,我們發(fā)現(xiàn),商業(yè)地產企業(yè)中不乏具有熱血與沖勁的專業(yè)型人才。他們或為了商業(yè)集團、項目的發(fā)展貢獻著寶貴智慧,或在學術領域沉淀著極具價值的架構體系。
今天,我們將他們請到海鼎科技專家課程系列的現(xiàn)場,為更廣大行業(yè)的受眾“曝光”他們的所學、所識、所感,將私藏的干貨展現(xiàn)給行業(yè)大眾,造福行業(yè)加速發(fā)展。
本期專家介紹
劉烜超先生

2010年進入零售業(yè)工作,歷任多家商業(yè)項目的IT部門負責人。經歷7個項目(3個籌開)的發(fā)展與成熟,其中包括百貨、購物中心、商街、超市、綜合體等多業(yè)態(tài),專長于商業(yè)地產數字化板塊工作。
在數據分析專業(yè)領域中,其于15年深入研究統(tǒng)計學,19年初通過法國ESSEC商學院數據分析專業(yè)認證,2021年獲得聯(lián)合國下屬機構TRL Alliance 授予的 Independent Scientist 認證 以及 TRL 志愿翻譯者資格。同時作為Unity、Unreal虛擬現(xiàn)實獨立開發(fā)者,參與某高校藝術與科學專業(yè)的數據可視化藝術作品的研討和作品制作。
寫在前面·作者序:
商業(yè)數據分析(簡稱BA),結合頭幾年 Big data、AI 的風口,被甲乙方炒得火的不能再火。一時間,IoT、新BI、新零售等等新概念層出不窮。
本人在商業(yè)的IT部門工作了11年,在這些年的項目經驗中,發(fā)現(xiàn)商業(yè)公司開始越來越重視數據了。然而在實際運作中,要投入的不僅是資金這么簡單,專業(yè)素質、理論基礎以及上層領導的理解和支持,方方面面缺一不可。有時候不同項目間千差萬別,報表又很單一,分析手段也是20年前的標準, BA&BI 的推進如此緩慢也是情理之中的事情。
在過去的實際分析經驗中,我發(fā)現(xiàn)傳統(tǒng)商業(yè)分析的結構是相當單一的,同比環(huán)比分析、漏斗下鉆、分類匯總,配合多種維度:例如銷售、坪效、租決等等,得到的分析往往不能理解數據之中本身蘊含的意義。針對這個問題,我通過結合國內外大量文獻和資料,以及借鑒其他行業(yè)的分析方法,將用以下4個章節(jié)粗略描繪一下這些年的分析手段和經驗:
第一章:商業(yè)數據處理以及描述性分析
第二章:相關性分析、數學模型應用
第三章:無監(jiān)督學習下的客群統(tǒng)計和店鋪統(tǒng)計
第四章:數據可視化
接下來,讓我們進入本期課程的第一章學習內容:“商業(yè)數據處理以及描述性分析”。

分析中用到的軟件和語言僅供參考
商業(yè)數據的特點和缺失值處理
Shopping mall 的存在本質是合理控制租賃方經營成本,在與承租方的履約過程正常的情況下,租賃方不會造成因人員、促銷等費用產生的巨大投入(相比百貨和超市)。
但國內外的購物中心都有一個核心問題,銷售無法及時獲取,這也是造成數據收集和分析困難的巨大問題。往往我們看到一個店鋪的銷售數據表現(xiàn)是這樣的:

某商場在定義區(qū)間范圍內的品牌交易數據,其中缺失值用黃色表示。如圖所示,該品牌的銷售數據缺失方式為不規(guī)則不定期缺失,因此需要考慮使用插值補全的方式嘗試補全數據。但同時要注意,補全銷售后,可能直接影響現(xiàn)有銷售的表現(xiàn)。因此插值之后還需要進行檢驗,最快捷的方式可以用ANOVA檢驗方差,如果方差不大于一個閥值則表明插值結果可用,或采用直觀的圖形可視化觀察數據走勢從而判斷數據的可讀性。
在做這一步前必須要明確一點:插值處理就是在原始數據沒有的情況下,根據該品牌銷售實際存在的數據進行數學模擬,并填補進空缺位置。這個方式用于找到數據的趨勢,而不是具體的單日對比、環(huán)比。
插值補全有多種辦法,本人習慣使用KNN、簡單插值和貝葉斯插值法進行比較,以下圖中列出了三種不同插值的結果。在插值范圍內需要觀察數據的一致性和周期性,從而最終確定插值的方式。當然由于不同品牌經營方式也不同,插值不可能是統(tǒng)一算法,否則有可能產生基于隨機數的數學規(guī)律,導致不應出現(xiàn)的噪聲。









