首頁(yè) > 公文范文 > 決策樹(shù)下房地產(chǎn)市場(chǎng)的數(shù)據(jù)挖掘
時(shí)間:2022-03-05 04:47:38
序論:寫(xiě)作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來(lái)了一篇決策樹(shù)下房地產(chǎn)市場(chǎng)的數(shù)據(jù)挖掘范文,愿它們成為您寫(xiě)作過(guò)程中的靈感催化劑,助力您的創(chuàng)作。
以某知名房地產(chǎn)企業(yè)某商品住宅項(xiàng)目2014~2015年的銷(xiāo)售成交記錄(801條)和訪問(wèn)接待記錄(865條)為樣本,通過(guò)剔除“實(shí)質(zhì)貧數(shù)據(jù)”的客戶(hù)人口統(tǒng)計(jì)信息改進(jìn)數(shù)據(jù)集,同時(shí)通過(guò)對(duì)已成交購(gòu)房者按“消費(fèi)狀態(tài)”(即“剛需”“首改”“再改”和“升級(jí)”)進(jìn)行決策樹(shù)分類(lèi),得到“利益相關(guān)者”和“以投資為導(dǎo)向”兩個(gè)穩(wěn)定的關(guān)鍵變量。以此指導(dǎo)對(duì)訪談數(shù)據(jù)集的分類(lèi),發(fā)現(xiàn)購(gòu)房者在與銷(xiāo)售人員接觸時(shí),首先關(guān)注的是房源的面積大小,而非如價(jià)格、戶(hù)型等其他信息,在兼顧精度的同時(shí),發(fā)現(xiàn)可以直接指導(dǎo)人工銷(xiāo)售的知識(shí)規(guī)則。
一、引言
近年來(lái),我國(guó)住房消費(fèi)市場(chǎng)不斷發(fā)育成熟,房地產(chǎn)行業(yè)也逐漸積累了大量的客戶(hù)信息數(shù)據(jù)。這些房地產(chǎn)交易數(shù)據(jù)與客戶(hù)數(shù)據(jù),與宏觀經(jīng)濟(jì)數(shù)據(jù)、房地產(chǎn)供給數(shù)據(jù)以及交易后服務(wù)數(shù)據(jù)一道構(gòu)成了房地產(chǎn)市場(chǎng)的數(shù)據(jù)體系。這些數(shù)據(jù)對(duì)房地產(chǎn)企業(yè)經(jīng)營(yíng)的各個(gè)環(huán)節(jié),尤其是后端銷(xiāo)售環(huán)節(jié)具有重要意義(李海洋,2017)。但由于房地產(chǎn)交易不同于簡(jiǎn)單的網(wǎng)上購(gòu)物,消費(fèi)者必須借助專(zhuān)業(yè)銷(xiāo)售人員的幫助才能完成交易,而消費(fèi)者與銷(xiāo)售人員之間的信息不對(duì)稱(chēng),許多“大數(shù)據(jù)”在交易完成前都無(wú)法獲得,因此針對(duì)歷史數(shù)據(jù)的預(yù)測(cè)方法就無(wú)法使用。如何從這種名義上是大數(shù)據(jù),實(shí)質(zhì)上卻是“貧數(shù)據(jù)”的房地產(chǎn)客戶(hù)數(shù)據(jù)中獲得有價(jià)值的信息,使數(shù)據(jù)真正可以應(yīng)用與指導(dǎo)實(shí)踐就成了一個(gè)重要的問(wèn)題。本文在現(xiàn)有研究和決策樹(shù)的成熟模型基礎(chǔ)上,試圖改善這兩個(gè)問(wèn)題,讓機(jī)器學(xué)習(xí)不僅獲得數(shù)據(jù)分析結(jié)果同時(shí)也獲得知識(shí),并可以將知識(shí)直接服務(wù)于人工房地產(chǎn)銷(xiāo)售業(yè)務(wù)。
二、基于決策樹(shù)的市場(chǎng)數(shù)據(jù)挖掘模型構(gòu)建思路
決策樹(shù)是一種重要的預(yù)測(cè)型數(shù)據(jù)挖掘技術(shù),這種算法主要通過(guò)貪婪算法遞歸實(shí)現(xiàn)分類(lèi)與預(yù)測(cè)功能。其系列算法起源于Hunt、Marin和Stone在1966年提出的單概念學(xué)習(xí)系統(tǒng)。Quinlan(1987)提出的ID3算法正式建立了決策樹(shù)的算法框架。決策樹(shù)分類(lèi)預(yù)測(cè)的實(shí)現(xiàn)流程大致如下:(1)在理解問(wèn)題的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行清洗、賦值、標(biāo)準(zhǔn)化等預(yù)處理;(2)進(jìn)一步使用具體決策樹(shù)分類(lèi)方法,利用訓(xùn)練樣本構(gòu)建決策樹(shù),并通過(guò)測(cè)試集樣本檢驗(yàn)決策樹(shù)的效果;(3)根據(jù)結(jié)果調(diào)試相關(guān)參數(shù)與方法改進(jìn)模型。決策樹(shù)在標(biāo)準(zhǔn)選擇、改進(jìn)思路和效果評(píng)價(jià)上有著多種不同規(guī)則。目前在許多理論與應(yīng)用研究上,對(duì)模型效果的評(píng)價(jià)主要聚焦于預(yù)測(cè)精度。通過(guò)設(shè)置代價(jià)系統(tǒng)、改變抽樣機(jī)制等方式,追求相關(guān)問(wèn)題預(yù)測(cè)精度的最大化。但本文參考決策樹(shù)在多個(gè)領(lǐng)域的應(yīng)用研究(Liang等,2015;Kretser等,2015;Dhurandhar等,2015)認(rèn)為,除此之外,研究方向還應(yīng)包括:分析樣本數(shù)據(jù)集與生成的數(shù)規(guī)則的關(guān)系、規(guī)則復(fù)雜度與預(yù)測(cè)準(zhǔn)確性的折衷等方面。前一個(gè)問(wèn)題是聯(lián)系決策樹(shù)算法與現(xiàn)實(shí)中具體應(yīng)用的橋梁,而后一個(gè)問(wèn)題則是將單純的分類(lèi)算法提升到系統(tǒng)科學(xué)的角度進(jìn)行多目標(biāo)的決策體系構(gòu)建。本文即從這兩個(gè)問(wèn)題出發(fā),首先從研究房地產(chǎn)銷(xiāo)售數(shù)據(jù)的特性,站在從房地產(chǎn)交易的具體情境上分析數(shù)據(jù)的可得性及穩(wěn)定性,以建立適當(dāng)?shù)臄?shù)據(jù)集。此外,鑒于房地產(chǎn)交易的復(fù)雜性,消費(fèi)者必然會(huì)借助專(zhuān)業(yè)銷(xiāo)售人員的幫助完成交易,因此,房地產(chǎn)數(shù)據(jù)挖掘更應(yīng)該對(duì)房地產(chǎn)銷(xiāo)售人員的服務(wù)過(guò)程形成協(xié)助。房地產(chǎn)銷(xiāo)售人員在服務(wù)過(guò)程中,對(duì)單個(gè)客戶(hù)的精準(zhǔn)把握自然是一方面,但在同樣的時(shí)間里用盡可能少的交流,掌握切中購(gòu)房需求的要害問(wèn)題,對(duì)更多客戶(hù)形成基本正確的判斷,也是其拓展渠道提升業(yè)績(jī)的方式。因此本文希望通過(guò)數(shù)據(jù)挖掘,得到分類(lèi)標(biāo)準(zhǔn)穩(wěn)定并易于解釋的決策樹(shù)規(guī)則。
三、數(shù)據(jù)分析
(一)數(shù)據(jù)說(shuō)明與預(yù)處理
本文采用的數(shù)據(jù)包含兩部分,均源自某綜合性知名房地產(chǎn)企業(yè)的數(shù)據(jù)庫(kù),一部分是該企業(yè)在環(huán)渤海地區(qū)某城市一處住宅小區(qū)銷(xiāo)售中心2014年成立以來(lái)的商品房住宅銷(xiāo)售成交記錄共801條;另一部分為該銷(xiāo)售中心自成立以來(lái)的訪問(wèn)接待記錄共865條。對(duì)這些一手?jǐn)?shù)據(jù)做進(jìn)一步清洗,在成交數(shù)據(jù)中剔除值缺失、明顯輸入錯(cuò)誤記錄24條,剩余有效記錄777條;以同樣的標(biāo)準(zhǔn)剔除訪問(wèn)接待記錄中的無(wú)效記錄43條,剩余有效記錄823條。成為本文用于挖掘的數(shù)據(jù)集。其中成交數(shù)據(jù)中包括50個(gè)字段,剔除沒(méi)有信息含量的“序號(hào)”“組別”“職業(yè)顧問(wèn)”“樓號(hào)”等字段后。所謂數(shù)據(jù)穩(wěn)定性強(qiáng),是指這類(lèi)數(shù)據(jù)反映的信息是客觀事實(shí),一般不具有隨意性。如購(gòu)房人的身份信息家庭信息無(wú)法根據(jù)消費(fèi)者的意愿改變,但購(gòu)房需求的細(xì)節(jié)如戶(hù)型、周邊配套設(shè)施等,屬于消費(fèi)者的主觀意愿,本身沒(méi)有客觀事實(shí)與之對(duì)應(yīng),也就無(wú)穩(wěn)定性可言。數(shù)據(jù)的隱瞞成本,是指消費(fèi)者不披露該信息對(duì)于購(gòu)房交易而言,是否影響交易的完成與完成質(zhì)量。房地產(chǎn)的銷(xiāo)售人員相對(duì)于消費(fèi)者始終處于信息不對(duì)稱(chēng)的劣勢(shì)地位。消費(fèi)者具有選擇是否披露自身相關(guān)信息的主動(dòng)權(quán)。消費(fèi)者在交易完成前,出于各種原因(家庭安全、隱私保護(hù)等)選擇不披露與房產(chǎn)交易無(wú)直接關(guān)聯(lián)的信息,就不會(huì)造成交易上的損失,因而隱瞞成本低。但如果一個(gè)消費(fèi)者在與銷(xiāo)售人員交流時(shí)隱瞞其對(duì)于價(jià)格、戶(hù)型或周邊設(shè)施等消費(fèi)需求,這樣的隱瞞將會(huì)對(duì)交易造成直接的影響。基于這一分析,容易發(fā)現(xiàn):盡管房屋成交后的數(shù)據(jù)集由于產(chǎn)權(quán)登記這一流程,擁有上表中所有字段的信息,但在房地產(chǎn)交易完成之前,銷(xiāo)售人員難以獲得與消費(fèi)者本次購(gòu)房無(wú)直接關(guān)聯(lián)的人口統(tǒng)計(jì)數(shù)據(jù)和其他消費(fèi)習(xí)慣數(shù)據(jù)。因此,在數(shù)據(jù)集中應(yīng)將兩個(gè)門(mén)類(lèi)的數(shù)據(jù)剔除,只保留后兩個(gè)類(lèi)型做進(jìn)一步分析。在成交數(shù)據(jù)集中,各個(gè)字段均隱瞞成本較高,或如消費(fèi)者信息來(lái)源這類(lèi)信息由于導(dǎo)流渠道的確定性而無(wú)法隱瞞,因此均可以作為數(shù)據(jù)挖掘的數(shù)據(jù)集適用。
(二)實(shí)驗(yàn)結(jié)果及分析
基于上述數(shù)據(jù)處理后,在SPSS16.0平臺(tái)上進(jìn)行決策樹(shù)分析。基于前章節(jié)的論述,本文以二項(xiàng)分枝,能生成較為簡(jiǎn)明的樹(shù)規(guī)則CRT分類(lèi)方法為主要方法,以CHAID為參考方法進(jìn)行分析。針對(duì)所研究的問(wèn)題,不同于類(lèi)似銀行信用、航班延誤等預(yù)測(cè),房地產(chǎn)的不同類(lèi)型客戶(hù)各有其價(jià)值與風(fēng)險(xiǎn),剛需消費(fèi)者潛在價(jià)值可能偏低,但需求迫切成交的幾率也大,高端升級(jí)型消費(fèi)者潛在價(jià)值更高,但需求更多元,完成交易的幾率較小。很難說(shuō)哪類(lèi)誤判有更大的代價(jià)。因此,本文的分析中不設(shè)置成本偏好的不對(duì)稱(chēng)性。
1.對(duì)訪談客戶(hù)記錄的分析
通過(guò)觀察訪談數(shù)據(jù)集可以發(fā)現(xiàn),這一數(shù)據(jù)集建立決策樹(shù)模型并分類(lèi)的問(wèn)題在于:缺少一個(gè)核心指標(biāo)或組合規(guī)則將消費(fèi)者加以區(qū)分,并以此為“類(lèi)”對(duì)數(shù)據(jù)集進(jìn)行分類(lèi),這與訪談數(shù)據(jù)沒(méi)有結(jié)構(gòu)化的設(shè)計(jì)、信息獲得也比較零散有關(guān)。因此,本文首先對(duì)成交數(shù)據(jù)進(jìn)行分析,試圖解決對(duì)客戶(hù)需求進(jìn)行分類(lèi)的“類(lèi)”以何種規(guī)則確定的問(wèn)題。
2.對(duì)成交記錄分析
通過(guò)對(duì)交易數(shù)據(jù)的觀察發(fā)現(xiàn),消費(fèi)者的住宅消費(fèi)狀態(tài)這一信息具有優(yōu)良特性:首先由于全國(guó)建立產(chǎn)權(quán)信息登記制度,消費(fèi)者這一信息基本上屬于確定信息;其次,根據(jù)現(xiàn)行法規(guī),處于不同住宅消費(fèi)狀態(tài)的消費(fèi)者在所適用的稅收、貸款等交易內(nèi)容會(huì)有很大不同,在這一信息上選擇保留,將使自己在交易中蒙受損失。此外,房地產(chǎn)交易是大宗交易,客戶(hù)的消費(fèi)次數(shù)不可以直接反映出其財(cái)富水平、交易經(jīng)驗(yàn)等相關(guān)信息,可以作為客戶(hù)細(xì)分的變量。因此本文擬對(duì)消費(fèi)狀態(tài)(即剛需、首改、再改、升級(jí))作為客戶(hù)細(xì)分的標(biāo)準(zhǔn),進(jìn)行決策樹(shù)分類(lèi)。這一分類(lèi)規(guī)則有一定的經(jīng)濟(jì)含義,首先婚房與給父母買(mǎi)房,屬于有利益相關(guān)者,這一類(lèi)需求往往迫切缺乏考慮的余地,因此往往是剛需用戶(hù)。而其他客戶(hù)中,又以“關(guān)注住宅質(zhì)量”還是“單純?yōu)橥顿Y而購(gòu)房”加以區(qū)分。已有一套住房的客戶(hù),首次購(gòu)買(mǎi)改善性住房時(shí)往往更注重房屋升值空間,愿意升值犧牲居住質(zhì)量;而已有多次購(gòu)房經(jīng)歷的消費(fèi)者,再次購(gòu)房往往更關(guān)注生活質(zhì)量;而已經(jīng)購(gòu)買(mǎi)過(guò)改善性住房,但其購(gòu)買(mǎi)住房還沒(méi)有達(dá)到升級(jí)標(biāo)準(zhǔn)的再改客戶(hù)在分類(lèi)中并不明顯,是因?yàn)槠浼婢吡耸赘目蛻?hù)與升級(jí)客戶(hù)的特征。此外通過(guò)觀察在CRT規(guī)則的右枝第二層可以發(fā)現(xiàn),剛需客戶(hù)關(guān)注設(shè)施環(huán)境等問(wèn)題的比例遠(yuǎn)大于關(guān)注價(jià)格與升值空間,這一點(diǎn)與剛需客戶(hù)往往購(gòu)房自住或給家人居住,同時(shí)該筆交易對(duì)其家庭財(cái)富影響巨大有關(guān)。基于以上分析可知,利益相關(guān)人與投資導(dǎo)向是對(duì)房地產(chǎn)客戶(hù)細(xì)分的關(guān)鍵規(guī)則,其他的規(guī)則并不重要,這一點(diǎn)對(duì)房地產(chǎn)的銷(xiāo)售人員如何進(jìn)行溝通有一定指導(dǎo)意義。
3.投資深度重分類(lèi)與訪談?dòng)涗浽衮?yàn)證
以消費(fèi)狀態(tài)對(duì)客戶(hù)細(xì)分的主要規(guī)則是,是否有利益相關(guān)者和是否以投資為導(dǎo)向。基于這一認(rèn)識(shí),進(jìn)一步對(duì)訪談數(shù)據(jù)集進(jìn)行分析。兩種方法的相互驗(yàn)證表明這樣一個(gè)觀點(diǎn):無(wú)論是通過(guò)“利益相關(guān)人”還是“質(zhì)量敏感”來(lái)分類(lèi),對(duì)客戶(hù)區(qū)分度最大的因素都是住房面積。這一點(diǎn)不難解釋:當(dāng)客戶(hù)主動(dòng)聯(lián)系具體銷(xiāo)售中心接受訪談時(shí),可以斷定其對(duì)于自身經(jīng)濟(jì)條件和諸如學(xué)區(qū)等關(guān)鍵因素均已形成判斷,而所聯(lián)系的樓盤(pán),則恰好是其通過(guò)對(duì)自身信息判斷后找出的選項(xiàng),這一點(diǎn)可以啟發(fā)銷(xiāo)售人員,在同客戶(hù)溝通時(shí),首先根據(jù)上述判斷,溝通房源本身的戶(hù)型面積等問(wèn)題,可以提高溝通效率。同時(shí)應(yīng)注意,分枝的葉子集形式也有一定的信息含量,應(yīng)注意到:傾向于購(gòu)買(mǎi)大戶(hù)型住宅的客戶(hù)主要是“中間層”,“剛需”客戶(hù)與“升級(jí)”客戶(hù)則有購(gòu)買(mǎi)小戶(hù)型的傾向。
四、結(jié)論與政策建議
由于房地產(chǎn)消費(fèi)者與銷(xiāo)售人員間的信息不對(duì)稱(chēng),許多在交易完成前都無(wú)法獲得的“大數(shù)據(jù)”被用于數(shù)據(jù)挖掘和預(yù)測(cè),造成“實(shí)質(zhì)的貧數(shù)據(jù)”。本文通過(guò)對(duì)房地產(chǎn)銷(xiāo)售數(shù)據(jù)穩(wěn)定性與隱瞞成本的判斷,剔除客戶(hù)人口統(tǒng)計(jì)信息,改進(jìn)了數(shù)據(jù)集。同時(shí)通過(guò)對(duì)已成交購(gòu)房者按“消費(fèi)狀態(tài)”進(jìn)行決策樹(shù)分類(lèi),得到“利益相關(guān)者”和“以投資為導(dǎo)向”兩個(gè)穩(wěn)定的關(guān)鍵變量。以此指導(dǎo)對(duì)訪談數(shù)據(jù)集的分類(lèi),發(fā)現(xiàn)購(gòu)房者在與銷(xiāo)售人員接觸時(shí),首先關(guān)注的是房源的面積大小,而非如價(jià)格、戶(hù)型等其他信息。本文在兼顧預(yù)測(cè)精度的同時(shí),發(fā)現(xiàn)了可以直接用于指導(dǎo)人工銷(xiāo)售業(yè)務(wù)的知識(shí)規(guī)則,房地產(chǎn)銷(xiāo)售人員可借助以上規(guī)則,提高溝通效率、改善銷(xiāo)售業(yè)績(jī)。根據(jù)以上結(jié)論,地方在制定住房政策時(shí),也應(yīng)充分利用數(shù)據(jù)挖掘的技術(shù)及其發(fā)現(xiàn)的知識(shí):一方面,地方政府應(yīng)與房地產(chǎn)企業(yè)建立更加系統(tǒng)的信息共享機(jī)制,建立認(rèn)識(shí)住房需求的信息抓手,以便對(duì)已經(jīng)存在的住宅交易進(jìn)行市場(chǎng)調(diào)節(jié);另一方面,地方政府可進(jìn)一步善用擁有的戶(hù)籍等信息,加強(qiáng)對(duì)居民房產(chǎn)需求的理解,進(jìn)而改善區(qū)域內(nèi)房地產(chǎn)開(kāi)發(fā)的事前規(guī)劃,使市場(chǎng)更加平穩(wěn)有序地發(fā)展。