單項(xiàng)選擇題當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理()

A.直接使用該變量
B.根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量
C.使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)
D.直接刪除該變量


您可能感興趣的試卷

你可能感興趣的試題

1.單項(xiàng)選擇題在對歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么()

A.違反了建模的假設(shè)條件
B.加大了處理的難度
C.無法針對分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗
D.無法對不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法

4.單項(xiàng)選擇題下面關(guān)于聚類分析說法錯(cuò)誤的是()

A.一定存在一個(gè)最優(yōu)的分類
B.聚類分析是無監(jiān)督學(xué)習(xí)
C.聚類分析可以用于判斷異常值
D.聚類分析即:物以類聚,人以群分

5.單項(xiàng)選擇題以下哪個(gè)類型的變量在作預(yù)測客戶流失的模型中最有解釋力度?()

A.人口基本數(shù)據(jù),比如年齡和性別
B.基本社會狀態(tài)數(shù)據(jù),比如收入和職業(yè)
C.業(yè)務(wù)數(shù)據(jù),比如消費(fèi)頻次
D.業(yè)務(wù)數(shù)據(jù)的衍生變量,比如最近3個(gè)月消費(fèi)頻次的變化情況