多項選擇題隨機森林利用隨機的方式將許多決策樹組合成一個森林,每個決策樹在分類的時候決定測試樣本的最終類別。它的優(yōu)點是()

A.能夠處理高緯度的數(shù)據(jù),并且不做特征選擇
B.每次學(xué)習(xí)使用不同訓(xùn)練集,一定程度避免過擬合
C.在某些噪音較大的分類或回歸問題上不會過擬合
D.級別劃分較多的屬性不會影響模型效果


您可能感興趣的試卷

你可能感興趣的試題

1.多項選擇題在數(shù)據(jù)挖掘中,以下哪三種算法應(yīng)用最為廣泛()

A.決策樹算法
B.回歸算法
C.聚類分析
D.神經(jīng)網(wǎng)絡(luò)算法

2.單項選擇題集中性能系統(tǒng)的數(shù)據(jù)源不包括()

A.信令CDR數(shù)據(jù)
B.話務(wù)統(tǒng)計數(shù)據(jù)
C.綜合資源數(shù)據(jù)
D.業(yè)務(wù)營銷數(shù)據(jù)

3.單項選擇題當目標是連續(xù)變量時,該決策樹是()

A.分類樹
B.回歸數(shù)
C.二分數(shù)
D.多分樹

4.單項選擇題基于數(shù)據(jù)挖掘分析,開展業(yè)務(wù)質(zhì)量分析的分析與預(yù)判時,下列哪項說法是錯誤的()

A.當業(yè)務(wù)質(zhì)量分析的樣本流量太大,可以結(jié)合計算資源能力,通過合理比例的樣本抽樣,開展指標計算與分析
B.對于業(yè)務(wù)質(zhì)量的指標分析,選取單個用戶的業(yè)務(wù)訪問xdr,即可計算該業(yè)務(wù)的指標情況,評估該業(yè)務(wù)是否存在內(nèi)容資源質(zhì)差
C.不同業(yè)務(wù)的質(zhì)量指標通常存在一定差值,該現(xiàn)象與各業(yè)務(wù)的業(yè)務(wù)特性、用戶行為、內(nèi)容資源差異等多個因素有關(guān),屬于正?,F(xiàn)象
D.業(yè)務(wù)質(zhì)量分析中,通常結(jié)合業(yè)務(wù)指標的歷史值(如該指標上周均值)與指標的固定閾值(如成功率是否低于90%),來作為是否出現(xiàn)質(zhì)差或者劣化的判斷依據(jù)

5.單項選擇題Tableau是廣義數(shù)據(jù)挖掘中的哪一類工具()

A.數(shù)據(jù)清洗
B.數(shù)據(jù)存儲
C.可視化
D.數(shù)據(jù)建模