單項(xiàng)選擇題在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測(cè)試集的說法錯(cuò)誤的是()

A.測(cè)試集和訓(xùn)練集是相互聯(lián)系的
B.測(cè)試集是用以測(cè)試模型的數(shù)據(jù)集
C.通常測(cè)試集大約占總樣本的三分之一
D.K-次交叉驗(yàn)證中,測(cè)試集只有


您可能感興趣的試卷

你可能感興趣的試題

1.單項(xiàng)選擇題企業(yè)要建立預(yù)測(cè)模型,需準(zhǔn)備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是()

A.數(shù)據(jù)越多越好
B.盡可能多的適合的數(shù)據(jù)
C.數(shù)據(jù)越少越好
D.以上三條都不正確

2.單項(xiàng)選擇題一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的信心水平(confidence)為60%,則代表()

A.買B商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買A
B.同時(shí)購(gòu)買AB兩商品的顧客,占所有顧客的60%
C.買A商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買B
D.兩商品AB在交易數(shù)據(jù)庫中同時(shí)被購(gòu)買的機(jī)率為60%

3.單項(xiàng)選擇題Naive Bayes是屬于數(shù)據(jù)挖掘中的什么方法?()

A.聚類
B.分類
C.時(shí)間序列
D.關(guān)聯(lián)規(guī)則

4.單項(xiàng)選擇題當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理()

A.直接使用該變量
B.根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量
C.使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)
D.直接刪除該變量

5.單項(xiàng)選擇題在對(duì)歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么()

A.違反了建模的假設(shè)條件
B.加大了處理的難度
C.無法針對(duì)分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗
D.無法對(duì)不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法