A.冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響
B.子樹可能在決策樹中重復(fù)多次
C.決策樹算法對(duì)于噪聲的干擾非常敏感
D.尋找最佳決策樹是NP完全問題
您可能感興趣的試卷
你可能感興趣的試題
A.KNN
B.SVM
C.Bayes
D.神經(jīng)網(wǎng)絡(luò)
A.DBSCAN
B.C4.5
C.K-Mean
D.EM
A.與同一時(shí)期其他數(shù)據(jù)對(duì)比
B.可視化
C.基于模板的方法
D.主觀興趣度量
A.系數(shù)
B.幾率
C.Cohen度量
D.興趣因子
A.頻繁子集挖掘
B.頻繁子圖挖掘
C.頻繁數(shù)據(jù)項(xiàng)挖掘
D.頻繁模式挖掘
最新試題
對(duì)于文本數(shù)據(jù)和多媒體數(shù)據(jù)進(jìn)行特征提取是為了方便對(duì)于這類數(shù)據(jù)的觀察和理解。
通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時(shí),我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓(xùn)練數(shù)據(jù)的可能性。
經(jīng)常跟管理層打交道并進(jìn)行有效地關(guān)于商業(yè)領(lǐng)域的討論有助于數(shù)據(jù)科學(xué)項(xiàng)目的成功。
數(shù)據(jù)索引就像給每條數(shù)據(jù)裝了個(gè)信箱。
當(dāng)反向傳播算法運(yùn)行到達(dá)到最小值時(shí),無論初始權(quán)重是什么,總是會(huì)找到相同的解(即權(quán)重)。
選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個(gè)值,并選擇最小化失真度量的值。
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。
完整性,一致性,時(shí)效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個(gè)維度指標(biāo)。
最大似然估計(jì)的一個(gè)缺點(diǎn)是,在某些情況下(例如,多項(xiàng)式分布),它可能會(huì)返回零的概率估計(jì)。
根據(jù)數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師對(duì)于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來進(jìn)行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對(duì)應(yīng)的存儲(chǔ)系統(tǒng)。