A.填補(bǔ)數(shù)據(jù)種的空缺值
B.集成多個(gè)數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
您可能感興趣的試卷
你可能感興趣的試題
A.概念分層
B.離散化
C.分箱
D.直方圖
A.孤立點(diǎn)
B.空缺值
C.測(cè)量變量中的隨即錯(cuò)誤或偏差
D.數(shù)據(jù)變換引起的錯(cuò)誤
A.空間填充曲線
B.散點(diǎn)圖矩陣
C.平行坐標(biāo)
D.圓弓分割
A.標(biāo)稱屬性
B.二元屬性
C.序數(shù)屬性
D.數(shù)值屬性
A.算術(shù)平均值
B.截尾均值
C.中位數(shù)
D.眾數(shù)
最新試題
由于決策樹學(xué)會(huì)了對(duì)離散值輸出而不是實(shí)值函數(shù)進(jìn)行分類,因此它們不可能過度擬合。
要將工作申請(qǐng)分為兩類,并使用密度估計(jì)來檢測(cè)離職申請(qǐng)人,我們可以使用生成分類器。
小數(shù)據(jù)集的數(shù)據(jù)處理最好也由計(jì)算機(jī)手段來完成。
根據(jù)數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師對(duì)于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來進(jìn)行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對(duì)應(yīng)的存儲(chǔ)系統(tǒng)。
通過統(tǒng)計(jì)學(xué)可以推測(cè)擲兩個(gè)撒子同時(shí)選中3點(diǎn)的幾率。
當(dāng)數(shù)據(jù)集標(biāo)簽錯(cuò)誤的數(shù)據(jù)點(diǎn)時(shí),隨機(jī)森林通常比AdaBoost更好。
支持向量機(jī)不適合大規(guī)模數(shù)據(jù)。
選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個(gè)值,并選擇最小化失真度量的值。
最大似然估計(jì)的一個(gè)缺點(diǎn)是,在某些情況下(例如,多項(xiàng)式分布),它可能會(huì)返回零的概率估計(jì)。
非結(jié)構(gòu)化數(shù)據(jù)也可以使用關(guān)系型數(shù)據(jù)庫來存儲(chǔ)。