一区二区三区国产最好的精华液 ,欧美成人一区二区三区不卡

人工智能之隨機(jī)森林(RF)

2018-05-05 07:42

通過(guò)上一篇文章《人工智能之決策樹(shù)》，我們清楚地知道決策樹(shù)（DT）是一類(lèi)常見(jiàn)的機(jī)器學(xué)習(xí)方法。決策樹(shù)（DT）在人工智能中所處的位置：人工智能－－＞機(jī)器學(xué)習(xí)－－＞監(jiān)督學(xué)習(xí)－－＞決策樹(shù)。決策樹(shù)主要用來(lái)解決分類(lèi)和回歸問(wèn)題，但是決策樹(shù)（DT）會(huì)產(chǎn)生過(guò)擬合現(xiàn)象，導(dǎo)致泛化能力變?nèi)?/strong>。過(guò)擬合是建立決策樹(shù)模型時(shí)面臨的重要挑戰(zhàn)之一。鑒于決策樹(shù)容易過(guò)擬合的缺點(diǎn)，由美國(guó)貝爾實(shí)驗(yàn)室大牛們提出了采用隨機(jī)森林（RF）投票機(jī)制來(lái)改善決策樹(shù)。隨機(jī)森林（RF）則是針對(duì)決策樹(shù)（DT）的過(guò)擬合問(wèn)題而提出的一種改進(jìn)方法，而且隨機(jī)森林（RF）是一個(gè)最近比較火的算法。因此有必要對(duì)隨機(jī)森林（RF）作進(jìn)一步探討。＾＿＾

隨機(jī)森林（RF）在人工智能中所處的位置：人工智能－－＞機(jī)器學(xué)習(xí)－－＞監(jiān)督學(xué)習(xí)－－＞決策樹(shù)－－＞隨機(jī)森林。

隨機(jī)森林（RF）指的是利用多棵樹(shù)對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類(lèi)器。該分類(lèi)器最早由Leo Breiman和Adele Cutler提出，并被注冊(cè)成了商標(biāo)。

那么什么是隨機(jī)森林？

隨機(jī)森林（RandomForests）是一個(gè)包含多個(gè)決策樹(shù)的分類(lèi)器，并且其輸出的類(lèi)別是由個(gè)別樹(shù)輸出的類(lèi)別的眾數(shù)而定。Leo Breiman和Adele Cutler發(fā)展并推論出隨機(jī)森林的算法。隨機(jī)森林（RF）這個(gè)術(shù)語(yǔ)是1995年由貝爾實(shí)驗(yàn)室的Tin Kam Ho所提出的隨機(jī)決策森林（random decision forests）而來(lái)的。這個(gè)方法則是結(jié)合 Breimans 的＂Bootstrap aggregating＂想法和 Ho 的＂random subspace method＂以建造決策樹(shù)的集合。

通過(guò)定義我們知道，隨機(jī)森林（RF）要建立了多個(gè)決策樹(shù)（DT），并將它們合并在一起以獲得更準(zhǔn)確和穩(wěn)定的預(yù)測(cè)。隨機(jī)森林的一大優(yōu)勢(shì)在于它既可用于分類(lèi)，也可用于回歸問(wèn)題，這兩類(lèi)問(wèn)題恰好構(gòu)成了當(dāng)前的大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)所需要面對(duì)的。

隨機(jī)森林是集成學(xué)習(xí)的一個(gè)子類(lèi)，它依靠于決策樹(shù)的投票選擇來(lái)決定最后的分類(lèi)結(jié)果。集成學(xué)習(xí)通過(guò)建立幾個(gè)模型組合的來(lái)解決單一預(yù)測(cè)問(wèn)題。集成學(xué)習(xí)的簡(jiǎn)單原理是生成多個(gè)分類(lèi)器／模型，各自獨(dú)立地學(xué)習(xí)和作出預(yù)測(cè)。這些預(yù)測(cè)最后結(jié)合成單預(yù)測(cè)，因此優(yōu)于任何一個(gè)單分類(lèi)的做出預(yù)測(cè)。

隨機(jī)森林的構(gòu)建過(guò)程：

假設(shè)N表示訓(xùn)練用例（樣本）個(gè)數(shù)，M表示特征數(shù)目，隨機(jī)森林的構(gòu)建過(guò)程如下：

1）輸入特征數(shù)目m，用于確定決策樹(shù)上一個(gè)節(jié)點(diǎn)的決策結(jié)果；其中m應(yīng)遠(yuǎn)小于M。

2）從N個(gè)訓(xùn)練用例（樣本）中以有放回抽樣的方式，取樣N次，形成一個(gè)訓(xùn)練集，并用未抽到的用例（樣本）作預(yù)測(cè)，評(píng)估其誤差。

3）對(duì)于每一個(gè)節(jié)點(diǎn)，隨機(jī)選擇m個(gè)特征，決策樹(shù)上每個(gè)節(jié)點(diǎn)的決定都是基于這些特征確定的。根據(jù)m個(gè)特征，計(jì)算其最佳的分裂方式。

4）每棵樹(shù)都會(huì)完整成長(zhǎng)而不會(huì)剪枝，這有可能在建完一棵正常樹(shù)狀分類(lèi)器后會(huì)被采用。

5）重復(fù)上述步驟，構(gòu)建另外一棵棵決策樹(shù)，直到達(dá)到預(yù)定數(shù)目的一群決策樹(shù)為止，即構(gòu)建好了隨機(jī)森林。

其中，預(yù)選變量個(gè)數(shù)（m）和隨機(jī)森林中樹(shù)的個(gè)數(shù)是重要參數(shù)，對(duì)系統(tǒng)的調(diào)優(yōu)非常關(guān)鍵。這些參數(shù)在調(diào)節(jié)隨機(jī)森林模型的準(zhǔn)確性方面也起著至關(guān)重要的作用�？茖W(xué)地使用這些指標(biāo)，將能顯著的提高隨機(jī)森林模型工作效率。

1 2 下一頁(yè)>

人工智能AI 機(jī)器學(xué)習(xí)ML 隨機(jī)森林RF

相關(guān)閱讀
人工智能AI 機(jī)器學(xué)習(xí)ML 隨機(jī)森林RF

聯(lián)想集團(tuán)香港創(chuàng)新科技大會(huì)：混合式AI賦能“人工智能+”生態(tài)創(chuàng)新 2025-03-06

新一代人工智能蓬勃興起，量化派與DeepSeek等共同入選年度百大AI產(chǎn)品榜單 2025-03-06

美國(guó)發(fā)布人工智能擴(kuò)散出口管制框架，美國(guó)打算“全球限制”AI芯片？ 2025-01-20

2024-12-24

模型訓(xùn)練：優(yōu)化人工智能和機(jī)器學(xué)習(xí)，完善DevOps工具的使用 2023-09-01

分享
新浪微博騰訊QQ QQ空間微信

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：

密碼：

忘記密碼？

用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁，請(qǐng)輸入驗(yàn)證碼繼續(xù)

驗(yàn)證碼：刷新

最新評(píng)論

熱門(mén)評(píng)論

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

中國(guó)“智造”背后的「關(guān)鍵力量」

小米汽車(chē)研發(fā)中心重磅落地，寶馬家門(mén)口“搶人”

美版“閉關(guān)鎖國(guó)”：下載DeepSeek將最高判20年、罰1億美元

芯片大廠恩智浦：全球裁員1800人

日產(chǎn)、本田合并告吹，富士康迎來(lái)機(jī)會(huì)？

突發(fā)！臺(tái)積電再對(duì)大陸斷供，16/14nm

臺(tái)積電拒絕代工三星

上海國(guó)產(chǎn)EDA，獲10億A輪融資