Johdanto päätöksentekopuun luomiseen

Tietojärjestelmien tuottaman datan määrän viimeaikaisen nopean kasvun myötä suurten tietojoukkojen käsittelemiseksi on valtava tarve päätöspuulle laskennan monimutkaisuuden vähentämiseksi. Päätöspuuta voidaan pitää tärkeimmänä lähestymistapana luokittelejien edustamisessa. Toisin sanoen voidaan sanoa, että tiedot on jäsennelty jakamis- ja valloitusstrategian avulla. tietääksemme, että olemme vain tutkineet. Päätöspuu on rakennettu puitteiksi tarkentamaan edestakaisin tehtyjen päätösten arvoja ja todennäköisyyttä

m jokainen solmun taso, auttaa päätöksentekijöitä valitsemaan oikeat ennusteet useista sopimattomista tiedoista. Tässä artikkelissa käydään läpi kuinka luoda päätöksentekopuu yksinkertaisen näytteen perusteella.

Mikä on päätöksentekopuu?

Päätöspuu on binaarinen hierarkkinen rakenne, joka identifioi tavan, jolla kukin solmu jakaa tietojoukon eri olosuhteiden perusteella. Luodaan optimaalinen puu mallilähestymistavalla luokittelemaan vastausmuuttuja, joka ennustaa kohdemuuttujan arvon yksinkertaisilla päätöksensääntöillä (jos niin, sitten muuten). Lähestymistapa on ohjattu oppiminen, jota käytetään pääasiassa luokitteluongelmiin ja jota pidetään erittäin tehokkaana ennustemallina. Niitä käytetään eri sovellusalueilla, kuten peliteoria, tekoäly, koneoppiminen, tiedon louhinta ja sellaisilla aloilla kuin turvallisuus ja lääketiede.

Kuinka luoda päätöksentekopuu?

Päätöspuu luodaan yksinkertaisesti ylhäältä alas; ne koostuvat solmuista, jotka muodostavat suunnatun solmun, jolla on juurisolmuja, joissa ei ole tulevia reunoja. Kaikkia muita solmuja kutsutaan päätöksenteko-solmuiksi (sisäisiä solmuja ja lehtisolmuja, jotka vastaavat ominaisuus- ja luokkatunnisteita), joissa on vähintään yksi saapuva reuna. Tietosarjojen päätavoite on minimoida yleistysvirheet etsimällä optimaalinen ratkaisu päätöksentekopuusta.

Seuraavaksi selitetään esimerkki päätöksentekopuusta mallitietojoukolla. Tavoitteena on ennustaa onko voitto laskenut vai nouseva käyttämällä elämän ja kilpailun ominaisuuksia. Tässä päätöspuun muuttujat ovat kategorisia (kyllä, ei).

Tietojoukko

elämä kilpailu Tyyppi Voitto
Vanha Joo Ohjelmisto Alas
Vanha Ei Ohjelmisto Alas
Vanha Ei Laitteisto Alas
keski- Joo Ohjelmisto Alas
keski- Joo Laitteisto Alas
keski- Ei Laitteisto ylös
keski- Ei Ohjelmisto ylös
Uusi Joo Ohjelmisto ylös
Uusi Ei Laitteisto ylös
Uusi Ei Ohjelmisto ylös

Yllä olevasta tietojoukosta: elämä, kilpailu, Tyyppi ovat ennustajia ja ominaisuuden voitto on tavoite. Päätöspuun toteuttamiseksi on olemassa useita algoritmeja, mutta paras päätöksentekopuun rakentamiseen käytetty algoritmi on ID3, joka painottaa ahnean haun lähestymistapaa. Päätöksessä noudatetaan päätelmäsääntöä tai disjunktiivista normaalia muotoa (^).

Päätöspuu

Aluksi kaiken harjoitusominaisuuden katsotaan olevan juuri. Järjestysprioriteetti määritteiden asettamiseksi juuriksi tehdään seuraavalla tavalla. Tämän prosessin tiedetään määrittelevän valinnan tunnistaakseen mikä attribuutti tehdään juurisolmukseksi jokaisella tasolla. Puu seuraa kahta vaihetta: puun rakentaminen, puiden karsiminen. Ja tiedot on jaettu kaikkiin päätöksenteon solmuihin.

Tietojen saaminen

Se on entropian muutoksen mitta riippumattoman muuttujan perusteella. Päätöksen puun on löydettävä suurin tiedonsaanti.

Haje

Entropia määritellään kuten äärelliselle joukolle, satunnaisuuden mitalle tiedossa tai tapahtuman ennustettavuudelle, jos näyte on samanlaisia ​​arvoja, sitten entroopia on nolla ja jos se on jaettu tasan näytteen kanssa, niin se on yksi.

Entropia luokalle

Missä p on todennäköisyys saada voittoa sanoa "kyllä" ja N on tappio sanoa "ei".

siksi entropia = 1

Kun entropia-arvo on laskettu, on tarpeen päättää juurisolmu attribuutista.

Iän entropia

Life-ominaisuuden tietojoukon mukaan meillä on vanha = 3 alaspäin, puoliväliin = 2 alas ja yksi ylöspäin voittomerkkiä kohti.

elämä pii ni I (pi, ni)
Vanha 0 3 0
keski- 2 2 1
Uusi 3 0 0

Hyöty = luokan entropia - elämän entropia = 1 - 0, 4 = 0, 6

Entropia (kilpailu) = 0, 87

kilpailu pii ni I (pi, ni)
Joo 1 3 0, 8
Ei 4 2 0, 9

Voitto = Luokan entropia - Elämän entropia = 1 - 0, 87 = 0, 12

Nyt ongelma esiintyy määritteessä Life, jossa puolivälissä on yhtä suuri todennäköisyys sekä ylös että alas. siksi entropia on 1. samalla tavalla, se lasketaan tyyppimääritteelle, taas entroopia on 1 ja vahvistus on 0. Nyt on tehty täydellinen päätös saada tarkka tulos keskiarvolle.

Päätöksen puun edut

  • Ne ovat helppo ymmärtää ja tuotetut säännöt ovat joustavia. Hänellä on vähän vaivaa tietojen valmisteluun.
  • Visuaalinen lähestymistapa päätösten ja tulosten esittämiseen on erittäin hyödyllistä.
  • Päätöspuu käsittelee harjoitustietojoukon virheitä ja puuttuvia arvoja.
  • Hän pystyy käsittelemään erillistä arvoa ja numeerista ominaisuutta. Se toimii kategoriallisina ja jatkuvina muuttujina tulolle ja ulostulolle.
  • Ne ovat hyödyllinen työkalu yritysalueelle, jonka on tehtävä päätöksiä analysoinnin jälkeen tietyissä olosuhteissa.

Haitot päätöspuussa

  • Oppijat voivat luoda monimutkaisen päätöksentekopuun koulutetusta tiedosta riippuen. tätä prosessia kutsutaan liikaa asennukseksi, vaikeaksi prosessiksi päätöksentekopuumalleissa.
  • Suositut arvot ovat kategorisia, jos se on jatkuvaa, päätöksentekopuu menettää tiedon, mikä johtaa virhealttiuteen. Eksponentiaalinen laskennan kasvu on suurempi analysoitaessa.
  • Monet luokan etiketit johtavat vääriin monimutkaisiin laskelmiin ja antavat tietosarjan alhaisen ennustetarkkuuden.
  • DT-algoritmissa saatu tieto antaa puolueellisen vastauksen kategorisiin korkeampiin arvoihin.

johtopäätös

Siksi päätelmänä on, että päätöksentekopuut tarjoavat käytännöllisen ja helpon oppimismenetelmän, joka tunnetaan vahvasti koneiden oppimisen tehokkaina työkaluina, koska lyhyessä ajassa ne toimivat hyvin suurten tietojoukkojen kanssa. Se on oppimistehtävä, joka käyttää tilastollista lähestymistapaa yleisen johtopäätöksen tekemiseen. Nyt se ymmärretään paremmin, miksi päätöksentekopuuta käytetään ennustavassa mallinnuksessa, ja tietotekijöille he ovat tehokkaita työkaluja.

Suositellut artikkelit

Tämä on opas päätöksentekopuun luomiseen. Tässä keskustellaan siitä, miten luodaan päätöksentekopuu sekä erilaisia ​​etuja ja haittoja. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Katsaus päätöksentekopuuhun R
  2. Mikä on päätöspuun algoritmi?
  3. Johdatus tekoälytyökaluihin
  4. Top 10 tekoälyhaastattelukysymystä

Luokka: