Kuinka asentaa NLTK?

Seuraava artikkeli Asenna NLTK tarjoaa yleiskatsauksen NLTK: n asentamiseen. NLTK on joukko kirjastoja luonnollisen kielen käsittelyyn. Se on alusta Python-ohjelmien rakentamiseksi luonnollisen kielen käsittelemiseksi. NLTK on kirjoitettu Python-ohjelmointikielellä. Sen ovat kehittäneet Steven Bird ja Edward Loper. Se tukee tutkimusta ja opetusta NLP: llä tai läheisesti läheisillä alueilla, mukaan lukien kognitiivinen tiede, empiirinen kielitiede, tiedon haku, tekoäly ja koneoppiminen. NLTK tarjoaa helpon käyttöliittymän.

NLTK (luonnollisen kielen työkalupakki)

  • Luonnollinen kielenkäsittely (NLP) on osa tekoälyä, joka käsittelee ihmisten puhuttavaa kieltä. Siksi se auttaa ihmisiä vuorovaikutuksessa tietokoneiden kanssa, vaikka heillä ei olisi tietoa sen käytöstä. Käyttämällä NLP: tä ihmiset tarvitsevat vain sanella komennon tietokoneille. Koneoppimisen ansiosta luonnollisesta kielenkäsittelystä on tulossa suosittua ja helpompaa toteuttaa. Periaatteessa se on tekniikka vuorovaikutukseen ihmisten kanssa ja toimintojen suorittamiseen äänikomennoilla.
  • Tämä mahdollistaa laitteiden käytön myös aloittelijoille, joilla ei ole tietoa tekniikasta. Mutta luonnollisen kielenkäsittelyn toteuttaminen ei ole helppoa, koska ihmisten puhumassa kielellä ei ole selkeää rakennetta. Se on epäselvä ja riippuu kontekstisanoista, joilla voi olla erilainen merkitys.
  • NLTK: llä on yli 50 kappaletta ja sanallisia lähteitä, kuten WordNet, Problem Report Corpus, Penn Treebank Corpus jne. Sen mukana tulee myös opas, joka selittää kielikäsittelyn käsitteet työkalupakin avulla ja Python-ohjelmoinnin perusteet, mikä helpottaa ihmisten käyttöä joilla ei ole syvää tietoa ohjelmoinnista. Sillä on laaja valikoima paketteja, mikä tekee siitä yhden tehokkaan työkalusarjan NLP: lle. Tokenization, Lemmatization, Stemming, Parsing, Merkkien lukumäärä, välimerkit, sanamäärä ovat joitain näistä paketeista.

Asenna NLTK for Windows

Alla on ohjeet NLTK: n asentamiseen Windows-käyttöjärjestelmälle. Nämä perustuvat oletukseen, että Pythonia ei ole asennettu järjestelmään. NLTK vaatii Python-versioita 2.7, 3.5 tai uudempaa.

Vaihe 1: Lataa uusin Python for Windows -versio alla olevasta linkistä

https://www.python.org/downloads/

Vaihe 2: Suorita se napsauttamalla ladattua .exe-tiedostoa.

Vaihe 3: Valitse mukauta asennus.

Vaihe 4: Tarkista kaikki ominaisuudet, erityisesti "pip", koska se auttaa NLTK: n asentamisessa, ja napsauta Seuraava.

Vaihe 5: Valitse seuraavassa näytössä lisäasetukset, valitse polku ja napsauta asentaa.

Vaihe 6: Kun asennus on onnistunut, lähellä ikkunaa.

Vaihe 7: Kopioi Skriptit-kansion polku NLTK: n asentamiseksi samaan kansioon.

NLTK voidaan asentaa helposti “pip” -asennusohjelmalla. Meidän on myös asennettava “numpy”.

Vaihe 8: Asentaaksesi NLTK: n, avaa komentokehote ja kirjoita komento alla.

Varmista, että asennus onnistui.

Onnistuneen asennuksen jälkeen on nyt aika käyttää NLTK: tä luonnollisen kielen käsittelyyn.

Vaihe 9: Avaa Python Shell ja kirjoita komento alapuolelle.

Jos se tuodaan ilman virheitä, NLTK on asennettu oikein.

Asenna NLTK Mac / Linuxille

Toisin kuin Windows, Linux-järjestelmät keksivät Pythonin asennettuna siihen. NLTK: n asentamiseen Linuxiin / Mac: iin käytetään Pythonin Pip-paketin asennusohjelmaa. Asentaaksesi pipin tai päivittääksesi sen, kirjoita komentokehotteen komentojen alapuolelle.

Asenna python Linuxiin käyttämällä seuraavia komentoja.

Vaihe 1: Päivitä pakettihakemisto käyttämällä alla olevaa komentoa.

Vaihe 2: Asenna Python Linux-käyttöjärjestelmään alla.

Vaihe 3: Asenna “pip” Python 3 : aan kirjoittamalla alla oleva komento.

Vaihe 4: Kun “Pip” on asennettu, käytä seuraavia komentoja NLTK: n asentamiseen.

NLTK-tietojoukko

NLTK: llä on monia luonnollisen kielen käsittelyyn käytettävissä olevia tietoaineistoja, esimerkiksi WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank jne. Näitä tietojoukkoja kutsutaan corporaksi. Pohjimmiltaan NLTK-tietojoukko sisältää joukon tiedostoja tai asiakirjoja. Jokainen tiedosto / asiakirja sisältää kokoelman sanoja, kirjaimia tai tekstiä yhdellä kielellä. Siksi korpus on pääasiassa kirjastoja kielen ymmärtämiseksi / oppimiseksi. Sillä on kielioppisäännöt ja kielen rakenne.

Kun olet asentanut NLTK: n, voit tuoda sen ja myös ladata sen korroosi seuraavalla komennolla.

NLTK downloader avaa ikkunan tiedostojen lataamiseen. Aineiston koko on iso, joten se vie aikaa. Kokeile tuoda tietojoukko ja käyttää sitä, jotta voidaan tarkistaa, onko tietojoukot asennettu oikein.

NLTK: n käsittely

Luonnollisen kielen käsittelyssä on 5 pääprosessia. Nämä ovat vaiheet minkä tahansa tekstin käsittelyyn.

  1. EOS-tunnistus : Puhelun havaitsemisen lopussa teksti muutetaan merkityksellisten lauseiden kokoelmaksi. Se jakaa pitkän tekstin osiin, joilla on jonkinlainen merkitys.
  2. Tokenisaatio : Tämä vaihe jakaa lauseet tokeneihin . Tokenit eivät sisällä vain sanoja, vaan myös välilyöntejä, lauseen katkoja.
  3. POS-merkinnät : POS tarkoittaa puhetta. Täällä tiedot on osoitettu merkkiin. Nämä tiedot viittaavat siihen, minkä tyyppinen puhe on jännittynyt, verbi, adjektiivi, substantiivi jne.
  4. Chunking : Chunking tarkoittaa tekstipohjaisten tunnisteiden keräämistä.
  5. Uuttaminen: Uuttaminen on jatkuva prosessi, jossa käydään palasia ja merkitään ne nimetyiksi kokonaisuuksiksi, kuten ihmiset, paikat, organisaatiot jne.

johtopäätös:

NLTK: tä käytetään tekstien luokittelussa, kuvien kuvatekstissä, puheentunnistuksessa, kysymysten vastaamisessa, kielten mallinnuksessa, asiakirjojen yhteenvedossa ja monissa muissa toiminnoissa. Luonnolliselle kielenkäsittelylle on olemassa monia muita työkaluja. Mutta NLTK: llä on laaja valikoima kirjastoja, mikä tekee siitä yhden tehokkaista luonnollisen kielen käsittelytyökaluista. Se on tarkempi kuin mikään muu työkalu, mutta suuren määrän kirjastojen vuoksi se on vähän hidas. Joten kaikki riippuu käyttäjän vaatimuksista. Jos käyttäjä haluaa nopeutta, hän voi myös mieluummin käyttää muita työkaluja, mutta heidän on sitten kompromissi sisällön tarkkuuden kanssa. Mutta jos tarkkuus on etusijalla, heidän pitäisi ehdottomasti mennä NLTK: n puoleen.

Suositellut artikkelit:

Tämä on opas NLTK: n asentamiseen. Tässä keskustellaan peruskäsitteestä ja eri vaiheista NLTK: n asentamiseksi Windows- ja Linux \ Mac-järjestelmiin. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja-

  1. Asenna Kubernetes-hallintapaneeli
  2. Kuinka asentaa JDK
  3. Asenna Docker
  4. Kuinka asentaa Magento?
  5. Magento -versiot | Magento -versioiden ominaisuudet