Kuinka asentaa Apache
Ennen kuin kirjoitat miten Apache-osa asennetaan, meillä on ensin yleiskatsaus Apachesta ja siitä, miten sitä käytetään tietojenkäsittelyssä.
Mikä on Apache?
Apache Web Server on HTTP-palvelin, joka esittelee verkkosivuja palvelimellesi tuleville vierailijoille. Joten jos haluat käyttää verkkosivustoa yrityksellesi tai organisaatiollesi, käyttäisit siihen todennäköisesti Apachea.
Siellä on muitakin HTTP-palvelimia, kuten IIS, mutta Apache on standardi, jota useimmat ihmiset käyttävät, olivatpa ne Linuxissa, Windowsissa tai Macissa. Apache on oletus, johon suurin osa käy, koska se on tunnettu, se on erittäin luotettava ja ilmainen.
Yksi asia, joka on ymmärrettävä Apachen kanssa, on se, että koska se on HTTP-palvelin, joten jos asennat tämän Linuxille, Windowsille tai Macille, kaikki mitä se sallii sinun tehdä on esitellä staattisia verkkosivustoja palvelimellesi tuleville vierailijoille. Siksi, jos koodit HTML-verkkosivuston, jolla ei ole muita ohjelmointikieliä kuin JavaScript, voit käyttää sitä vain Apache-palvelimen kanssa. Voit kytkeä kaikki tunnisteesi Apache-palvelimeen ja esitellä ne vierailijoillesi.
Kuinka Apache käytti datatieteessä?
Tietojenkäsittelytiede on nykymaailman kysynnällisin opintokenttä. Data Scientist -yritystä pidetään 2000-luvun seksikkäimpänä ammattina eri alojen ammattilaisten toimesta. Hän haluaa oppia ja tulla datatieteilijäksi. Apache on tärkeä rooli kaikissa tietotekniikan harrastajissa, koska he tarvitsevat riittävästi tietoa Apache Hadoop -ekosysteemistä.
Apache Hadoopin ekosysteemi
Aivan ensimmäinen asia on, että Hadoop-ekosysteemi ei ole yksi työkalu. Se ei ole ohjelmointikieli tai yksi kehys. Se on ryhmä työkaluja, joita eri yritykset käyttävät yhdessä eri aloilla useisiin tehtäviin. Käymme jokaisen työkalun läpi yksi kerrallaan alla: -
- Apache HDFS (Hadoop Distributed File System) on Hadoopin tallennusyksikkö, joka voisi tallentaa jäsenneltyä, puolijärjestelmällistä ja jäsentämätöntä tietoa. HDFS: llä on metatiedot, joka ylläpitää lokitiedostoa tallennetuista tiedoista. Sillä on kaksi komponenttia - NameNode ja DataNode.
- Apache Yarn on resurssineuvottelija, joka suorittaa kaikki prosessointitoimet, kuten ajoitetut tehtävät, allokoi resurssit jne. Siinä on kaksi palvelua - Ensimmäinen on Resurssienhallinta, joka ajoittaa langan päällä olevat sovellukset. Toinen on Node Manager, joka seuraa resurssien käyttöä .
- Apache Map Reduce on Hadoopin tietojenkäsittelykomponentti, joka käsittelee suuria tietojoukkoja käyttämällä hajautettua ja rinnakkaista laskentaa, joka perustuu Kartta-, Lajittelu-, Shuffle- ja Pienennä-toimintoihin. Karttatoiminto suodattaa tiedot, sitten lajittelu ja sekoitus tehdään ja lopussa Pienennä toiminto aggregoi ja tiivistää tuloksen.
- Apache Pig käytetään enimmäkseen ETL: ssä. Siinä on kaksi osaa - Pig Latin ja Pig runtime. Pig Latin on kieli, jota käytetään tietojen käsittelemiseen kyselyllä, kun taas Pig runtime on suoritusympäristö. Yksi sika Latin-rivi on melkein yhtä suuri kuin 100 riviä Map Reduce -koodia. Prosessiin sisältyy ensin datan lataaminen ja sen jälkeen ryhmittely, lajittelu, suodatus ja tallennus HDFS: ään.
- Apache Hive käyttää SQL-tyyppistä kyselyä tietojen analysointiin hajautetussa ympäristössä. Sillä on kaksi komponenttia - Hive-komentorivi ja JDBC / ODBC -palvelin, ja käytettyä kieltä kutsutaan HiveQL: ksi.
- Apache Mahout on Java-kielellä kirjoitettu Machine Learning -kirjasto, jota käytetään koneoppimissovellusten, kuten klusteroinnin, luokituksen tai regression, luomiseen. Sillä on erilaisia algoritmeja, jotka on rakennettu eri käyttötapoihin.
- Apache HBase on Java-kirjoitettu NoSQL-tietokanta, joka toimii Hadoopin yli. Se on rakennettu Googlen BigTable-pohjalta ja pystyy käsittelemään kaikenlaisia tietoja.
- Apache Sqoop on yksi tietojen syöttötyökalu, jota käytetään joukkorakenteisen tiedonsiirtoon RDBMS: n ja Hadoopin välillä.
- Apache Flume on toinen tiedonkeruutyökalu, jota käytetään puolistrukturoidun ja jäsentämättömän tiedonsiirtoon Hadoopin ja muiden tietolähteiden välillä.
- ZooKeeper on koordinaattori, joka varmistaa koordinoinnin Hadoop-ekosysteemin eri työkalujen välillä.
- Apache Ambari on klusteripäällikkö, joka huolehtii Hadoop-klustereista, hallitsee niitä ja seuraa niiden terveyttä ja tilaa.
- Apache Tez on uusi työkalu Hadoop-ekosysteemissä, joka nopeuttaa Hadoopin kyselyjen käsittelyä.
- Apache Presto on avoimen lähdekoodin jaettu SQL-kyselymoottori, joka mahdollistaa alustojen välisen kyselyominaisuuden.
- Apache HCatalog on Hadoopin metatieto- ja taulukkohallintajärjestelmä, joka mahdollistaa tietojenkäsittelytyökalujen yhteentoimivuuden. Se auttaa myös käyttäjiä valitsemaan parhaat ympäristönsä työkalut.
- Apache Spark on Data Scientist -yrityksen yleisimmin käytetty ja suosituin kehys. Se on nopea klusterilaskentajärjestelmä, joka optimoi resurssien käytön monien iteratiivisten tehtävien yhteydessä. Se antaa joustavuuden sekä eräkäsittelyyn että reaaliaikaiseen tietojen analysointiin.
Alla on ohjeet Apachen asentamiseen
Toistaiseksi olemme oppineet Apachesta ja siitä, miten siitä on hyötyä kaikille, jotka haluavat oppia Data Science tai Big Data Analytics. Nyt sukellamme alas ja asennamme apachen Windowsiin alla olevien vaiheiden perusteella.
- Siirry osoitteeseen https://httpd.apache.org/ ja napsauta Lataa-linkkiä Apache httpd 2.4.38 -julkaisun alla.
- Siirry seuraavalle sivulle ja napsauta sitten Microsoft Windowsin Tiedostot.
- Napsauta Apache Loungea.
- Voit ladata 32- tai 64-bittisen zip-tiedoston Windows-käyttöjärjestelmäsi perusteella. Lataamme 64-bittisen version täältä. Napsauta vastaavaa .zip-linkkiä ladataksesi.
- Nyt se vaatii C ++ -jakelukelpoista Visual Studio 2017. Joten lataamme sen vastaavasta 32- tai 64-bittisestä linkistä
- Kun molemmat tiedostot on ladattu, siirrymme ladattuun sijaintiin ja asennamme ensin C ++ Redistribvable Visual Studio 2017. Kaksoisnapsauta .exe-tiedostoa.
- Valitse Hyväksyn ja napsauta Asenna.
- Apachen asennus on käynnissä.
- Kun se on valmis, saat tämänkaltaisen viestin. Viimeistele asennus napsauttamalla Sulje.
- Siirry nyt kansioon, josta latasit Apache-zip-tiedoston. Napsauta sitä hiiren kakkospainikkeella ja valitse ote tästä.
- Nyt meille luodaan Apache24-kansio. Kopioi tämä kansio C-asemaan ja lisäämme sitten polun järjestelmäympäristön muuttujiin.
Siirry Järjestelmäominaisuudet -> Lisäasetukset-välilehti -> Napsauta alla olevaa Ympäristömuuttujat-painiketta.
- Etsi Muuttujat-kohdasta Polku ja napsauta Muokkaa.
- Napsauta Selaa -> Siirry C-aseman Apache24-kansioon -> Valitse roskikansiot -> Napsauta Ok.
- Asennamme Apache Windows-palveluna. Suorita komentokehote järjestelmänvalvojana. Kirjoita httpd –k install ja paina Enter.
- Tarkistamme asennetun Apache-palvelun. Napsauta Windows-kuvaketta ja kirjoita palvelut. Napsauta Palvelut-sovellusta ja etsi palvelu nimeltä Apache24.
- Käynnistä Apache-palvelin napsauttamalla sitä hiiren kakkospainikkeella ja napsauttamalla Käynnistä. Tila muuttuu "juoksevaksi".
- Voimme testata selaimen avulla. Avaa selain ja siirry kohtaan http: // localhost ja paina Enter. Viesti, joka ilmoittaa 'Se toimii!' aukeaa vahvistaaksesi Apachen onnistuneen asennuksen.
Suositellut artikkelit
Tämä on opas Apachen asentamisesta. Tässä olemme keskustelleet ohjeista ja Apachen asentamisen erilaisista vaiheista. Voit myös tarkastella seuraavaa artikkelia saadaksesi lisätietoja -
- Apache-haastattelukysymykset
- Apache Spark vs Apache Flink
- Apache Hadoop vs Apache Spark
- Apache Kafka vs Flume
- Kafka vs Kinesis | Suurimmat erot