Talend Open Studio - Opi edut, sovellukset ja komponentit

Sisällysluettelo:

Anonim

Johdatus Talend Open Studioon

Talend tarjoaa Open Studio -sovelluksen, joka on avoin lähdekoodi tietojen integrointiin. Siinä on yli 800 komponenttia erilaisiin integrointitarkoituksiin. Lataa Talend Open Studio osoitteesta https://www.talend.com/download/

Tietojen integrointi tarkoittaa eri lähteistä saatujen tietojen yhdistämistä ja yhdistämistä yhdeksi näkymäksi, jotta saadaan merkityksellistä tietoa siitä, joka voi auttaa yritystä tai organisaatiota parantamaan liiketoimintaansa analysoimalla näitä tietoja. Integrointi auttaa tiedon hankkimisessa, tietojen puhdistamisessa tarvittavien muutosten tekemisessä jne. Ja sitten lataamisen tietovarastoon.

Mikä on Talend?

Talend on ETL-työkalu, jota käytetään tiedon integrointiin. Talend tarjoaa ratkaisun tietojen valmisteluun, tiedon laatuun, tietojen integrointiin ja isoihin tietoihin. Tässä keskustellaan joistakin osista. Alla olevan esimerkin näkemisen helpottamiseksi Sim-operaattorilla on valtavia tietoja suunnitelmista, asiakkaista, sim-yksityiskohdista jne. Nämä tiedot ovat valtavia, joten suuria tietoja käytetään myös integroinnissa.

Asiakas Sim: n ostaminen käyttämällä julkista tunnusta

Annetaan hänen nimensä AB C: ksi

osoite Chennai, Chennai

puhelinnumero 1234567890

Tietojen integroinnin jälkeen

Etunimi: AB

Sukunimi: C

Osoite: Chennai, Intia

Puhelinnumero: +911234567890

Täällä tiedot puhdistetaan ja muutetaan jotain merkityksellisempää.

hyötyjä

  • Yritystrendien analysointi tietojen integroinnin avulla
  • Tietojen yhdistäminen yhdeksi järjestelmäksi
  • Aikaa säästävä ja tehokkaampi ja vähemmän työstöjä
  • Easy Report -sovellus - BI-työkalujen käyttämä
  • Tietojen ylläpito ja lisääminen tietovarastoon ja tietokarttoihin

hakemus

Tässä ovat seuraavat sovellukset, jotka mainitaan alla

1. Työskentely Talendin kanssa

  • Varmista, että Java on asennettu ja ympäristömuuttujat on asetettu.
  • Lataa avoimen lähdekoodin Talend-verkkosivusto ja asenna ohjelmisto.
  • Luo uusi projekti ja viimeistele asennus
  • Talend avautuu suunnittelija-välilehdessä.
  • Talend on eclipse-pohjainen työkalu ja komponentit voidaan vetää paletilta tai napsauttaa ja kirjoittaa komponenttien nimi.

2. Ensimmäinen työ Tiedoston lukeminen

  • Etsi komponentti tFileinputdelimited. Tätä komponenttia käytetään lukemaan rajoitetut tiedostot.
  • Sijoita tfileinputdelimited komponentti. Etsi tlogrow ja aseta se työn suunnittelijaan.
  • Napsauta hiiren kakkospainikkeella tfileinputdelimited ja valitse rivi-> pää ja vedä viiva kasautumiseen.
  • Komponentissa välilehti valitsee luettavan tiedoston polun ja antaa rivierottimen \ n. Jos tiedostossa on erotin, voit mainita erottajan.
  • Napsauta kaavaa ja anna sarakkeen tyyppitiedot tai voit lukea koko rivin merkkijonona, jossa on yksi sarake, ja erotusarvon tulisi olla tyhjä.
  • Voit ohittaa myös otsikon ja alatunnisteen.
  • Valitse tlogrow-komponentissa tapa, jolla haluat nähdä tiedot. Taulukko- tai yksirivinen muoto.
  • tlogrow näyttää tulosteen suorituskonsolissa.
  • Yhdistämisen jälkeen sekä tfileinputdelimited että tlogrow suorittavat työn suoritusvälilehdeltä.
  • Voit nähdä tulostetun konsolin tiedoston sisällön.

3. Toinen työ Tmap: n avulla

  • Lue tiedosto ja suodata se erilaisiin tulostetiedostoihin.
  • Lue tiedosto tfileinputdelimited -komponentista yhdellä sarakkeella tietueena.
  • Tmap-komponentti - Tämä komponentti auttaa muuntamaan dataa joillakin sisäisillä toiminnoilla, kuten haulla, liittymisillä jne.
  • Luo tmap-muodossa kaksi lähtöä1 ja 2.
  • Lisää out1-suodattimeen rivi3.rekord.sisältää (“talend”) ja vedä ennätys out1: ään.
  • Piirrä tietueen linja toiseen out2: een.

  • Ota tmap-tiedostosta päärivit ja muodosta yhteys kahteen tfileoutputdelimited.
  • out1-linkki yhteen tfileoutputdelimited1 tiedostona1.txt ja out2 toiseen tfileoutputdelimited2 tiedostona2.txt.
  • txt: llä on tietueita, jotka sisältävät talendin.
  • txt: llä on tietueita, joilla on muita nimiä.

4. Sisäänrakennettu ja arkisto

  • Sisäänrakennettu tarkoittaa, että sinun tulee asettaa kaavio tai yksityiskohdat tietokantaan yhdistämistä varten joka kerta.
  • Varasto on hyödyllinen tietojen tallentamiseksi metatietoihin, jotta voit käyttää samoja tietoja joka kerta syöttämättä tietoja manuaalisesti joka kerta. Metatiedoissa voit tallentaa tiedostokaavion, tietokantayhteydet, Hadoop-yhteyden, pesän yhteyden, s3-yhteyden ja monia muita.

Talend Open Studion komponentit

Tässä on seuraavat Talend Open Studion komponentit alla

1. tFileList

  • Tämä komponentti luettelee hakemistossa tai kansiossa olevat tiedostot, joissa on annettu tiedostomaski.

2. tMysqlConnection

  • Tätä komponenttia käytetään yhteyden muodostamiseen mysql-tietokantaan.
  • Mysql-komponentit voivat käyttää tätä yhteyttä helpottamaan yhteyden muodostamista tietokantaan.

3. tMysqlinput

  • Tämä komponentti auttaa suorittamaan mysql-tietokantakyselyn ja saamaan taulukon tai sarakkeet. Tätä komponenttia käytetään kyselyiden valintaan ja yksityiskohtien saamiseen.

4. tMysqlOutput

  • Tätä komponenttia käytetään tietojen lisäämiseen tai päivittämiseen Mysql-tietokantaan.

5. hieronta

  • Tämä komponentti suoritetaan työssä ensimmäisenä ja se voidaan yhdistää muihin komponentteihin, joiden alitunniste on ok.

6. tpostjob

  • Tämä komponentti on viimeinen, joka suoritetaan työssä. Voit yhdistää tämän läheisesti yhteydessä oleviin komponentteihin.

7. tukkaroija

  • Tämä komponentti kiinnittää varoituksen ja virheet työssä.
  • Tärkein virheiden käsittelytekniikassa käytetty komponentti.
  • Virhelokeja voidaan kirjoittaa käyttämällä tätä komponenttia yhdessä tfileoutputdelimited kanssa.
  • Komponentteja on yli 800 +.

Kontekstimuuttuja

  • Kontekstimuuttujat ovat muuttujia, joita voidaan käyttää työssä missä tahansa.
  • Sillä on arvoja ja se voidaan siirtää toiseen työhön myös runko-komponentin avulla.
  • Kontekstuaalimuuttujien käyttö on, että voimme muuttaa arvoa eri tarkoituksiin.
  • Meillä voi esimerkiksi olla joukko arvoja kehityskontekstiryhmälle ja erilainen kontekstiarvojen tuotantoa varten.
  • Tällä tavalla työtä ei tarvitse muuttaa, pelkästään kontekstiparametrien muuttaminen riittää.

Työn rakentaminen

  • Jos haluat rakentaa työn, napsauta sitä hiiren kakkospainikkeella ja valitse rakennustyö.
  • Voit tuoda rakennustyön TACissa.
  • Talend Administration Consolessa ajoitat työn käynnistämään myös työjoukko-riippuvuus.
  • Voit myös tuoda työn Nexus-arkistosta artefaktityön avulla.

Luo tehtävä TAC: iin

  • Avoin työjohdin TAC: ssa
  • Napsauta uusia tehtäviä ja valitse normaalit tai esineet.
  • Tuo rakennettu työ tai valitse nexuksesta.
  • Valitse työpalvelin, jossa talend suoritetaan.
  • Tallenna tehtävä.
  • Nyt voit ottaa työn käyttöön ja suorittaa sen.

Johtopäätös - Talend Open Studio

“Yksinkertaista ETL ja ELT johtavalla ilmaisella avoimen lähdekoodin ETL-työkalulla isoille datalle.” On avoimen studion tunnusmerkki. Talend Bigdata sisältää monia komponentteja valtavan tiedon käsittelemiseen. Vakiotyö, Bigdatan työ, Bigdatan suoratoistotyöt ovat erityyppisiä töitä, joita Talend tarjoaa. Bigdata-työt voidaan luoda kipinä- tai karttavähennyskehyksessä.

Suositellut artikkelit

Tämä on Talend Open Studion opas. Tässä keskustellaan Talend Open Studion eduista, sovelluksista ja komponenteista. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Opas talend-tietojen integrointiin
  2. Tärkeitä Talend-haastattelukysymyksiä
  3. Talend vs Mulesoft: Erot
  4. Talend vs Pentaho: 8 hyödyllistä vertailua oppimiseen