Hadoop online üben: 11 Schritte (mit Bildern)

Inhaltsverzeichnis:

Hadoop online üben: 11 Schritte (mit Bildern)
Hadoop online üben: 11 Schritte (mit Bildern)
Anonim

Als eines der leistungsstärksten Open-Source-Programmier-Frameworks ist Hadoop ein wichtiges Werkzeug für jeden, der einen Big-Data-Job finden möchte. Wenn Sie Ihre Hadoop-Fähigkeiten auffrischen oder lernen möchten, wie Sie sie beherrschen, ist es am besten, einen Online-Kurs zu besuchen. Wenn Ihnen das nicht zur Verfügung steht, sehen Sie sich kostenlose Online-Tutorials an und verwenden Sie Referenzmaterialien, um bestimmte Probleme zu beheben. Sobald Sie die Grundlagen verstanden haben, üben Sie an kleinen Datensätzen aus der realen Welt, um Ihre Fähigkeiten zu verbessern.

Schritte

Methode 1 von 2: Kurse belegen und Tutorials verwenden

Hadoop online üben Schritt 1

Schritt 1. Melden Sie sich bei Cloudera für einen 6-teiligen Kurs und interaktive Tutorials an

Cloudera bietet Ihnen praktische Beispiele zum Üben in einer schreibgeschützten Umgebung, sodass Sie sich keine Sorgen machen müssen, große Fehler zu machen. Sie bieten auch Analysetools, die Ihnen beim Experimentieren mit Abfragen von Daten helfen, sowie eine kostenlose Live-Demo namens Cloudera Live, die Ihnen hilft, die Hadoop-Umgebung kennenzulernen.

Obwohl der komplette, eingehende Kurs mit Zertifizierung 295 US-Dollar kostet, lohnt es sich auf jeden Fall, wenn Sie diese Fähigkeiten für Ihren Job einsetzen. Die Nutzung des Cloudera-Kurses hilft Ihnen, Fehler zu erkennen und Zeit zu sparen, wodurch sich der Kurs schnell bezahlt macht

Hadoop Online üben Schritt 2

Schritt 2. Probieren Sie kostenlose Online-Kurse über Cloudera aus, wenn Sie die Grundlagen bereits kennen

Wenn Sie Erfahrung mit Hadoop haben und nur eine Auffrischung wünschen, müssen Sie möglicherweise das Geld für den 6-teiligen Kurs nicht ausgeben. Schauen Sie sich stattdessen die kostenlosen Online-Kurse auf der Website der Cloudera University an.

Es gibt Ressourcen für Administratoren, Entwickler und Datenanalysten. Unabhängig von Ihrer Rolle sollten Sie also einen geeigneten Kurs finden

Hadoop Online üben Schritt 3

Schritt 3. Nehmen Sie an einem Kurs auf Universitätsniveau auf Coursera teil, wenn Sie mehr Theorie möchten

Coursera ist eine bekannte und angesehene Quelle für Programmierkurse. Obwohl die Anleitung in der Regel eher theoretisch ist und nicht so viele laufende Beispiele enthält, können Sie neben dem Tutorial üben und die Kursprojekte nutzen, um praktische Erfahrungen zu sammeln.

  • Sie finden diesen Kurs online unter
  • Die Kosten variieren zwischen den Kursen, aber Coursera bietet denjenigen, die sich qualifizieren, auch eine finanzielle Unterstützungsoption an.
Hadoop Online üben Schritt 4

Schritt 4. Nehmen Sie an einem kostenlosen Kurs an der Big Data University teil, um eine kostengünstige Option zu erhalten

Wenn Sie für einen Online-Kurs nicht bezahlen möchten, ist die Big Data University eine großartige Option. Sie haben einen zweiteiligen Kurs, der sich zuerst auf die Hadoop-Grundlagen konzentriert, dann auf die Programmierung mit Hadoop, und das Online-Format macht es einfach, in Ihrem eigenen Tempo zu gehen.

  • Sie finden diese Kurse auf
  • Sie bieten viele Tutorials in Englisch sowie Japanisch, Spanisch, Portugiesisch und Russisch an.
Hadoop Online üben Schritt 5

Schritt 5. Suchen Sie auf YouTube nach Komplettlösungen, wenn Sie eine kostenlose, spezifische Schulung benötigen

Es gibt Tausende von Videos, die Hadoop erklären und wie man es verwendet. Die große Auswahl an Videos bietet Ihnen Flexibilität und ist kostenlos. Wenn Sie auf ein bestimmtes Problem stoßen, suchen Sie auf YouTube nach einem Video, das Sie durch den Prozess führt.

Hadoop-Tutorials sollten auch relativ einfach zu finden sein, da „Hadoop“ein eindeutiger Suchbegriff ist

Üben Sie Hadoop Online Schritt 6

Schritt 6. Verwenden Sie die kostenlosen Tutorials von Yahoo, wenn Sie mit einem virtuellen Beispiel üben möchten

Diese Tutorials sind in 7 Module unterteilt und weisen Sie von Anfang an in die Installation und den Betrieb von Hadoop ein. Dies ist eine großartige Option, um bestimmte Fähigkeiten aufzufrischen, wenn sie ein wenig eingerostet sind.

Üben Sie Hadoop Online Schritt 7

Schritt 7. Im IBM Open Source-Dokument finden Sie kostenlose und ausführliche Anweisungen

Dies ist ein unglaublich gründliches Open-Source-PDF-Dokument, das von einer IBM Schulungsinitiative erstellt wurde. Es führt Sie Schritt für Schritt sorgfältig durch Hadoop und gibt klare schriftliche Anweisungen.

Diese Anweisungen funktionieren auch gut, wenn sie mit einer Live-Demo wie Cloudera kombiniert werden

Methode 2 von 2: Übergang zur realen Anwendung

Üben Sie Hadoop Online Schritt 8

Schritt 1. Fragen Sie, ob Sie Hadoop bei der Arbeit implementieren können, um mit echten Daten zu üben

Stellen Sie eine Anfrage bei Ihrem Chef oder Vorgesetzten oder sprechen Sie mit ihm persönlich über die Einführung dieser neuen Fähigkeiten am Arbeitsplatz. Dies ist besonders wichtig, wenn Ihr Unternehmen für Schulungen oder Online-Kurse bezahlt hat.

Je früher Sie mit der Umsetzung der erlernten Fähigkeiten beginnen, desto eher können Sie sie beherrschen

Üben Sie Hadoop Online Schritt 9

Schritt 2. Suchen Sie nach einfachen Projekten, an denen Sie Ihre Fähigkeiten üben können

Wählen Sie Projekte, die relativ einfach und risikoarm sind, z. B. das Zählen und Rangieren der Anzahl der Interaktionen pro Kundenagenten, wie E-Mails und Chat-Sitzungen.

  • Einige andere echte Datenanwendungen umfassen das Durchsuchen von Weblogs auf Fehler oder das Überwachen von Social-Media-Kanälen auf die Markenstimmung.
  • Sie können auch mit Beispieldaten von Websites wie https://www.kaggle.com/datasets oder https://aws.amazon.com/datasets/ üben.
Üben Sie Hadoop Online Schritt 10

Schritt 3. Überprüfen Sie Ihren Code regelmäßig mit kleinen Teilmengen, um Fehler zu beheben

Bevor Sie den gesamten Datensatz ausführen, nehmen Sie einen kleineren Testdatensatz auf Ihren lokalen Computer und führen Sie ihn durch mehrere verschiedene Modi. Sie können es beispielsweise iterativ durch den lokalen Jobrunner-Modus, dann den pseudoverteilten Modus und dann den vollständig verteilten Modus ausführen.

  • Auf diese Weise können Sie Fehler oder Fehler erkennen, bevor sie im vollständigen Datensatz verstärkt werden.
  • Im lokalen Jobrunner-Modus können Sie Ihren Map- und Reduce-Code lokal testen und debuggen, der Pseudo-Distributed-Modus ahmt die Produktionsumgebung nach und der Fully-Distributed-Modus betrachtet Ihren realen Produktionscluster.
Hadoop Online üben Schritt 11

Schritt 4. Verwenden Sie eine einjährige kostenlose Testversion, um in einer virtuellen Maschinenumgebung zu üben

Unternehmen wie Amazon und Microsoft bieten kostenpflichtige Abonnements für ihre Hadoop-Praxisdienste an. Die virtuelle Maschine von Amazon heißt Amazon Web Service (AWS) und der Dienst von Microsoft heißt Microsoft Azure. Für beide Dienste ist Ihr erstes Jahr kostenlos, wenn Sie Ihre Kreditkarteninformationen eingeben.

Vergessen Sie nicht, das Abonnement nach 1 Jahr zu kündigen, um eine Belastung zu vermeiden

Tipps

  • Denken Sie daran, dass Hadoop eine spezialisiertere Programmiersprache mit eingeschränkter Verwendung ist. Es wird Ihnen sicherlich einen Vorteil in der Big-Data-Welt verschaffen, aber es ist nicht immer notwendig, Programmierer zu werden.
  • Sie können auch Bücher und Artikel über Hadoop lesen, z. B. Hadoop: The Definitive Guide, 3rd Edition von Tom White.

Beliebt nach Thema