Als eines der leistungsstärksten Open-Source-Programmier-Frameworks ist Hadoop ein wichtiges Werkzeug für jeden, der einen Big-Data-Job finden möchte. Wenn Sie Ihre Hadoop-Fähigkeiten auffrischen oder lernen möchten, wie Sie sie beherrschen, ist es am besten, einen Online-Kurs zu besuchen. Wenn Ihnen das nicht zur Verfügung steht, sehen Sie sich kostenlose Online-Tutorials an und verwenden Sie Referenzmaterialien, um bestimmte Probleme zu beheben. Sobald Sie die Grundlagen verstanden haben, üben Sie an kleinen Datensätzen aus der realen Welt, um Ihre Fähigkeiten zu verbessern.
Schritte
Methode 1 von 2: Kurse belegen und Tutorials verwenden
Schritt 1. Melden Sie sich bei Cloudera für einen 6-teiligen Kurs und interaktive Tutorials an
Cloudera bietet Ihnen praktische Beispiele zum Üben in einer schreibgeschützten Umgebung, sodass Sie sich keine Sorgen machen müssen, große Fehler zu machen. Sie bieten auch Analysetools, die Ihnen beim Experimentieren mit Abfragen von Daten helfen, sowie eine kostenlose Live-Demo namens Cloudera Live, die Ihnen hilft, die Hadoop-Umgebung kennenzulernen.
Obwohl der komplette, eingehende Kurs mit Zertifizierung 295 US-Dollar kostet, lohnt es sich auf jeden Fall, wenn Sie diese Fähigkeiten für Ihren Job einsetzen. Die Nutzung des Cloudera-Kurses hilft Ihnen, Fehler zu erkennen und Zeit zu sparen, wodurch sich der Kurs schnell bezahlt macht
Schritt 2. Probieren Sie kostenlose Online-Kurse über Cloudera aus, wenn Sie die Grundlagen bereits kennen
Wenn Sie Erfahrung mit Hadoop haben und nur eine Auffrischung wünschen, müssen Sie möglicherweise das Geld für den 6-teiligen Kurs nicht ausgeben. Schauen Sie sich stattdessen die kostenlosen Online-Kurse auf der Website der Cloudera University an.
Es gibt Ressourcen für Administratoren, Entwickler und Datenanalysten. Unabhängig von Ihrer Rolle sollten Sie also einen geeigneten Kurs finden
Schritt 3. Nehmen Sie an einem Kurs auf Universitätsniveau auf Coursera teil, wenn Sie mehr Theorie möchten
Coursera ist eine bekannte und angesehene Quelle für Programmierkurse. Obwohl die Anleitung in der Regel eher theoretisch ist und nicht so viele laufende Beispiele enthält, können Sie neben dem Tutorial üben und die Kursprojekte nutzen, um praktische Erfahrungen zu sammeln.
- Sie finden diesen Kurs online unter
- Die Kosten variieren zwischen den Kursen, aber Coursera bietet denjenigen, die sich qualifizieren, auch eine finanzielle Unterstützungsoption an.
Schritt 4. Nehmen Sie an einem kostenlosen Kurs an der Big Data University teil, um eine kostengünstige Option zu erhalten
Wenn Sie für einen Online-Kurs nicht bezahlen möchten, ist die Big Data University eine großartige Option. Sie haben einen zweiteiligen Kurs, der sich zuerst auf die Hadoop-Grundlagen konzentriert, dann auf die Programmierung mit Hadoop, und das Online-Format macht es einfach, in Ihrem eigenen Tempo zu gehen.
- Sie finden diese Kurse auf
- Sie bieten viele Tutorials in Englisch sowie Japanisch, Spanisch, Portugiesisch und Russisch an.
Schritt 5. Suchen Sie auf YouTube nach Komplettlösungen, wenn Sie eine kostenlose, spezifische Schulung benötigen
Es gibt Tausende von Videos, die Hadoop erklären und wie man es verwendet. Die große Auswahl an Videos bietet Ihnen Flexibilität und ist kostenlos. Wenn Sie auf ein bestimmtes Problem stoßen, suchen Sie auf YouTube nach einem Video, das Sie durch den Prozess führt.
Hadoop-Tutorials sollten auch relativ einfach zu finden sein, da „Hadoop“ein eindeutiger Suchbegriff ist
Schritt 6. Verwenden Sie die kostenlosen Tutorials von Yahoo, wenn Sie mit einem virtuellen Beispiel üben möchten
Diese Tutorials sind in 7 Module unterteilt und weisen Sie von Anfang an in die Installation und den Betrieb von Hadoop ein. Dies ist eine großartige Option, um bestimmte Fähigkeiten aufzufrischen, wenn sie ein wenig eingerostet sind.
Schritt 7. Im IBM Open Source-Dokument finden Sie kostenlose und ausführliche Anweisungen
Dies ist ein unglaublich gründliches Open-Source-PDF-Dokument, das von einer IBM Schulungsinitiative erstellt wurde. Es führt Sie Schritt für Schritt sorgfältig durch Hadoop und gibt klare schriftliche Anweisungen.
Diese Anweisungen funktionieren auch gut, wenn sie mit einer Live-Demo wie Cloudera kombiniert werden
Methode 2 von 2: Übergang zur realen Anwendung
Schritt 1. Fragen Sie, ob Sie Hadoop bei der Arbeit implementieren können, um mit echten Daten zu üben
Stellen Sie eine Anfrage bei Ihrem Chef oder Vorgesetzten oder sprechen Sie mit ihm persönlich über die Einführung dieser neuen Fähigkeiten am Arbeitsplatz. Dies ist besonders wichtig, wenn Ihr Unternehmen für Schulungen oder Online-Kurse bezahlt hat.
Je früher Sie mit der Umsetzung der erlernten Fähigkeiten beginnen, desto eher können Sie sie beherrschen
Schritt 2. Suchen Sie nach einfachen Projekten, an denen Sie Ihre Fähigkeiten üben können
Wählen Sie Projekte, die relativ einfach und risikoarm sind, z. B. das Zählen und Rangieren der Anzahl der Interaktionen pro Kundenagenten, wie E-Mails und Chat-Sitzungen.
- Einige andere echte Datenanwendungen umfassen das Durchsuchen von Weblogs auf Fehler oder das Überwachen von Social-Media-Kanälen auf die Markenstimmung.
- Sie können auch mit Beispieldaten von Websites wie https://www.kaggle.com/datasets oder https://aws.amazon.com/datasets/ üben.
Schritt 3. Überprüfen Sie Ihren Code regelmäßig mit kleinen Teilmengen, um Fehler zu beheben
Bevor Sie den gesamten Datensatz ausführen, nehmen Sie einen kleineren Testdatensatz auf Ihren lokalen Computer und führen Sie ihn durch mehrere verschiedene Modi. Sie können es beispielsweise iterativ durch den lokalen Jobrunner-Modus, dann den pseudoverteilten Modus und dann den vollständig verteilten Modus ausführen.
- Auf diese Weise können Sie Fehler oder Fehler erkennen, bevor sie im vollständigen Datensatz verstärkt werden.
- Im lokalen Jobrunner-Modus können Sie Ihren Map- und Reduce-Code lokal testen und debuggen, der Pseudo-Distributed-Modus ahmt die Produktionsumgebung nach und der Fully-Distributed-Modus betrachtet Ihren realen Produktionscluster.
Schritt 4. Verwenden Sie eine einjährige kostenlose Testversion, um in einer virtuellen Maschinenumgebung zu üben
Unternehmen wie Amazon und Microsoft bieten kostenpflichtige Abonnements für ihre Hadoop-Praxisdienste an. Die virtuelle Maschine von Amazon heißt Amazon Web Service (AWS) und der Dienst von Microsoft heißt Microsoft Azure. Für beide Dienste ist Ihr erstes Jahr kostenlos, wenn Sie Ihre Kreditkarteninformationen eingeben.
Vergessen Sie nicht, das Abonnement nach 1 Jahr zu kündigen, um eine Belastung zu vermeiden
Tipps
- Denken Sie daran, dass Hadoop eine spezialisiertere Programmiersprache mit eingeschränkter Verwendung ist. Es wird Ihnen sicherlich einen Vorteil in der Big-Data-Welt verschaffen, aber es ist nicht immer notwendig, Programmierer zu werden.
- Sie können auch Bücher und Artikel über Hadoop lesen, z. B. Hadoop: The Definitive Guide, 3rd Edition von Tom White.