Description
Nous offrons la formation officielle IBM en français avec la préparation des certifications officielles sans frais supplémentaires.
Code IBM: KM404G | Catégorie / sous-catégorie: IBM Infosphere / DataStage |
Modalité: En ligne et en présentiel | Durée en jours: 3 |
Type de public auquel la formation s’adresse:
Développeurs DataStage expérimentés à la recherche d’une formation aux techniques de travail DataStage plus avancées et qui cherchent à comprendre l’architecture du framework parallèle.
Pré requis souhaités:
Cours IBM InfoSphere DataStage Essentials ou équivalent et au moins un an d’expérience dans le développement d’emplois parallèles à l’aide de DataStage.
Instructeurs
La grande majorité des cours IBM que nous proposons sont dispensés directement par nos ingénieurs. C’est la seule façon de garantir la meilleure qualité. Nous complétons toutes les formations avec des matériels et des laboratoires de notre propre élaboration, basés sur notre expérience au cours des déploiements, des migrations et des cours que nous avons réalisés pendant toutes ces années. Nous donnons tous nos cours en français.
Valeur ajoutée
Nos cours sont profondément orientés vers le rôle à jouer. Il n’en va pas de même pour une équipe de développeurs de maîtriser une technologie que pour les personnes chargées de déployer et de gérer l’infrastructure. C’est pourquoi, au-delà des commandements et des tâches, nous nous concentrons sur la résolution des problèmes qui se posent dans la vie quotidienne de chaque équipe. Leur fournir les connaissances, les compétences et les aptitudes requises pour chaque projet. En outre, notre documentation est basée sur la dernière version de chaque produit.
Agenda et programme des cours
1: Introduction à l’architecture du framework parallèle
& bull; Décrivez l’architecture de traitement parallèle
& bull; Décrire le parallélisme de pipeline et de partition
& bull; Décrivez le rôle du fichier de configuration
& bull; Concevoir un travail qui crée des données de test robustes
2: Compilation et exécution de travaux
& bull; Décrivez les principales parties du fichier de configuration
& bull; Décrivez le processus de compilation et la SST que le processus de compilation génère
& bull; Décrivez le rôle et les principales parties de la partition
& bull; Décrivez le processus d’exécution du travail
3: Partitionnement et collecte des données
& bull; Comprendre le fonctionnement du partitionnement dans le Framework
& bull; Affichage des partitionneurs dans la partition
& bull; Sélection d’algorithmes de partitionnement
& bull; Générer des séquences de nombres (clés de substitution) dans un environnement partitionné et parallèle
4: Tri des données
& bull; Trier les données dans le cadre parallèle
& bull; Recherchez les tris insérés dans le score
& bull; Réduisez le nombre de tris insérés
& bull; Optimiser les tâches Fork-Join
& bull; Utilisez les étapes de tri pour déterminer la dernière ligne d’un groupe
& bull; Décrire la logique de la clé de tri et de la clé de partitionnement dans le cadre parallèle
5: Mise en mémoire tampon dans les travaux parallèles
& bull; Décrivez le fonctionnement de la mise en mémoire tampon dans les travaux parallèles
& bull; Ajuster les tampons dans les travaux parallèles
& bull; Évitez les conflits de tampon
6: Types de données de framework parallèle
& bull; Décrire les ensembles de données virtuels
& bull; Décrire les schémas
& bull; Décrire les mappages et conversions des types de données
& bull; Décrivez comment les données externes sont traitées
& bull; Gérer les valeurs nulles
& bull; Travailler avec des données complexes
7: Composants réutilisables
& bull; Créez un fichier de schéma
& bull; Lire un fichier séquentiel en utilisant un schéma
& bull; Décrire la propagation des colonnes d’exécution (RCP)
& bull; Activer et désactiver le RCP
& bull; Créer et utiliser des conteneurs partagés
8: Optimisation équilibrée
& bull; Activez la fonctionnalité d’optimisation équilibrée dans Designer
& bull; Décrivez le workflow d’optimisation équilibrée
& bull; Énumérez les différentes options d’optimisation équilibrée.
& bull; Transférer le traitement par étapes vers une source de données
& bull; Pousser le traitement de l’étape vers une cible de données
& bull; Optimiser une tâche accédant au système de fichiers Hadoop HDFS
& bull; Comprendre les limites des optimisations équilibrées
& nbsp;
Vous avez besoin d’adapter ce programme à vos besoins? D’autres cours vous intéressent? Consultez-nous sans engagement.
Emplacements d’enseignement présentiels
- France: Marseille, Paris, Lyon, Bourdeaux
- Belgique: Bruxelles, Gand et Anvers
- Quebec: Montreal
- Senegal: Dakar
- Maroc: Rabat, Marrakech, Casablanca
- Algérie : Alger
- Luxembourg: Luxembourg
- Suisse: Géneve
- Lyban: Beyrouth
- Guinée: Conakry
- Tunisie: Tunis