Lab 02 | Charger des données transformées dans Power BI Desktop
Sales Analysis.pbix
23.9 kB
Histoire de laboratoire
Dans cet atelier, vous utiliserez des techniques de nettoyage et de transformation des données pour commencer à façonner votre modèle de données. Vous appliquerez ensuite les requêtes pour les charger chacune sous forme de table dans le modèle de données.
Dans cet atelier, vous apprendrez à :
Appliquer diverses transformations
Charger des requêtes dans le modèle de données
Cet atelier devrait durer environ 45 minutes.
Commencer
Dans cette tâche, vous allez configurer l’environnement du laboratoire.
Important : Si vous avez terminé l'atelier précédent sur la même VM, passez à la tâche suivante.
Ouvrez le bureau Power BI.
Astuce : Par défaut, la boîte de dialogue Mise en route s'ouvre devant Power BI Desktop. Vous pouvez choisir de vous connecter, puis fermer la fenêtre contextuelle.
Pour ouvrir le fichier de démarrage Power BI Desktop, sélectionnez Fichier > Ouvrir le rapport > Parcourir les rapports .
Dans la fenêtre Ouvrir , accédez au dossier D:\PL300\Labs\02-load-data-with-power-query-in-power-bi-desktop\Starter et ouvrez le fichier Sales Analysis .
Fermez toutes les fenêtres d’information qui pourraient s’ouvrir.
Notez le message d'avertissement jaune sous le ruban.
Ce message vous alerte du fait que les requêtes n'ont pas été appliquées pour être chargées en tant que tables modèles. Vous appliquerez les requêtes plus tard dans cet atelier.
Pour ignorer le message d'avertissement, à droite du message d'avertissement jaune, sélectionnez X .
Pour créer une copie du fichier, accédez à Fichier > Enregistrer sous et enregistrez-le dans le dossier D:\PL300\MySolution .
Si vous êtes invité à appliquer les modifications, sélectionnez Appliquer plus tard .
Configurer la requête Salesperson
Dans cette tâche, vous utiliserez l’éditeur Power Query pour configurer la requête Salesperson .
Important : Lorsqu'il vous est demandé de renommer les colonnes, il est important que vous les renommiez exactement comme décrit.
Pour ouvrir la fenêtre de l’éditeur Power Query , sous l’ onglet du ruban Accueil, depuis le groupe Requêtes, sélectionnez l’icône Transformer les données .
Dans la fenêtre de l’éditeur Power Query , dans le volet Requêtes , sélectionnez la requête DimEmployee .
Pour renommer la requête, dans le volet Paramètres de requête (situé à droite), dans la zone Nom , remplacez le texte par Salesperson , puis appuyez sur Entrée . Vérifiez ensuite que le nom a été mis à jour dans le volet Requêtes.
Le nom de la requête détermine le nom de la table modèle. Il est recommandé de définir des noms concis et conviviaux.
Pour localiser une colonne spécifique, dans l' onglet du ruban Accueil , sélectionnez la flèche vers le bas Gérer les colonnes , sélectionnez la flèche vers le bas Choisir les colonnes , puis sélectionnez Aller à la colonne .
Aller à la colonne est une fonctionnalité utile avec de nombreuses colonnes. Sinon, vous pouvez faire défiler horizontalement les colonnes de recherche.
Dans la fenêtre Aller à la colonne , pour trier la liste par nom de colonne, sélectionnez le bouton de tri AZ , puis sélectionnez Nom et SalesPersonFlag . Cliquez sur OK .
Recherchez la colonne SalesPersonFlag , puis filtrez la colonne pour sélectionner uniquement les vendeurs (c'est-à-dire TRUE ), puis cliquez sur OK .
Dans le volet Paramètres de requête , dans la liste Étapes appliquées , notez l'ajout de l' étape Lignes filtrées.
Chaque transformation que vous créez entraîne une autre logique d'étape. Il est possible de modifier ou de supprimer des étapes. Il est également possible de sélectionner une étape pour prévisualiser les résultats de la requête à ce stade de la transformation de la requête.
Pour supprimer des colonnes, sous l' onglet du ruban Accueil , sélectionnez le groupe Gérer les colonnes , puis l'icône Choisir les colonnes.
Dans la fenêtre Choisir les colonnes , pour décocher toutes les colonnes, décochez l'élément (Sélectionner toutes les colonnes) .
Pour inclure des colonnes, vérifiez les six colonnes suivantes :
CléEmployé
EmployéNationalIDAAlternateKey
Prénom
Nom de famille
Titre
Adresse e-mail
Dans la liste Étapes appliquées , notez l’ajout d’une autre étape de requête.
Pour créer une colonne de nom unique, sélectionnez d’abord l’ en-tête de colonne FirstName . Tout en appuyant sur la touche Ctrl , sélectionnez la colonne LastName .
Cliquez avec le bouton droit sur l'un des en-têtes de colonne sélectionnés, puis dans le menu contextuel, sélectionnez Fusionner les colonnes .
De nombreuses transformations courantes peuvent être appliquées en cliquant avec le bouton droit sur l'en-tête de colonne, puis en les choisissant dans le menu contextuel. Notez cependant que davantage de transformations sont disponibles dans le ruban.
Dans la fenêtre Fusionner les colonnes , dans la liste déroulante Séparateur , sélectionnez Espace .
Dans la zone Nouveau nom de colonne , remplacez le texte par Salesperson .
Pour renommer la colonne EmployeeNationalIDAlternateKey , double-cliquez sur l' en-tête de colonne EmployeeNationalIDAlternateKey et remplacez le texte par EmployeeID , puis appuyez sur Entrée .
Utilisez les étapes précédentes pour renommer la colonne EmailAddress en UPN .
UPN est un acronyme pour User Principal Name.
En bas à gauche, dans la barre d'état, vérifiez que la requête comporte cinq colonnes et 18 lignes.
Configurer la requête SalespersonRegion
Dans cette tâche, vous allez configurer la requête SalespersonRegion .
Dans le volet Requêtes , sélectionnez la requête DimEmployeeSalesTerritory .
Dans le volet Paramètres de requête , renommez la requête en SalespersonRegion .
Pour supprimer les deux dernières colonnes, sélectionnez d’abord l’ en-tête de colonne DimEmployee .
Tout en appuyant sur la touche Ctrl , sélectionnez l' en-tête de colonne DimSalesTerritory .
Cliquez avec le bouton droit sur l’un des en-têtes de colonnes sélectionnés, puis dans le menu contextuel, sélectionnez Supprimer les colonnes .
Dans la barre d'état, vérifiez que la requête comporte deux colonnes et 39 lignes.
Configurer la requête Product
Dans cette tâche, vous allez configurer la requête Product.
Important : Lorsque des instructions détaillées ont déjà été fournies, les étapes de laboratoire fourniront des instructions plus concises. Si vous avez besoin d'instructions détaillées, vous pouvez vous référer aux étapes des tâches précédentes.
Sélectionnez la requête DimProduct et renommez la requête en Product .
Recherchez la colonne FinishedGoodsFlag , puis filtrez-la pour récupérer les produits qui sont des produits finis (c'est-à-dire TRUE).
Supprimez toutes les colonnes, à l'exception des suivantes :
Clé de produit
AnglaisProductName
Coût standard
Couleur
DimProductSous-catégorie
Notez que la colonne DimProductSubcategory représente une table associée (elle contient des liens de valeur ).
Dans l’ en-tête de colonne DimProductSubcategory , à droite du nom de la colonne, sélectionnez le bouton Développer.
Consultez la liste complète des colonnes, puis cochez la case Sélectionner toutes les colonnes pour désélectionner toutes les colonnes.
Sélectionnez EnglishProductSubcategoryName et DimProductCategory , puis décochez la case Utiliser le nom de colonne d'origine comme préfixe avant de sélectionner OK .
En sélectionnant ces deux colonnes, une transformation sera appliquée pour joindre la table DimProductSubcategory , puis inclure ces colonnes. La colonne DimProductCategory est, en fait, une autre table associée dans la source de données.
Les noms de colonnes de requête doivent toujours être uniques. Si elle est cochée, cette case préfixera chaque colonne avec le nom de la colonne développée (dans ce cas DimProductSubcategory ). Comme il est connu que les noms de colonnes sélectionnés n’entrent pas en conflit avec les noms de colonnes dans la requête Produit , l’option est désélectionnée.
Notez que la transformation a entraîné l'ajout de deux colonnes et que la colonne DimProductSubcategory a été supprimée.
Développez la colonne DimProductCategory , puis introduisez uniquement la colonne EnglishProductCategoryName .
Renommez les quatre colonnes suivantes :
EnglishProductName en Product
StandardCost en Standard Cost (inclure un espace)
EnglishProductSubcategoryName en Subcategory
FrenchProductCategoryName en Category
Dans la barre d'état, vérifiez que la requête comporte six colonnes et 397 lignes.
Configurer la requête Reseller
Dans cette tâche, vous allez configurer la requête Reseller.
Sélectionnez la requête DimReseller et renommez-la en Reseller .
Supprimez toutes les colonnes, à l'exception des suivantes :
ResellerKey
BusinessType
ResellerName
DimGeography
Développez la colonne DimGeography pour inclure uniquement les trois colonnes suivantes :
City
StateProvinceName
EnglishCountryRegionName
Dans l'en-tête de colonne Type d'entreprise, sélectionnez la flèche vers le bas, puis examinez les valeurs de colonne distinctes et notez les deux valeurs Warehouse et Ware House.
Cliquez avec le bouton droit sur l' en-tête de colonne Type d'activité , puis sélectionnez Remplacer les valeurs.
Dans la fenêtre Remplacer les valeurs , configurez les valeurs suivantes :
Dans la zone Valeur à rechercher , entrez Entrepôt
Dans la zone Remplacer par , saisissez Entrepôt
Renommez les quatre colonnes suivantes :
BusinessType en Business Type (inclure un espace)
ResellerName en Reseller
StateProvinceName en State-Province
EnglishCountryRegionName en Country-Region
Dans la barre d'état, vérifiez que la requête comporte six colonnes et 701 lignes.
Configurer la requête Region
Dans cette tâche, vous allez configurer la requête Region .
Sélectionnez la requête DimSalesTerritory et renommez la requête en Region .
Appliquez un filtre à la colonne SalesTerritoryAlternateKey pour supprimer la valeur 0 (zéro).
Cela supprimera une ligne.
Supprimez toutes les colonnes, à l'exception des suivantes :
SalesTerritoryKey
SalesTerritoryRegion
SalesTerritoryCountry
SalesTerritoryGroup
Renommez les trois colonnes suivantes :
SalesTerritoryRegion en Region
SalesTerritoryCountry en Country
SalesTerritoryGroup en Group
Dans la barre d'état, vérifiez que la requête comporte quatre colonnes et 10 lignes.
Configurer la requête Sales
Dans cette tâche, vous allez configurer la requête Sales.
Sélectionnez la requête FactResellerSales et renommez-la Sales .
Supprimez toutes les colonnes, à l'exception des suivantes :
SalesOrderNumber
OrderDate
ProductKey
ResellerKey
EmployeeKey
SalesTerritoryKey
OrderQuantity
UnitPrice
TotalProductCost
SalesAmount
DimProduct
Remarque : Vous vous souviendrez peut-être que dans le laboratoire Préparer les données dans Power BI Desktop , un petit pourcentage de lignes FactResellerSales comportait des valeurs TotalProductCost manquantes . La colonne DimProduct a été incluse pour récupérer la colonne de coût standard du produit afin de faciliter la correction des valeurs manquantes.
Développez la colonne DimProduct , décochez toutes les colonnes, puis incluez uniquement la colonne StandardCost .
Pour créer une colonne personnalisée, sous l' onglet du ruban Ajouter une colonne , dans le groupe Général , sélectionnez Colonne personnalisée .
Dans la fenêtre Colonne personnalisée , dans la zone Nom de la nouvelle colonne , remplacez le texte par Coût .
Dans la zone Formule de colonne personnalisée , saisissez l'expression suivante (après le symbole égal) :
Cette expression teste si la valeur TotalProductCost est manquante. S'il est manquant, il produit une valeur en multipliant la valeur OrderQuantity par la valeur StandardCost ; sinon, il utilise la valeur TotalProductCost existante .
if [TotalProductCost] = null then [OrderQuantity] * [StandardCost] else [TotalProductCost]
Supprimez les deux colonnes suivantes :
TotalProductCost
StandardCost
Renommez les trois colonnes suivantes :
OrderQuantity en Quantity
UnitPrice en Unit Price (include a space)
SalesAmount en Sales
Pour modifier le type de données de la colonne, dans l' en-tête de colonne Quantité, à gauche du nom de la colonne, sélectionnez l' icône 1.2 , puis sélectionnez Nombre entier.
Il est important de configurer le type de données correct. Lorsque la colonne contient une valeur numérique, il est également important de choisir le type correct si vous prévoyez d'effectuer des calculs mathématiques.
Modifiez les trois types de données de colonne suivants en Nombre décimal fixe.
Le type de données nombre décimal fixe autorise 19 chiffres et permet plus de précision pour éviter les erreurs d'arrondi. Il est important d'utiliser le type de nombre décimal fixe pour les valeurs financières ou les taux (comme les taux de change).
Unit Price
Sales
Cost
Dans la barre d'état, vérifiez que la requête comporte 10 colonnes et plus de 999 lignes.
Un maximum de 1 000 lignes seront chargées en tant que données d'aperçu pour chaque requête.
Configurer la requête Targets
Dans cette tâche, vous allez configurer la requête Targets.
Sélectionnez la requête ResellerSalesTargets et renommez-la en Targets .
Pour annuler le pivotement des colonnes de 12 mois ( M01 - M12 ), commencez par sélectionner plusieurs fois les en-têtes de colonne Année et EmployeeID .
Cliquez avec le bouton droit sur l’un des en-têtes de colonne sélectionnés, puis dans le menu contextuel, sélectionnez Annuler le pivotement des autres colonnes .
Notez que les noms de colonnes apparaissent désormais dans la colonne Attribut et les valeurs apparaissent dans la colonne Valeur .
Appliquez un filtre à la colonne Valeur pour supprimer les valeurs de tiret (-).
Vous vous souviendrez peut-être que le caractère tiret a été utilisé dans le fichier CSV source pour représenter zéro (0).
Renommez les deux colonnes suivantes :
Attribute en MonthNumber (il n'y a pas d'espace)
Value en Target
Pour préparer les valeurs de la colonne MonthNumber , cliquez avec le bouton droit sur l'en-tête de la colonne MonthNumber , puis sélectionnez Remplacer les valeurs.
Vous allez maintenant appliquer des transformations pour produire une colonne de date. La date sera dérivée des colonnes Year et MonthNumber . Vous allez créer la colonne à l’aide de la fonctionnalité Colonnes à partir d’exemples .
Dans la fenêtre Remplacer les valeurs , dans la zone Valeur à rechercher , entrez M et laissez le champ Remplacer vide.
Modifiez le type de données de la colonne MonthNumber en Whole Number .
Dans l’onglet du ruban Ajouter une colonne , dans le groupe Général , sélectionnez l’icône Colonne à partir d’exemples .
Notez que la première ligne concerne l'année 2017 et le mois numéro 7 .
Dans la colonne Column1 , dans la première cellule de la grille, commencez à saisir 7/1/2017 (ou 1/7/2017 selon la langue), puis appuyez sur Entrée .
La machine virtuelle utilise les paramètres régionaux américains, cette date est donc en fait le 1er juillet 2017. D'autres paramètres régionaux peuvent nécessiter un 0 avant la date.
Notez que les cellules de la grille se mettent à jour avec les valeurs prévues.
La fonctionnalité a prédit avec précision que vous combinez les valeurs des colonnes Year et MonthNumber .
Notez également la formule présentée au-dessus de la grille de requête.
Pour renommer la nouvelle colonne, double-cliquez sur l' en-tête de la colonne Merged et renommez la colonne TargetMonth .
Supprimez les colonnes suivantes :
Year
MonthNumber
Modifiez les types de données de colonne suivants :
Target sous forme de nombre décimal fixe
TargetMonth comme date
Pour multiplier les valeurs cibles par 1 000, sélectionnez l' en-tête de colonne Cible , puis sous l' onglet du ruban Transformer , dans le groupe Colonne numérique , sélectionnez Standard , puis sélectionnez Multiplier .
Vous vous souviendrez peut-être que les valeurs cibles étaient stockées sous forme de milliers.
Dans la fenêtre Multiplier , dans la zone Valeur , entrez 1 000 et sélectionnez OK .
Dans la barre d'état, vérifiez que la requête comporte trois colonnes et 809 lignes.
Configurer la requête ColorFormats
Dans cette tâche, vous allez configurer la requête ColorFormats .
Sélectionnez la requête ColorFormats et notez que la première ligne contient les noms de colonnes.
Dans l' onglet du ruban Accueil , dans le groupe Transformation , sélectionnez Utiliser la première ligne comme en-têtes.
Dans la barre d'état, vérifiez que la requête comporte trois colonnes et 10 lignes.
Mettre à jour la requête Product
Dans cette tâche, vous allez mettre à jour la requête Product en fusionnant la requête ColorFormats .
Sélectionnez la requête Product.
Pour fusionner la requête ColorFormats , sous l' onglet du ruban Accueil, sélectionnez la flèche vers le bas Combiner , puis sélectionnez Fusionner les requêtes.
La fusion de requêtes permet d'intégrer des données, en l'occurrence issues de différentes sources de données (SQL Server et un fichier CSV).
Dans la fenêtre Fusionner , dans la grille de requête Product, sélectionnez l' en-tête de colonne Couleur .
Sous la grille de requête Product, dans la liste déroulante, sélectionnez la requête ColorFormats.
Dans la grille de requête ColorFormats, sélectionnez l’ en-tête de colonne Couleur.
Lorsque la fenêtre Niveaux de confidentialité s'ouvre, pour chacune des deux sources de données, dans la liste déroulante correspondante, sélectionnez Organisationnel , puis Enregistrer.
Les niveaux de confidentialité peuvent être configurés pour la source de données afin de déterminer si les données peuvent être partagées entre les sources. Définir chaque source de données comme organisationnelle leur permet de partager des données, si nécessaire. Les sources de données privées ne peuvent jamais être partagées avec d’autres sources de données. Cela ne signifie pas que les données privées ne peuvent pas être partagées ; cela signifie que le moteur Power Query ne peut pas partager de données entre les sources.
Dans la fenêtre Fusionner, utilisez le type de jointure par défaut - en conservant la sélection Left Outer et sélectionnez OK.
Développez la colonne ColorFormats pour inclure les deux colonnes suivantes :
Format de couleur d'arrière-plan
Format de couleur de police
Dans la barre d'état, vérifiez que la requête comporte désormais huit colonnes et 397 lignes.
Mettre à jour la requête ColorFormats
Dans cette tâche, vous allez mettre à jour ColorFormats pour désactiver son chargement.
Sélectionnez la requête ColorFormats.
Dans le volet Paramètres de requête, sélectionnez le lien Toutes les propriétés.
Dans la fenêtre Propriétés de la requête , décochez la case Activer le chargement dans le rapport .
La désactivation du chargement signifie qu'il ne se chargera pas sous forme de table dans le modèle de données. Cela est dû au fait que la requête a été fusionnée avec la requête Produit , dont le chargement dans le modèle de données est activé.
Finir
Dans cette tâche, vous terminerez l'atelier.
Vérifiez que vous disposez de huit requêtes, correctement nommées comme suit :
Salesperson
SalespersonRegion
Product
Reseller
Region
Sales
Targets
ColorFormats (qui ne se chargeront pas dans le modèle de données)
Pour charger le modèle de données, dans la vue en coulisses du fichier , sélectionnez Fermer et appliquer .
Toutes les requêtes compatibles avec le chargement sont désormais chargées dans le modèle de données.
Dans le volet Données (situé à droite), remarquez les sept tables chargées dans le modèle de données.
Enregistrez le fichier Power BI Desktop.
Vous allez configurer les tables et les relations des modèles de données dans l’atelier Modèle de données dans Power BI Desktop .