Lab 01 | Obtenir des données dans Power BI Desktop
Sales Analysis.pbix
22.1 kB
Obtenir des données dans Power BI Desktop
Histoire de laboratoire
Cet atelier est conçu pour vous présenter l'application Power BI Desktop, vous expliquer comment vous connecter aux données et comment utiliser les techniques de prévisualisation des données pour comprendre les caractéristiques et la qualité des données sources. Les objectifs d'apprentissage sont :
Ouvrir le bureau Power BI
Connectez-vous à différentes sources de données
Prévisualiser les données sources avec Power Query
Utiliser les fonctionnalités de profilage des données dans Power Query
Cet atelier devrait durer environ 30 minutes.
Démarrer avec Power BI Desktop
Dans cette tâche, vous commencez par ouvrir un fichier de démarrage Power BI (.pbix). Le fichier de démarrage ne contient aucune donnée, mais a été spécialement configuré pour vous aider à réaliser l'atelier. Les paramètres suivants au niveau du rapport ont été désactivés dans le fichier de démarrage :
Chargement de données > Importer des relations à partir de sources de données lors du premier chargement
Chargement de données > Détecter automatiquement les nouvelles relations après le chargement des données
Remarque : Bien que l'activation de ces deux options puisse être utile lors du développement d'un modèle de données, vous les avez désactivées précédemment pour prendre en charge l'expérience de laboratoire. Lorsque vous créez des relations dans le laboratoire Charger des données transformées dans Power BI Desktop , vous découvrirez pourquoi vous ajoutez chacune d’entre elles.
Sales Analysis.pbix
22.1 kB
Ouvrez le bureau Power BI.
Astuce : Par défaut, la boîte de dialogue Mise en route s'ouvre devant Power BI Desktop. Vous pouvez choisir de vous connecter, puis fermer la fenêtre contextuelle.
Pour ouvrir le fichier de démarrage Power BI Desktop, sélectionnez Fichier > Ouvrir le rapport > Parcourir les rapports .
Dans la fenêtre Ouvrir , accédez au dossier D:\PL300\Labs\01-prepare-data-with-power-query-in-power-bi-desktop\Starter .
Sélectionnez le fichier Sales Analysis.pbix .
Enregistrez une copie du fichier avec Enregistrer sous dans un dossier MySolution.
Récupérer des données depuis SQL Server
Cette tâche vous apprend à vous connecter à une base de données SQL Server et à importer des tables qui créent des requêtes dans Power Query.
Dans l' onglet du ruban Accueil , dans le groupe Données , sélectionnez SQL Server .
Dans la fenêtre Base de données SQL Server , dans la zone Serveur , saisissez localhost , puis sélectionnez OK .
Remarque : Dans cet atelier, vous vous connecterez à la base de données SQL Server à l'aide de localhost , car les sources de données de passerelle ne peuvent pas résoudre localhost . Ce n'est pas une pratique recommandée lors de la création de vos propres solutions.
Si vous êtes invité à fournir des informations d'identification, dans la fenêtre Base de données SQL Server , sélectionnez Utiliser mes informations d'identification actuelles , puis Connecter .
Dans la fenêtre Navigateur , à gauche, développez la base de données AdventureWorksDW2020 .
Remarque : La base de données AdventureWorksDW2020 est basée sur l' exemple de base de données AdventureWorksDW2017 . Il a été modifié pour prendre en charge les objectifs d'apprentissage des laboratoires de cours.
Sélectionnez (mais ne cochez pas) la table DimEmployee
Dans le volet de droite, remarquez un aperçu des données du tableau. Les données d'aperçu vous permettent de voir les colonnes et un échantillon de lignes.
Pour créer des requêtes, cochez la case en regard des six tables suivantes :
DimEmployee
DimEmployeeSalesTerritory
DimProduct
DimReseller
DimSalesTerritory
FactResellerSales
Terminez cette tâche en sélectionnant Transform Data , qui ouvrira l’éditeur Power Query.
Cet atelier est uniquement destiné à se connecter aux données et à les profiler, mais pas à transformer les données .
Aperçu des données dans l'éditeur Power Query
Cette tâche présente l’éditeur Power Query et vous permet d’examiner et de profiler les données. Cela vous aide à déterminer comment nettoyer et transformer les données ultérieurement.
Dans la fenêtre de l’éditeur Power Query , à gauche, remarquez le volet Requêtes . Le volet Requêtes contient une requête pour chaque table que vous avez cochée.
Sélectionnez la première requête : DimEmployee.
La table DimEmployee de la base de données SQL Server stocke une ligne pour chaque employé. Un sous-ensemble des lignes de ce tableau représente les vendeurs, ce qui sera pertinent pour le modèle que vous développerez.
Dans le coin inférieur gauche de la barre d'état, certaines statistiques du tableau sont fournies : le tableau comporte 33 colonnes et 296 lignes.
Dans le volet d’aperçu des données, faites défiler horizontalement pour examiner toutes les colonnes. Notez que les cinq dernières colonnes contiennent des liens Table ou Valeur .
Ces cinq colonnes représentent les relations avec d'autres tables de la base de données. Ils peuvent être utilisés pour joindre des tables entre elles. Vous joindrez des tables dans le laboratoire Charger des données transformées dans Power BI Desktop .
Pour évaluer la qualité des colonnes, sous l' onglet du ruban Afficher , à partir du groupe Aperçu des données , cochez Qualité des colonnes . La fonctionnalité de qualité des colonnes vous permet de déterminer facilement le pourcentage de valeurs valides, erronées ou vides trouvées dans les colonnes.
Notez que la colonne Position comporte 94 % de lignes vides (nulles).
Pour évaluer la distribution des colonnes, dans l' onglet du ruban Affichage , à partir du groupe Aperçu des données , cochez Distribution des colonnes .
Examinez à nouveau la colonne Position et notez qu'il existe quatre valeurs distinctes et une valeur unique.
Examinez la distribution des colonnes pour la colonne EmployeeKey : il existe 296 valeurs distinctes et 296 valeurs uniques.
Lorsque les nombres distincts et uniques sont identiques, cela signifie que la colonne contient des valeurs uniques. Lors de la modélisation, il est important que certaines tables modèles comportent des colonnes uniques. Ces colonnes uniques peuvent être utilisées pour créer des relations un-à-plusieurs, ce que vous ferez dans l’ atelier Modèle de données dans Power BI Desktop.
Dans le volet Requêtes , sélectionnez la requête DimEmployeeSalesTerritory.
La table DimEmployeeSalesTerritory stocke une ligne pour chaque employé et les régions de territoire de vente qu'il gère. Le tableau prend en charge l'association de plusieurs régions à un seul employé. Certains employés gèrent une, deux, voire plusieurs régions. Lorsque vous modéliserez ces données, vous devrez définir une relation plusieurs-à-plusieurs.
Dans le volet Requêtes, sélectionnez la requête DimProduct . La table DimProduct contient une ligne par produit vendu par l'entreprise.
Faites défiler horizontalement pour révéler les dernières colonnes. Notez la colonne DimProductSubcategory.
Lorsque vous ajoutez des transformations à cette requête dans le laboratoire Charger les données transformées dans Power BI Desktop , vous utiliserez la colonne DimProductSubcategory pour joindre des tables.
Dans le volet Requêtes, sélectionnez la requête DimReseller .
La table DimReseller contient une ligne par revendeur. Les revendeurs vendent, distribuent ou ajoutent de la valeur aux produits Adventure Works.
Pour afficher les valeurs des colonnes, dans l' onglet du ruban Afficher , à partir du groupe Aperçu des données , cochez Profil de colonne.
Sélectionnez l' en-tête de colonne BusinessType et remarquez le nouveau volet sous le volet d'aperçu des données.
Examinez les statistiques des colonnes et la distribution des valeurs dans le volet d'aperçu des données.
Notez le problème de qualité des données : il existe deux étiquettes pour l'entrepôt ( Warehouse et Ware House mal orthographié ).
Passez le curseur sur la barre Ware House et notez qu'il y a cinq lignes avec cette valeur.
Vous allez appliquer une transformation pour réétiqueter ces cinq lignes dans le laboratoire Charger les données transformées dans Power BI Desktop .
Dans le volet Requêtes , sélectionnez la requête DimSalesTerritory .
La table DimSalesTerritory contient une ligne par région de vente, y compris le siège social . Les régions sont attribuées à un pays et les pays sont attribués à des groupes. Dans le laboratoire Modèle de données dans Power BI Desktop , vous allez créer une hiérarchie pour prendre en charge l’analyse au niveau de la région, du pays ou du groupe.
Dans le volet Requêtes, sélectionnez la requête FactResellerSales .
La table FactResellerSales contient une ligne par ligne de commande client : une commande client contient un ou plusieurs éléments de ligne.
Vérifiez la qualité de la colonne TotalProductCost et notez que 8 % des lignes sont vides.
Les valeurs manquantes de la colonne TotalProductCost constituent un problème de qualité des données. Pour résoudre ce problème, dans le laboratoire Charger les données transformées dans Power BI Desktop , vous appliquerez des transformations pour remplir les valeurs manquantes à l’aide du coût standard du produit, qui est stocké dans la table DimProduct associée .
Récupérer des données à partir d'un fichier CSV
Lab02_csv.zip
1.8 kB
Dans cette tâche, vous allez créer une requête basée sur des fichiers CSV.
Pour ajouter une nouvelle requête, dans la fenêtre de l'éditeur Power Query , sous l'onglet du ruban Accueil, à partir du groupe Nouvelle requête, sélectionnez la flèche vers le bas Nouvelle source, puis sélectionnez Texte/CSV.
Dans la fenêtre Ouvrir, accédez au dossier D:\PL300\Resources et sélectionnez le fichier ResellerSalesTargets.csv. Sélectionnez Ouvrir.
Dans la fenêtre ResellerSalesTargets.csv, examinez les données d'aperçu. Sélectionnez OK.
Dans le volet Requêtes, notez l’ajout de la requête ResellerSalesTargets .
Le fichier CSV ResellerSalesTargets contient une ligne par vendeur et par an. Chaque ligne enregistre 12 objectifs de ventes mensuels (exprimés en milliers). L’exercice social de la société Adventure Works commence le 1er juillet.
Notez qu'aucune colonne ne contient de valeurs vides. Lorsqu’il n’y a pas d’objectif de ventes mensuelles, un trait d’union est stocké à la place.
Examinez les icônes dans chaque en-tête de colonne, à gauche du nom de la colonne. Les icônes représentent le type de données de la colonne. 123 est un nombre entier et ABC est un texte.
Répétez les étapes pour créer une requête basée sur le fichier
D:\PL300\Resources\ColorFormats.csv .
Le fichier CSV ColorFormats contient une ligne par couleur de produit. Chaque ligne enregistre les codes HEX pour formater les couleurs d'arrière-plan et de police.
Vous devriez maintenant avoir deux nouvelles requêtes, ResellerSalesTargets et ColorFormats.
Finir
Dans cette tâche, vous terminerez l'atelier.
Dans l’ onglet du ruban Afficher , depuis le groupe Aperçu des données , décochez les trois options d’aperçu des données précédemment activées dans cet atelier :
Qualité des colonnes
Répartition des colonnes
Profil de colonne
Enregistrez le fichier Power BI Desktop. Lorsque vous êtes invité à appliquer les modifications en attente, sélectionnez Appliquer plus tard.
Astuce : L'application des requêtes chargera leurs données dans le modèle de données. Vous n’êtes pas prêt à le faire, car de nombreuses transformations doivent être appliquées en premier.