Delen via


De hulpprogramma's voor gegevensprofilering gebruiken

De hulpprogramma's voor gegevensprofilering bieden nieuwe en intuïtieve manieren om gegevens in Power Query-editor op te schonen, transformeren en begrijpen. Deze omvatten:

  • Kolomkwaliteit

  • Kolomdistributie

  • Kolomprofiel

Als u de hulpmiddelen voor gegevensprofilering wilt inschakelen, gaat u naar het tabblad Weergave op het lint. Schakel in Power Query Desktop de gewenste opties in de groep Gegevensvoorbeeld in, zoals wordt weergegeven in de volgende afbeelding.

Screenshot of the Data profiling tools selected under the Power Query View tab.Schermopname van de hulpprogramma's voor gegevensprofilering die zijn geselecteerd op het tabblad Power Query View.

Selecteer in Power Query Online de gegevensweergave en schakel vervolgens de gewenste opties in de vervolgkeuzelijst in.

Screenshot of the data profiling tools selected under Data view in the View tab.Schermopname van de hulpmiddelen voor gegevensprofilering geselecteerd onder Gegevensweergave op het tabblad Weergave.

Nadat u de opties hebt ingeschakeld, worden de gegevensprofileringsgegevens weergegeven in de Power Query-editor.

Screenshot of the data profiling tools after they're set up.Schermopname van de hulpprogramma's voor gegevensprofilering nadat deze zijn ingesteld.

Notitie

Power Query voert deze gegevensprofilering standaard uit in de eerste 1000 rijen van uw gegevens. Als u deze wilt laten functioneren voor de hele gegevensset, selecteert u de kolomprofilering op basis van het bovenste bericht van 1000 rijen in de linkerbenedenhoek van uw editorvenster om kolomprofilering te wijzigen in Kolomprofilering op basis van de volledige gegevensset.

Kolomkwaliteit

De kolomkwaliteitsfunctie labelt waarden in rijen in vijf categorieën:

  • Geldig, weergegeven in groen.

  • Fout, weergegeven in rood.

  • Leeg, weergegeven in donkergrijs.

  • Onbekend, weergegeven in gestreept groen. Geeft aan wanneer er fouten in een kolom zijn, de kwaliteit van de resterende gegevens is onbekend.

  • Onverwachte fout, weergegeven in gestreept rood.

Deze indicatoren worden direct onder de naam van de kolom weergegeven als onderdeel van een klein staafdiagram.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Schermopname van de verbeterde weergave van het staafdiagram met gegevenskwaliteitsindicatoren en labels boven elke kolom in de tabel.

Het aantal records in elke kolomkwaliteitscategorie wordt ook weergegeven als percentage.

Door de muisaanwijzer op een van de kolommen te bewegen, ziet u de numerieke verdeling van de kwaliteit van waarden in de hele kolom. Als u ook de knop met het beletselteken (...) selecteert, worden enkele snelle actieknoppen geopend voor bewerkingen op de waarden.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Schermopname van de distributie van de kolom namen met 701 namen geldig (100 procent), nulfouten en nul leeg, met opdrachten voor snelle acties weergegeven.

Kolomdistributie

Deze functie biedt een set visuals onder de namen van de kolommen die de frequentie en verdeling van de waarden in elk van de kolommen laten zien. De gegevens in deze visualisaties worden in aflopende volgorde gesorteerd van de waarde met de hoogste frequentie.

Screenshot of the data profiling tools with the upper column distribution emphasized.Schermopname van de hulpprogramma's voor gegevensprofilering met de bovenkolomverdeling benadrukt.

Door de muisaanwijzer over de distributiegegevens in een van de kolommen te bewegen, krijgt u informatie over de algemene gegevens in de kolom (met uniek aantal en unieke waarden). Distinct verwijst naar het totale aantal verschillende waarden in elke kolom. Uniek verwijst naar waarden die slechts één exemplaar in de kolom hebben. U kunt ook de knop met het beletselteken selecteren en kiezen uit een menu met beschikbare bewerkingen.

Screenshot of the data profiling tools with the column distributions options emphasized.Schermopname van de hulpprogramma's voor gegevensprofilering met de opties voor kolomdistributies benadrukt.

Kolomprofiel

Deze functie biedt een uitgebreider overzicht van de gegevens in een kolom. Naast het kolomdistributiediagram bevat het een kolomstatistiekendiagram. Deze informatie wordt weergegeven onder de sectie Gegevensvoorbeeld.

Screenshot of the data profiling tool with the column profile emphasized.Schermopname van het hulpprogramma voor gegevensprofilering met de nadruk op het kolomprofiel.

Filteren op waarde

U kunt aan de rechterkant met het waardedistributiediagram werken en een van de balken selecteren door de muisaanwijzer over de delen van de grafiek te bewegen.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Schermopname waarin wordt gedemonstreerd hoe u de muisaanwijzer boven de balk in het staafdiagram met waarden kunt bewegen, waarin afzonderlijke gegevens voor die staaf worden weergegeven.

Klik met de rechtermuisknop om een set beschikbare transformaties voor die waarde weer te geven.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Schermopname van het weergeven van het snelmenu met beschikbare transformaties voor één staaf in het waardedistributiebalkdiagram.

Gegevens kopiëren

In de rechterbovenhoek van de secties kolomstatistieken en waardedistributie kunt u de knop met het beletselteken (...) selecteren om een snelmenu Kopiëren weer te geven. Selecteer deze optie om de gegevens die in een van de secties worden weergegeven, naar het klembord te kopiëren.

Screenshot of the copy shortcut menu in the column statistics column.Schermopname van het snelmenu kopiëren in de kolom Kolomstatistieken.

Groeperen op waarde

Wanneer u de knop met weglatingstekens (...) selecteert in de rechterbovenhoek van het waardedistributiediagram, kunt u naast Kopiëren ook Groeperen op selecteren. Met deze functie worden de waarden in de grafiek gegroepeerd op basis van een set beschikbare opties.

Screenshot of the copy and group by shortcut menu in the value distribution column.Schermopname van het kopiëren en groeperen op snelmenu in de kolom waardedistributie.

In de volgende afbeelding ziet u een kolom met productnamen die zijn gegroepeerd op tekstlengte. Nadat de waarden in de grafiek zijn gegroepeerd, kunt u communiceren met afzonderlijke waarden in de grafiek, zoals beschreven in Filteren op waarde.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Schermopname van het nieuwe staafdiagram met de distributie van de tekstlengte van winkelnamen in de kolom Namen van de tabel.