Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln beskriver de typer av visualiseringar som är tillgängliga för användning i AI/BI-instrumentpaneler och visar hur du skapar ett exempel på varje visualiseringstyp. Anvisningar om hur du skapar en instrumentpanel finns i Skapa en instrumentpanel. Du kan använda naturligt språk för att uppmana assistenten att skapa stapel-, linje-, punktkarta-, punkt-, cirkel- och räknardiagram. Se Skapa visualiseringar med Databricks Assistant.
Information om visualiseringsåtergivningsgränser finns i Instrumentpanelsgränser.
Områdesvisualisering
Områdesvisualiseringar kombinerar linje- och stapelvisualiseringar för att visa hur en eller flera gruppers numeriska värden ändras jämfört med förloppet för en andra variabel, vanligtvis tidsvariabeln. De används ofta för att visa ändringar i försäljningstratten över tid.
Så här justerar du layouten:
- Klicka på
kebabmeny i avsnittet Y-axel i visualiseringsredigeringspanelen.
- I avsnittet Layout väljer du Stack eller 100% Stack.
Konfigurationsvärden: För det angivna områdets visualiseringsexempel angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Område
- Titel:
Total price and order year by order priority and clerk - X-axel:
- Fält:
o_orderdate - Transformera:
Yearly - Skalningstyp:
Continuous - Axelrubrik:
Order year
- Fält:
- Y-axel:
- Fält:
o_totalprice - Axelrubrik:
Total price - Skalningstyp:
Continuous - Transformera:
Sum
- Fält:
- Färg:
- Fält:
o_orderpriority - Förklaringsrubrik:
Order priority
- Fält:
- Filter
- Fält:
TPCH orders.o_clerk
- Fält:
SQL-fråga: För det här områdets visualisering användes följande SQL-fråga för att generera datauppsättningen med namnet TPCH orders.
SELECT * FROM samples.tpch.orders;
Stapeldiagram
Stapeldiagram representerar förändringen i mätvärden över tid eller mellan kategorier och visar proportionalitet, liknande ett tårtdiagram.
Så här justerar du layouten:
- Klicka på
kebabmeny i avsnittet Y-axel i visualiseringsredigeringspanelen.
- I avsnittet Layout väljer du Stack eller 100% Stack eller Grupp.
Konfigurationsvärden: För det angivna stapeldiagramexemplet angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Stapel
- Titel:
Total price and order month by order priority and clerk - X-axel:
- Fält:
o_orderdate - Transformera:
Monthly - Skalningstyp:
Continuous - Axelrubrik:
Order month
- Fält:
- Y-axel:
- Fält:
o_totalprice - Skalningstyp:
Continuous - Transformera:
Sum - Axelrubrik:
Total price
- Fält:
- Färg:
- Fält:
o_orderpriority - Förklaringsrubrik:
Order priority
- Fält:
- Filter
- Fält:
TPCH orders.o_clerk
- Fält:
SQL-fråga: Följande SQL-fråga genererade datauppsättningen TPCH orders för den här stapelvisualiseringen.
SELECT * FROM samples.tpch.orders;
Boxdiagram
Visualiseringen i rutdiagrammet visar distributionssammanfattningen av numeriska data, eventuellt grupperade efter kategori. Med hjälp av en visualisering av rutor kan du snabbt jämföra värdeintervallen mellan kategorier och visualisera lokalitets-, spridnings- och skevhetsgrupperna för värdena via deras kvarttiler. I varje ruta visar den mörkare linjen mellankvartilområdet. Mer information om hur du tolkar visualiseringar av rutor finns i boxdiagramsartikeln på Wikipedia.
I exemplet med det angivna rutdiagrammet angavs följande värden:
- X-kolumn (datamängdskolumn):
l-returnflag - Y-kolumner (datamängdskolumn):
l_extendedprice - X-axelrubrik:
Return flag1 - Rubrik på Y-axel:
Extended price
SQL-fråga: För den här visualiseringen av rutdiagrammet användes följande SQL-fråga för att generera datauppsättningen.
SELECT * FROM samples.tpch.lineitem;
Bubbeldiagram
Bubbeldiagram är punktdiagram där storleken på varje punktmarkör återspeglar ett relevant mått. Om du vill skapa ett bubbeldiagram väljer du Spridning som visualiseringstyp. I inställningen Storlek väljer du det mått som du vill representera med storleken på markörer.
Konfigurationsvärden: För det angivna bubbeldiagramexemplet angavs följande värden:
- Datauppsättning: NYC taxiresor
- Visualisering: Punktdiagram
- Titel:
Trip distance, fares, and trip duration - X-axel:
- Fält:
trip_distance - Skalningstyp:
Continuous - Transformera:
None
- Fält:
- Y-axel:
- Fält:
fare_amount - Skalningstyp:
Continuous - Transformera:
None
- Fält:
- Färg efter:
- Fält:
pickup_zip
- Fält:
- Storlek:
- Fält:
minutes_in_taxi - Transformera:
None
- Fält:
SQL-fråga: För den här bubbeldiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.
SELECT
*,
TIMESTAMPDIFF(MINUTE, tpep_pickup_datetime, tpep_dropoff_datetime) AS minutes_in_taxi
FROM samples.nyctaxi.trips
LIMIT 500;
Karta över Choropleth
I choropleth-visualiseringar färgas geografiska platser, till exempel länder eller stater, enligt aggregerade värden för varje nyckelkolumn. Frågan måste returnera geografiska platser efter namn. Användare kan skapa kartor som visar administrativa gränser på land-, delstats- eller provinsnivå samt läns- eller distriktsnivå.
Konfigurationsvärden: För den här choropleth-visualiseringen har följande värden angetts:
- Datauppsättning: samples.tpch.customer
- Land:
Country - Färg: sum(c_acct_bal)
SQL-fråga: För den här choropleth-visualiseringen användes följande SQL-fråga för att generera datauppsättningen.
SELECT
INITCAP(n_name) AS Country,
SUM(c_acctbal)
FROM samples.tpch.customer
JOIN samples.tpch.nation WHERE n_nationkey = c_nationkey
GROUP BY 1;
Kohortdiagram
Kohortdiagram visualiserar användarkvarhållning och beteendemönster över tid genom att gruppera användare baserat på en delad egenskap (till exempel registreringsdatum) och spåra deras aktivitet under efterföljande tidsperioder. Den här visualiseringen hjälper dig att förstå hur olika kohorter av användare interagerar med din produkt eller tjänst över tid.
Om du vill skapa ett kohortdiagram använder du en pivotvisualisering med kvarhållningsdata. I följande exempel spåras kundkvarhållning genom att beräkna när kunderna först gjorde en beställning (deras kohortdatum) och mäta hur många kunder från varje kohort som förblir aktiva under efterföljande år. Färgskalan anger kvarhållningshastigheter, med mörkare färger som visar högre kvarhållning.
Konfigurationsvärden: I det här kohortdiagrammet angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Pivot
- Titel:
Customer retention by cohort year - Rader:
- Fält:
Cohort - Transformera:
Yearly
- Fält:
- Kolumner:
- Fält:
Active Period
- Fält:
- Cell:
- Fält:
Retention - Stil:
Color Scale
- Fält:
SQL-fråga: För den här kohortdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen Orders cohort analysis.
-- get the list of customers and when they were active
WITH history AS (
SELECT o_orderdate, o_custkey -- replace with the right columns representing date and id
FROM samples.tpch.orders -- replace with desired table
GROUP BY ALL
),
-- find the date of the first order for each customer
cohort AS (
SELECT o_custkey, MIN(o_orderdate) AS first_date
FROM history
GROUP BY 1
),
-- combine the customer activity table with the date of first activity, and choose a granularity (e.g. YEAR)
joined AS (
SELECT
DATE_TRUNC("YEAR", first_date) AS cohort,
CAST(DATE_DIFF(YEAR, cohort, o_orderdate) AS STRING) AS active,
o_custkey
FROM history LEFT JOIN cohort USING(o_custkey)
),
-- calculate the number of distinct customers by cohort and date active
grouped AS (
SELECT cohort, active, COUNT(DISTINCT o_custkey) AS customers
FROM joined
GROUP BY 1, 2
),
-- calculate the number of initial customers for each cohort
initial_customers AS (
SELECT cohort, customers AS t0_customers
FROM grouped
WHERE active = 0
)
-- calculate the retention by cohort and date active
SELECT
cohort AS Cohort,
active AS Active,
CASE WHEN active = 1 THEN CONCAT(active, " year")
ELSE CONCAT(active, " years") END AS `Active Period`,
customers AS Customers,
t0_customers AS `Initial Customers`,
TRY_DIVIDE(customers, t0_customers) AS Retention
FROM grouped LEFT JOIN initial_customers USING (cohort)
WHERE active > 0;
Kombinationsdiagram
Kombinationsdiagram kombinerar linje- och stapeldiagram för att presentera ändringarna över tid med proportionalitet.
Konfigurationsvärden: För den här kombinationsdiagramvisualiseringen har följande värden angetts:
- Datauppsättning: samples.tpch.partsupp
- Visualisering: Kombination
- X-axel:
ps_partkey- Skalningstyp:
Continuous
- Skalningstyp:
- Y-axel:
- Bar:
ps_availqty - Sammansättningstyp:
SUM - Linje:
ps_supplycost - Sammansättningstyp:
AVG
- Bar:
- Färg efter Y-serie:
Sum of ps_availqtyAverage ps_supplycost
SQL-fråga: För den här kombinationsdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.
SELECT * FROM samples.tpch.partsupp;
Kombinationsdiagram med dubbla axlar
Du kan använda kombinationsdiagram för att visa två olika y-axlar. När du har valt widgeten för kombinationsdiagram klickar du på kebabmeny på Y-axelns inställningar i diagramkonfigurationspanelen. Aktivera alternativet Aktivera dubbel axel .
Konfigurationsvärden: För det här kombinationsdiagrammet är alternativet Aktivera dubbel axel aktiverat. De andra konfigurationerna anges på följande sätt:
- Datauppsättning: exempel.nyc.taxi.resor
- Visualisering: Kombination
- X-axel:
tpep_pickup_datetime- Transformera:
Weekly - Skalningstyp:
Continuous
- Transformera:
- Y-axel:
- Vänster Y-axel (stapel):
trip_distance- Transformera:
AVG
- Transformera:
- Höger Y-axel (linje):
fare_amount- Transformera:
AVG
- Transformera:
- Vänster Y-axel (stapel):
Färg efter Y-serie:
Average trip_distanceAverage fare_amount
SQL-fråga: Följande SQL-fråga användes för att generera datauppsättningen:
SELECT * FROM samples.nyctaxi.trips;
Räknevisualisering
Räknare visar ett enda värde på ett framträdande sätt, med ett alternativ för att jämföra dem med ett målvärde. Om du vill använda räknare anger du vilka data som ska visas i räknarvisualiseringen för kolumnerna Värde och Mål . Om du använder aggregeringar i visualiseringsredigeraren kan du inte jämföra värden genom att välja en värderads-nummerrad, som i följande exempel. Om du vill jämföra specifika radvärden använder du en datauppsättning som innehåller alla nödvändiga aggregeringar i SQL som definierar den. På så sätt kan du välja mål- och värderader för jämförelse.
Du kan ange villkorsstyrd formatering och anpassa textens stil i konfigurationsdetaljerna för värde.
Konfigurationsvärden: För det här räknarvisualiseringsexemplet angavs följande värden:
- Dataset: Motexempel
- Visualisering: Räknare
- Titel:
Orders: Total price by date (previous two days) - Värde:
- Fält:
total price - Radvärde nummer: 1
- Fält:
- Mål:
- Fält:
total price - Radnummer för värde: 2
- Fält:
SQL-fråga: För den här räknarvisualiseringen användes följande SQL-fråga för att generera datamängden:
SELECT
SUM(o_totalprice) AS `total price`,
o_orderdate
FROM
samples.tpch.orders
GROUP BY o_orderdate
ORDER BY o_orderdate DESC;
Trattdiagram
Trattdiagrammet hjälper till att analysera ändringen i ett mått i olika steg. Om du vill använda tratten anger du en step kolumn och en value kolumn.
Följande trattdiagram visar till exempel hur användarna förlopp genom steg i ett registreringsflöde. Varje steg representerar ett steg i processen, där dess storlek återspeglar antalet användare som nådde det steget.
Konfigurationsvärden: För det här trattdiagrammet angavs följande värden:
- Datauppsättning: Trattsteg för användarengagemang
- Visualisering: Tratt
- X-axel:
stage - Y-axel:
count- Sammansättningstyp:
SUM
- Sammansättningstyp:
- Färgkolumn:
- Datauppsättningskolumn:
count
- Datauppsättningskolumn:
SQL-fråga: Följande SQL-fråga genererade datauppsättningen för den här trattdiagramvisualiseringen.
SELECT *
FROM VALUES
('Visited Website', 10000),
('Signed Up', 4000),
('Activated Account', 2500),
('Added First Item', 1500),
('Completed Purchase', 800)
AS funnel(stage, count);
Värmekarta
Heatmap-diagram blandar funktioner i stapeldiagram, staplade diagram och bubbeldiagram, så att du kan visualisera numeriska data med hjälp av färger.
Följande värmekarta visualiserar till exempel antalet beställningar baserat på deras prioritets- och leveransmetod. X-axeln representerar olika ordningsprioriteringar, medan y-axeln representerar olika leveransmetoder. Färgintensiteten anger summan av orderantalet, med en förklaring som visar orderantalskalan.
Anmärkning
Heatmaps kan visa upp till 64 000 rader eller 10 MB.
Konfigurationsvärden: För den här visualiseringen av heatmap-diagram har följande värden angetts:
- Datauppsättning: samples.tpch.orders
- Visualisering: Värmekarta
- X-axel:
priority - Y-axel:
ship_mode - Färgkolumn:
- Datauppsättningskolumn:
order_count - Sammansättningstyp:
SUM
- Datauppsättningskolumn:
- X-axelnamn (åsidosätt standardvärde):
Order Priority - Namn på Y-axel (åsidosätt standardvärde):
Shipping method - Färgramp:
Green Blue
SQL-fråga: För den här visualiseringen av heatmap-diagrammet användes följande SQL-fråga för att generera datauppsättningen.
SELECT
o.o_orderpriority AS priority,
l.l_shipmode AS ship_mode,
COUNT(*) AS order_count,
o.o_orderdate
FROM
samples.tpch.orders AS o
JOIN
samples.tpch.lineitem AS l
ON
o.o_orderkey = l.l_orderkey
GROUP BY
o.o_orderpriority,
l.l_shipmode,
o.o_orderdate
ORDER BY
priority,
ship_mode;
Histogramdiagram
Ett histogram ritar frekvensen som ett angivet värde inträffar i en datauppsättning. Ett histogram hjälper dig att förstå om en datauppsättning har värden som är grupperade runt ett litet antal intervall eller som är mer utspridda. Ett histogram visas som ett stapeldiagram där du styr antalet distinkta staplar (kallas även lagerplatser).
Konfigurationsvärden: För den här histogramdiagramvisualiseringen angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Histogram
- X-kolumn (datamängdskolumn):
o_totalprice - Antal behållare: 20
- X-axelnamn (åsidosätt standardvärde):
Total price
Konfigurationsalternativ: Information om konfigurationsalternativ för histogramdiagram finns i konfigurationsalternativ för histogramdiagram.
SQL-fråga: För den här histogramdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.
SELECT * FROM samples.tpch.orders;
Linjevisualisering
Linjevisualiseringar visar ändringen i ett eller flera mått över tid.
Konfigurationsvärden: För det här linjevisualiseringsexemplet angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Linje
- Titel:
Average price and order year by order priority and clerk - X-axel:
- Fält:
o_orderdate - Transformera:
Yearly - Skalningstyp:
Continuous - Axelrubrik:
Order year
- Fält:
- Y-axel:
- Fält:
o_totalprice - Transformera:
Average - Skalningstyp:
Continuous - Axelrubrik:
Average price
- Fält:
- Färg:
- Fält:
o_orderpriority - Förklaringsrubrik:
Order priority
- Fält:
SQL-fråga: För den här linjediagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen med namnet Orders data.
SELECT * FROM samples.tpch.orders;
Cirkelvisualisering
Cirkeldiagram visar proportionalitet mellan olika mått. De är inte avsedda att förmedla tidsseriedata.
Konfigurationsvärden: För det här cirkelvisualiseringsexemplet angavs följande värden:
- Datauppsättning: samples.tpch.orders
- Visualisering: Tårtvisualisering
- Titel:
Total price by order priority and clerk - Vinkel:
- Fält:
o_totalprice - Transformera:
Sum - Axelrubrik:
Total price
- Fält:
- Färg:
- Fält:
o_orderpriority - Förklaringsrubrik:
Order priority
- Fält:
- Filter
- Fält:
TPCH orders.o_clerk
- Fält:
SQL-fråga: För den här cirkelvisualiseringen användes följande SQL-fråga för att generera datauppsättningen med namnet TPCH orders.
SELECT * FROM samples.tpch.orders;
Pivotvisualisering
En pivotvisualisering aggregerar poster från ett frågeresultat till en tabellvisning. Det liknar PIVOT eller GROUP BY -instruktioner i SQL. Du konfigurerar pivotvisualiseringen med dra och släpp-fält.
Detaljerad information om konfigurationsalternativ för pivottabeller, inklusive klibbiga rubriker, villkorsstyrd formatering och tillägg av länkar finns i Konfiguration av pivottabell.
Konfigurationsvärden: I det här pivotvisualiseringsexemplet angavs följande värden:
- Datauppsättning: samples.tpch.lineitem
- Visualisering: Pivot
- Titel:
Line item quantity by return flag and ship mode by supplier - Rader:
- Fält:
l_returnflag
- Fält:
- Kolumner:
- Fält:
l_shipmode
- Fält:
- Cell
- Dataset:
- Fält:
l_quantity - Transformera - Summa
- Filter
- Fält:
TPCH lineitem.l_supplierkey
- Fält:
SQL-fråga: För den här pivotvisualiseringen användes följande SQL-fråga för att generera datauppsättningen med namnet TPCH lineitem.
SELECT * FROM samples.tpch.lineitem;
Punktkarta
Punktkartor visar kvantitativa data som symboler placerade på specifika kartplatser. Markörer placeras med hjälp av latitud- och longitudkoordinater, som måste ingå som en del av resultatuppsättningen för den här diagramtypen. I följande exempel används data från kollisioner med motorfordon i New York, NY.
Konfigurationsvärden: För den här punktkartans visualisering har följande värden angetts:
- Datauppsättning: Analys av huspriser i Seattle
- Visualisering: Punktkarta
- Koordinater:
- Breddgrad:
LATITUDE - Longitud:
LONGITUDE
- Breddgrad:
- Färg:
- Fält:
avg(bedrooms)- Skalningstyp: Kategorisk
- Fält:
- Storlek:
- Fält:
avg(price)
- Fält:
Anmärkning
Inga Databricks-datauppsättningar innehåller latitud- eller longituddata, så en SQL-exempelfråga tillhandahålls inte för det här exemplet.
Sankeydiagram
Ett sankey-diagram visualiserar flödet från en uppsättning värden till en annan.
Konfigurationsvärden: För det här sankey-diagrammet angavs följande värden:
- Datauppsättning: Sankey-exempel
- Visualisering: Sankey
- Stadier
stage1stage2
- Värde
- SUMMA(värde)
SQL-fråga: För den här Sankey-visualiseringen användes följande SQL-fråga för att generera datauppsättningen.
SELECT pickup_zip AS stage1, dropoff_zip AS stage2, SUM(fare_amount) AS value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10;
Spridningsvisualisering
Punktvisualiseringar används ofta för att visa relationen mellan två numeriska variabler. Du kan koda den tredje dimensionen med färg för att visa hur de numeriska variablerna skiljer sig åt mellan grupper.
Konfigurationsvärden: För det här punktvisualiseringsexemplet angavs följande värden:
- Datauppsättning: samples.tpch.lineitem
- Visualisering: Punktdiagram
- Titel:
Total price and quantity by ship mode and supplier - X-axel:
- Fält:
l_quantity - Axelrubrik:
Quantity - Skalningstyp:
Continuous - Transformera:
None
- Fält:
- Y-axel:
- Fält:
l_extendedprice - Skalningstyp:
Continuous - Transformera:
None - Axelrubrik:
Price
- Fält:
- Färg:
- Fält:
l_shipmode - Förklaringsrubrik:
Ship mode
- Fält:
- Filter
- Fält:
TPCH lineitem.l_supplierkey
- Fält:
SQL-fråga: För den här punktvisualiseringen användes följande SQL-fråga för att generera datauppsättningen med namnet TPCH lineitem.
SELECT * FROM samples.tpch.lineitem
Tabellvisualisering
Tabellvisualiseringen visar data i en standardtabell men gör att du kan ändra ordning på, dölja och formatera data manuellt.
Anmärkning
Tabeller kan visa upp till 64 000 rader eller 10 MB.
Konfigurationsvärden: För det här tabellvisualiseringsexemplet angavs följande värden:
- Datauppsättning: samples.tpch.lineitem
- Visualisering: Tabell
- Titel:
Line item summary by supplier - Kolumner:
- Visa radnummer: Aktiverat
- Fält:
l_orderkey - Fält:
l_extendedprice- Visa som:
Number - Talformat: 0,00 $
- Visa som:
- Fält:
l_discount- Visa som:
Number - Talformat: %0.00
- Visa som:
- Fält:
l_tax- Visa som:
Number - Talformat: %0.00
- Visa som:
- Fält:
l_shipdate - Fält:
l_shipmode
- Filter
- Fält:
TPCH lineitem.l_supplierkey
- Fält:
Konfigurationsalternativ: Information om konfigurationsalternativ för tabellvisualisering finns i Tabellalternativ.
SQL-fråga: För den här tabellvisualiseringen användes följande SQL-fråga för att generera datauppsättningen med namnet TPCH lineitem.
SELECT * FROM samples.tpch.lineitem
Vattenfallsdiagram
Vattenfallsdiagram visar den kumulativa effekten av sekventiella positiva och negativa värden, som visar hur ett initialt värde påverkas av en serie mellanliggande positiva och negativa värden. De används ofta för att visualisera finansiella data, till exempel vinst- och förlustrapporter, eller för att visa hur olika faktorer bidrar till en total förändring.
Konfigurationsvärden: I det här vattenfallsdiagrammet angavs följande värden:
- Datauppsättning: Genereras av fråga
- Visualisering: Vattenfall
- X-axel: MÅNADSVIS(date_col)
- Y-axel: SUMMA(belopp)
SQL-fråga: För den här tabellvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.
with base as (
SELECT
*
FROM
VALUES
(2535, '2025-01-01'),
(-853, '2025-02-01'),
(3229, '2025-03-01'),
(1820, '2025-04-01'),
(3195, '2025-05-01'),
(-1800, '2025-06-01'),
(-562, '2025-07-01'),
(-332, '2025-08-01'),
(1750, '2025-09-01'),
(-330, '2025-10-01'),
(3300, '2025-11-01'),
(4400, '2025-12-01') AS t (amount, date_str)
)
SELECT
amount,
cast(date_str as date) as date_col
from
base