Dela via


Koncept för nätverksdataagent (förhandsversion)

Dataagenten i Microsoft Fabric är en ny Microsoft Fabric-funktion som gör att du kan bygga dina egna konversationssystem för frågor och svar med generativ AI. En Fabric-dataagent gör datainsikter mer tillgängliga och användbara för alla i din organisation. Med en Fabric-dataagent kan ditt team ha konversationer, med vanliga engelskspråkiga frågor, om de data som din organisation lagrade i Fabric OneLake och sedan få relevanta svar. På så sätt kan även personer utan teknisk expertis inom AI eller en djup förståelse av datastrukturen få exakta och sammanhangsrika svar.

Du kan också lägga till organisationsspecifika instruktioner, exempel och vägledning för att finjustera Fabric-dataagenten. Detta säkerställer att svaren överensstämmer med organisationens behov och mål, så att alla kan interagera mer effektivt med data. Infrastrukturdataagenten främjar en kultur av datadrivet beslutsfattande eftersom det minskar hinder för insiktstillgänglighet, underlättar samarbete och hjälper din organisation att extrahera mer värde från sina data.

Viktigt!

Den här funktionen är i förhandsversion.

Förutsättningar

Så här fungerar Fabric-dataagenten

Infrastrukturdataagenten använder stora språkmodeller (LLM) för att hjälpa användare att interagera med sina data naturligt. Fabric-dataagenten tillämpar API:er för Azure OpenAI Assistant och fungerar som en agent. Den bearbetar användarfrågor, avgör den mest relevanta datakällan (Lakehouse, Warehouse, Power BI-datauppsättning, KQL-databaser) och anropar lämpligt verktyg för att generera, validera och köra frågor. Användarna kan sedan ställa frågor på vanligt språk och få strukturerade svar som kan läsas av människor– vilket eliminerar behovet av att skriva komplexa frågor och säkerställa korrekt och säker dataåtkomst.

Så här fungerar det i detalj:

Frågeparsning och validering: Dataagenten Fabric använder API:er för Azure OpenAI Assistant som den bakomliggande agenten för att bearbeta användarfrågor. Den här metoden säkerställer att frågan uppfyller säkerhetsprotokoll, ansvarsfulla AI-principer (RAI) och användarbehörigheter. Fabric-dataagenten tillämpar strikt skrivskyddad åtkomst och underhåller skrivskyddade dataanslutningar till alla datakällor.

Data Source Identification: Fabric-dataagenten använder användarens autentiseringsuppgifter för att komma åt schemat för datakällan. Detta säkerställer att systemet hämtar datastrukturinformation som användaren har behörighet att visa. Sedan utvärderas användarens fråga mot alla tillgängliga datakällor, inklusive relationsdatabaser (Lakehouse och Warehouse), Power BI-datauppsättningar (semantiska modeller) och KQL-databaser. Den kan också referera till instruktioner från användarspecifika dataagenter för att fastställa den mest relevanta datakällan.

Verktygsanrop & Frågegenerering: När rätt datakälla eller källor har identifierats, omformulerar Fabricdataagenten frågan för tydlighet och struktur, och anropar sedan det motsvarande verktyget för att generera en strukturerad fråga:

  • Naturligt språk till SQL (NL2SQL) för relationsdatabaser (Lakehouse/Warehouse).
  • Naturligt språk till DAX (NL2DAX) för Power BI-datamängder (semantiska modeller).
  • Naturligt språk till KQL (NL2KQL) för KQL-databaser.

Det valda verktyget genererar en fråga baserat på det angivna schemat, metadata och kontexten som agenten bakom Fabric-dataagenten sedan skickar.

Frågeverifiering: Verktyget utför validering för att säkerställa att frågan är korrekt utformad och följer sina egna säkerhetsprotokoll och RAI-principer.

Fråganalys & Svar: När den har verifierats kör Fabric-dataagenten frågan mot den valda datakällan. Resultaten formateras till ett mänskligt läsbart svar, som kan innehålla strukturerade data som tabeller, sammanfattningar eller viktiga insikter.

Den här metoden säkerställer att användarna kan interagera med sina data med naturligt språk, medan Fabric-dataagenten hanterar komplexiteten i frågegenerering, validering och körning – allt utan att användarna själva behöver skriva SQL, DAX eller KQL.

Konfiguration av fabricdataagent

Att konfigurera en Fabric-dataagent liknar att skapa en Power BI-rapport – du börjar med att utforma och förfina den för att säkerställa att den uppfyller dina behov och sedan publicera och dela den med kollegor så att de kan interagera med data. När du konfigurerar en Fabric-dataagent ingår:

Välja datakällor: En Fabric-dataagent stöder upp till fem datakällor i valfri kombination, inklusive datalager, lagerhus, KQL-databaser och Power BI semantiska modeller. En konfigurerad Fabric-dataagent kan till exempel innehålla fem Power BI-semantiska modeller. Den kan innehålla en blandning av två Power BI-semantiska modeller, en lakehouse och en KQL-databas. Du har många tillgängliga alternativ.

Välja Relevanta tabeller: När du har valt datakällorna måste du lägga till dem en i taget och definiera de specifika tabellerna från varje källa som fabric-dataagenten ska använda. Det här steget säkerställer att Fabric-dataagenten hämtar korrekta resultat genom att endast fokusera på relevanta data.

Lägga till kontext: För att förbättra noggrannheten för dataagenten för Fabric, kan du ge mer kontext via instruktioner för Fabric-dataagenten och exempelfrågor. Som underliggande agent för Fabric-dataagenten hjälper kontexten Azure OpenAI Assistant-API:et att fatta mer välgrundade beslut om hur du bearbetar användarfrågor och avgör vilken datakälla som passar bäst för att besvara dem.

  • Instruktioner för dataagenten: Du kan lägga till instruktioner för att vägleda agenten som utgör grunden för Fabric-dataagenten, och hjälpa till att fastställa den bästa datakällan för att besvara specifika typer av frågor. Du kan också ange anpassade regler eller definitioner som förtydligar organisationens terminologi eller specifika krav. Dessa instruktioner kan ge mer kontext eller inställningar som påverkar hur agenten väljer och frågar datakällor.

    • Ställ direkta frågor om finansiella mått till en semantisk Power BI-modell.
    • Tilldela frågor som handlar om utforskning av rådata till lakehouse.
    • Vidarebefordra frågor som kräver logganalys till KQL-databasen.
  • Exempelfrågor: Du kan lägga till exempel på frågor och frågorpar för att illustrera hur Fabric-dataagenten ska svara på vanliga frågor. De här exemplen fungerar som en guide för agenten, som hjälper den att förstå hur man tolkar liknande frågor och genererar korrekta svar.

Anmärkning

För närvarande går det inte att lägga till exempel på fråge-/frågepar för datakällor för semantiska modeller i Power BI.

Genom att kombinera tydliga AI-instruktioner och relevanta exempelfrågor kan du bättre anpassa Fabric-dataagenten till organisationens databehov, vilket säkerställer mer exakta och sammanhangsmedvetna svar.

Skillnad mellan en Fabric-dataagent och en andrepilot

Även om både Fabric-dataagenter och Fabric-andrepiloter använder generativ AI för att bearbeta och resonera över data, finns det viktiga skillnader i deras funktioner och användningsfall:

Konfigurationsflexibilitet: Fabric-dataagenter är mycket konfigurerbara. Du kan ange anpassade instruktioner och exempel för att anpassa deras beteende till specifika scenarier. Fabric-kopiloter, å andra sidan, är förkonfigurerade och erbjuder inte denna nivå av anpassning.

Omfång och användningsfall: Fabric copilots är utformade för att hjälpa till med uppgifter i Microsoft Fabric, till exempel skapandet av anteckningsbokskod eller lagerfrågor. Tygnätdataagenter är däremot fristående artefakter. För att göra Fabric-dataagenter mer mångsidiga för bredare användningsfall kan de integreras med externa system som Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams eller andra verktyg utanför Fabric.

Utvärdering av Fabric-dataagenten

Kvaliteten och säkerheten för fabric-dataagentsvaren gick igenom en rigorös utvärdering:

Benchmark Testing: Produktteamet testade Fabricdataagenter i en rad offentliga och privata datauppsättningar för att säkerställa högkvalitativa och korrekta svar.

Förbättrade skadebegränsningar: Fler skyddsåtgärder finns för att säkerställa att Fabric-dataagentens output förblir fokuserade på kontexten för valda datakällor, för att minska risken för irrelevanta eller vilseledande svar.

Begränsningar

Fabric-dataagenten är för närvarande i offentlig förhandsversion och har begränsningar. Uppdateringar förbättrar Fabric-dataagenten över tid.

  • Fabric-dataagenten genererar endast SQL/DAX/KQL-"läsfrågor". Den genererar inte SQL/DAX/KQL-frågor som skapar, uppdaterar eller tar bort data.
  • Fabric Data Agent stöder inte ostrukturerade data (.pdf, .docxeller .txt). Du kan inte använda dataagenten Fabric för att komma åt ostrukturerade dataresurser. Dessa resurser omfattar till exempel .pdf, .docx eller .txt filer.
  • Fabric-dataagenten stöder för närvarande inte språk som inte är engelska. För optimal prestanda kan du ange frågor, instruktioner och exempelfrågor på engelska.
  • Du kan inte ändra den LLM som fabric-dataagenten använder.
  • Konversationshistoriken i Fabric Data Agent kanske inte alltid bevaras. I vissa fall, till exempel ändringar i serverdelsinfrastrukturen, tjänstuppdateringar eller modelluppgraderingar, kan tidigare konversationshistorik återställas eller gå förlorad.