Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Azure Open Datasets är utvalda offentliga datauppsättningar som du kan lägga till i scenariospecifika funktioner i maskininlärningslösningar för mer exakta modeller. Öppna datauppsättningar är tillgängliga i molnet i Microsoft Azure. De är integrerade i Azure Machine Learning och är lättillgängliga för Azure Databricks. Du kan också komma åt datauppsättningarna via API:er och du kan använda dem i andra produkter, till exempel Power BI och Azure Data Factory.
Datauppsättningar innehåller offentliga data för väder, folkräkning, helgdagar, allmän säkerhet och plats som hjälper dig att träna maskininlärningsmodeller och berika förutsägande lösningar. Du kan också dela dina offentliga datamängder via Azure Open Datasets.
Utvalda, förberedda datauppsättningar
Utvalda öppna offentliga datamängder i Azure Open Datasets är optimerade för förbrukning i arbetsflöden för maskininlärning.
Mer information om tillgängliga datauppsättningar finns i resursen Azure Open Datasets Catalog .
Dataexperter ägnar ofta mest tid åt att rensa och förbereda data för avancerad analys. För att spara tid kopieras öppna Datauppsättningar till Azure-molnet och sedan förbearbetas. Med jämna mellanrum hämtas data från källorna , till exempel av en FTP-anslutning till National Oceanic and Atmospheric Administration (NOAA). Därefter parsas data i ett strukturerat format och berikas sedan efter behov med funktioner som postnummer eller platserna för närmaste väderstationer.
Datauppsättningar samvärdas med molnberäkning i Azure för att underlätta åtkomst och manipulering.
Här är exempel på tillgängliga datauppsättningar:
Transport
| Datamängd | beskrivning |
|---|---|
| NYC Taxi & Limousine kommissionen - gula taxiresor anteckningar | De gula taxiresorna inkluderar upphämtnings- och avlämningsdatum/tider, upphämtnings- och avlämningsplatser, reseavstånd, specificerade priser, pristyper, betalningstyper och förarrapporterade passagerarantal. |
| NYC Taxi & Limousine kommission - reseregistreringar för gröna taxibilar | De gröna taxiresorna inkluderar upphämtnings- och avlämningsdatum/tider, upphämtnings- och avlämningsplatser, reseavstånd, specificerade priser, pristyper, betalningstyper och förarrapporterade passagerarantal. |
Arbete och ekonomi
| Datamängd | beskrivning |
|---|---|
| Amerikansk arbetskraftsstatistik | US Labor Force Statistics tillhandahåller Arbetskraftsstatistik, arbetskraftsandel och den civila icke-institutionella befolkningen efter ålder, kön, ras och etniska grupper i USA. |
| Amerikanska nationella sysselsättningstimmar och intäkter | Ces-programmet (Current Employment Statistics) producerar detaljerade branschuppskattningar av icke-jordbruksarbete, timmar och inkomster för arbetstagare på löner i USA. |
Åtkomst till datauppsättningar
Med ett Azure-konto kan du komma åt öppna datauppsättningar via kod eller via Azure-tjänstgränssnittet. Data är samlokaliserade med Azure-molnberäkningsresurser för användning i dina maskininlärningslösningar.
Open Datasets är tillgängliga via Azure Machine Learning-användargränssnittet och SDK. Open Datasets tillhandahåller även Notebook-filer och Azure Databricks-notebook-filer som kan ansluta data till Azure Machine Learning och Azure Databricks. Datauppsättningar kan även nås via en Python-SDK.
Du behöver dock inget Azure-konto för att få åtkomst till Open Datasets. Du kan komma åt dem från valfri Python-miljö med eller utan Spark.
Begära eller bidra med datauppsättningar
Om du inte hittar de data du vill ha kan du skicka ett e-postmeddelande till oss för att begära en datamängd eller bidra med en datauppsättning.