NycTlcYellow Klass
Representerar NYC Taxi & Limousine Commission yellow taxi trip public dataset.
De gula taxiresorna innehåller fält som fångar upp upphämtnings- och avlämningsdatum/tider, upphämtnings- och avlämningsplatser, reseavstånd, specificerade priser, pristyper, betalningstyper och passagerarantal som rapporterats av förare. Mer information om den här datamängden, inklusive kolumnbeskrivningar, olika sätt att komma åt datamängden och exempel finns i NYC Taxi & Limousine Commission – gul taxiresa i Katalogen Microsoft Azure Open Datasets.
Initiera filtreringsfält.
Konstruktor
NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parametrar
| Name | Description |
|---|---|
|
start_date
|
Det datum då data ska läsas in, inklusive. Om Ingen Standardvärde: 2015-01-01 00:00:00
|
|
end_date
|
Det datum då data ska läsas in, inklusive. Om Ingen Standardvärde: 2024-12-13 00:00:00
|
|
cols
|
En lista med kolumnnamn som ska läsas in från datauppsättningen. Om Ingen läses alla kolumner in. Information om tillgängliga kolumner i den här datamängden finns i NYC Taxi & Limousine Commission - yellow taxi trip records (Nyc Taxi & Limousine Commission – gul taxiresa). Standardvärde: None
|
|
limit
|
Ett värde som anger antalet dagar med data som ska läsas in med Standardvärde: -1
|
|
enable_telemetry
|
Om telemetri ska aktiveras för den här datauppsättningen. Standardvärde: True
|
|
start_date
Obligatorisk
|
Startdatumet som du vill fråga inkluderande. |
|
end_date
Obligatorisk
|
Slutdatumet som du vill fråga inkluderande. |
|
cols
Obligatorisk
|
En lista med kolumnnamn som du vill hämta. Ingen hämtar alla kolumner. |
|
limit
Obligatorisk
|
to_pandas_dataframe() läser bara in "begränsa" datamånader. -1 betyder ingen gräns. |
|
enable_telemetry
Obligatorisk
|
Anger om telemetri ska skickas. |
Kommentarer
Exemplet nedan visar hur du kommer åt datauppsättningen.
from azureml.opendatasets import NycTlcYellow
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()