Dela via


BanditPolicy Klass

Definierar en princip för tidig avslutning baserat på slack-kriterier och ett frekvens- och fördröjningsintervall för utvärdering.

Initiera en BanditPolicy med slackfaktor, slack_amount och utvärderingsintervall.

Konstruktor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parametrar

Name Description
slack_factor

Förhållandet som används för att beräkna det tillåtna avståndet från den bästa experimentkörningen.

Standardvärde: None
slack_amount

Det absoluta avståndet som tillåts från den bästa körningen.

Standardvärde: None
evaluation_interval
int

Frekvensen för att tillämpa principen.

Standardvärde: 1
delay_evaluation
int

Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Standardvärde: 0
slack_factor
Obligatorisk

Förhållandet som används för att beräkna det tillåtna avståndet från den bästa experimentkörningen.

slack_amount
Obligatorisk

Det absoluta avståndet som tillåts från den bästa körningen.

evaluation_interval
Obligatorisk
int

Frekvensen för att tillämpa principen.

delay_evaluation
Obligatorisk
int

Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Kommentarer

Bandit-principen tar följande konfigurationsparametrar:

  • slack_factor: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som ett förhållande.

  • slack_amount: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som en absolut mängd.

  • evaluation_interval: Valfritt. Frekvensen för att tillämpa principen. Varje gång träningsskriptet loggar räknas det primära måttet som ett intervall.

  • delay_evaluation: Valfritt. Antalet intervall för att fördröja principutvärderingen. Använd den här parametern för att undvika att träningskörningar avslutas i förtid. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Alla körningar som inte faller inom slack-faktorn eller slack-mängden av utvärderingsmåttet när det gäller den bästa körningen avslutas.

Överväg en Bandit-princip med slack_factor = 0,2 och evaluation_interval = 100. Anta att körning X är den för närvarande bäst presterande körningen med AUC (prestandamått) på 0,8 efter 100 intervall. Anta vidare att den bästa AUC som rapporteras för en körning är Y. Den här principen jämför värdet (Y + Y * 0,2) med 0,8, och om det är mindre avbryts körningen. Om delay_evaluation = 200 används principen första gången med intervall 200.

Överväg nu en Bandit-princip med slack_amount = 0,2 och evaluation_interval = 100. Om Körning 3 är den för närvarande bäst presterande körningen med ett AUC (prestandamått) på 0,8 efter 100 intervall avslutas alla körningar med en AUC som är mindre än 0,6 (0,8–0,2) efter 100 iterationer. delay_evaluation På samma sätt kan även användas för att fördröja den första utvärderingen av avslutningsprincipen för ett visst antal sekvenser.

Mer information om hur du tillämpar principer för tidig avslutning finns i Justera hyperparametrar för din modell.

Attribut

delay_evaluation

Returnera antalet sekvenser som den första utvärderingen fördröjs för.

Returer

Typ Description
int

Fördröjningsutvärderingen.

evaluation_interval

Returnera värdet för utvärderingsintervallet.

Returer

Typ Description
int

Utvärderingsintervallet.

slack_factor

Returnera slack-faktorn med hänsyn till den träningskörning som är bäst presterande.

Returer

Typ Description

Slack-faktorn.

POLICY_NAME

POLICY_NAME = 'Bandit'