BanditPolicy Klass

Definierar en princip för tidig avslutning baserat på slack-kriterier och ett frekvens- och fördröjningsintervall för utvärdering.

Initiera en BanditPolicy med slackfaktor, slack_amount och utvärderingsintervall.

Konstruktor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parametrar

Name	Description
slack_factor	float Förhållandet som används för att beräkna det tillåtna avståndet från den bästa experimentkörningen. Standardvärde: None
slack_amount	float Det absoluta avståndet som tillåts från den bästa körningen. Standardvärde: None
evaluation_interval	int Frekvensen för att tillämpa principen. Standardvärde: 1
delay_evaluation	int Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av `evaluation_interval` som är större än eller lika med `delay_evaluation`. Standardvärde: 0
slack_factor Obligatorisk	float Förhållandet som används för att beräkna det tillåtna avståndet från den bästa experimentkörningen.
slack_amount Obligatorisk	float Det absoluta avståndet som tillåts från den bästa körningen.
evaluation_interval Obligatorisk	int Frekvensen för att tillämpa principen.
delay_evaluation Obligatorisk	int Antalet intervall som den första principutvärderingen ska fördröjas för. Om det anges tillämpar principen varje multipel av `evaluation_interval` som är större än eller lika med `delay_evaluation`.

Kommentarer

Bandit-principen tar följande konfigurationsparametrar:

slack_factor: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som ett förhållande.
slack_amount: Mängden slack som tillåts med avseende på den bäst presterande träningskörningen. Den här faktorn anger slacket som en absolut mängd.
evaluation_interval: Valfritt. Frekvensen för att tillämpa principen. Varje gång träningsskriptet loggar räknas det primära måttet som ett intervall.
delay_evaluation: Valfritt. Antalet intervall för att fördröja principutvärderingen. Använd den här parametern för att undvika att träningskörningar avslutas i förtid. Om det anges tillämpar principen varje multipel av evaluation_interval som är större än eller lika med delay_evaluation.

Alla körningar som inte faller inom slack-faktorn eller slack-mängden av utvärderingsmåttet när det gäller den bästa körningen avslutas.

Överväg en Bandit-princip med slack_factor = 0,2 och evaluation_interval = 100. Anta att körning X är den för närvarande bäst presterande körningen med AUC (prestandamått) på 0,8 efter 100 intervall. Anta vidare att den bästa AUC som rapporteras för en körning är Y. Den här principen jämför värdet (Y + Y * 0,2) med 0,8, och om det är mindre avbryts körningen. Om delay_evaluation = 200 används principen första gången med intervall 200.

Överväg nu en Bandit-princip med slack_amount = 0,2 och evaluation_interval = 100. Om Körning 3 är den för närvarande bäst presterande körningen med ett AUC (prestandamått) på 0,8 efter 100 intervall avslutas alla körningar med en AUC som är mindre än 0,6 (0,8–0,2) efter 100 iterationer. delay_evaluation På samma sätt kan även användas för att fördröja den första utvärderingen av avslutningsprincipen för ett visst antal sekvenser.

Mer information om hur du tillämpar principer för tidig avslutning finns i Justera hyperparametrar för din modell.

Attribut

delay_evaluation

Returnera antalet sekvenser som den första utvärderingen fördröjs för.

Returer

Typ	Description
int	Fördröjningsutvärderingen.

evaluation_interval

Returnera värdet för utvärderingsintervallet.

Returer

Typ	Description
int	Utvärderingsintervallet.

slack_factor

Returnera slack-faktorn med hänsyn till den träningskörning som är bäst presterande.

Returer

Typ	Description
float	Slack-faktorn.

POLICY_NAME

POLICY_NAME = 'Bandit'

Feedback

Var den här sidan till hjälp?

Dela via

BanditPolicy Klass

Konstruktor

Parametrar

Kommentarer

Attribut

delay_evaluation

Returer

evaluation_interval

Returer

slack_factor

Returer

POLICY_NAME

Feedback