Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
              Gäller för:
 Databricks SQL 
 Databricks Runtime
Returnerar ett count-min sketch av alla värden i gruppen i column med epsilon, confidence och seed.
I Databricks SQL och Databricks Runtime 13.3 LTS och senare stöder den här funktionen namngivna parameteranrop.
Syntax
count_min_sketch ( [ALL | DISTINCT] column, epsilon, confidence, seed ) [FILTER ( WHERE cond ) ]
Den här funktionen kan också anropas som en -fönsterfunktion med hjälp av OVER-satsen.
Argument
- 
              
column: Ett uttryck som utvärderas till ett helt numeriskt uttryck,STRING, ellerBINARY. - 
              
epsilon: EnDOUBLEliteral större än 0 som anger det relativa felet. - 
              
confidence: EnDOUBLEliteral större än 0 och mindre än 1. - 
              
seed: EnINTEGERliteral. - 
              
cond: Ett valfritt booleskt uttryck som filtrerar de rader som används för aggregering. 
Retur
En BINARY.
Count-min-skiss är en probabilistisk datastruktur som används för kardinalitetsuppskattning med hjälp av sub-linjärt utrymme.
Om DISTINCT anges fungerar funktionen endast på en unik uppsättning expr värden.
Exempel
-- Named parameter invocation
> SELECT hex(count_min_sketch(column => col, confidence => 0.5d, epsilon => 0.5d, seed => 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000030000000100000004000000005D8D6AB90000000000000000000000000000000200000000000000010000000000000000
> SELECT hex(count_min_sketch(DISTINCT col, 0.5d, 0.5d, 1)) FROM VALUES (1), (2), (1) AS tab(col);
0000000100000000000000020000000100000004000000005D8D6AB90000000000000000000000000000000100000000000000010000000000000000