L'algoritmo K*means e un algoritmo di clustering partizionale il quale lavoro e di suddividere un insieme di ogetti in K gruppi in base agli attributi. Il suo ciclo e iterativo e punta alla minimizzazione delle varianze intra-cluster. Praticamente assegna ad ogni gruppo un punto di ingresso o casualmente o in modo euristico e poi calcola il centoide di nuovo. Poi assegna K' gruppi e cosi via.

Atomicita- Ogni transazione e unica e questa o viene o non viene esequita sempre come una sola cosa.
Coerenza- Il database deve essere in un stato coerente quando eseque una transazione e in un altro quando essa termina. Questo e per non violare eventuali vincoli di integrita
Isolamento- Ogni transazione e isolata dalle atlre. Ovvero deve essere indipendente. Se una falisce, non devono fallire anche tutte le altre.
Durabilita- Una volta che le operazioni di commit o abort siano state fatte devono essere salvate le modifiche.

Uno schedule si dice seriale quando le transazioni esequite non vengono interottte da altre e sono in sequenza.
Uno schedule si dice serializzabile se produce lo stesso risultato di un schedule seriale S' sempre parlando delle stesse transazioni.
Cap theroem:

Dato uno sistema informatico distribuito, esso puo soddisfare al massimo due delle tre proprieta:
Coerenza- che tutte le transazioni vedono gli stessi dati nello stesso momento
Disponibilita- che ogni richiesta abbia una risposta se essa e stata esequita o meno
Tolleranza di partizione che se qualcosa non andasse bene, il sistema continua a funzionare

select count(*) as NumeroPacchiPrio
from pacco where tipologia = Prioritario and Codice in (select CodicePacco
from Giacenza
where IdUfficio in (select Id from UFFICCIO where citta = Bologna and numeroDipendenti > 5))

select id from
ufficio, pacco, giacenza
where codicePacco = Codice and IdUfficio = Id and tipologia != prioritario and citta = Bologna

