Modalità di fallimento dell’IA
Una modalità di fallimento dell’IA è un modo in cui un progetto di sviluppo dell’intelligenza artificiale può fallire. Le modalità di fallimento maligno dell’IA sono modalità di fallimento dell’IA che portanono a una catastrofe esistenziale.
Nick Bostrom classifica le modalità di fallimento maligno dell’IA in tre tipi fondamentali: istanziazione perversa, che comporta la soddisfazione degli obiettivi di un’IA in modi contrari alle intenzioni di chi l’ha programmata; proliferazione dell’infrastruttura, che comporta la trasformazione di ampie parti dell’universo accessibile in infrastrutture al servizio di qualche obiettivo che impedisce la realizzazione del potenziale a lungo termine dell’umanità; e crimine mentale, che comporta il maltrattamento di processi informatici moralmente rilevanti.
Nick Bostrom (2018) Superintelligenza: tendenze, pericoli, strategie, Torino: Bollati Boringhieri, chap. 8.