Metodo di controllo delle capacità

Un metodo di controllo delle capacità è un metodo che tenta di prevenire risultati indesiderati da parte di un’intelligenza artificiale limitando ciò che quell’IA può fare. I metodi di controllo delle capacità comprendono il contenimento dell’IA, i metodi di incentivazione (inclusa la cattura antropica), lo stordimento e i fili d’inciampo.⁠1 I metodi di controllo delle capacità possono essere contrapposti ai metodi di selezione della motivazione, che cercano invece di limitare ciò che l’IA vuole fare.

Ulteriori letture

Nick Bostrom (2018) Superintelligenza: tendenze, pericoli, strategie, Torino: Bollati Boringhieri, chap. 9.

Voci correlate

Allineamento dell’IA • contenimento dell’IA • Cattura antropica • Metodo di selezione della motivazione