Normatività indiretta

La normatività indiretta è un approccio al problema dell’allineamento dell’IA che tenta di specificare i valori dell’IA in modo indiretto, ad esempio facendo riferimento a ciò che un agente razionale valuterebbe in condizioni idealizzate, piuttosto che attraverso una specificazione diretta.

Ulteriori letture

Nick Bostrom (2018) Superintelligenza: tendenze, pericoli, strategie, Torino: Bollati Boringhieri, chap. 13.

Paul Christiano (2012) A formalization of indirect normativity, Ordinary Ideas, 21 di aprile.

Eliezer Yudkowsky (2013) Five theses, two lemmas, and a couple of strategic implications, Machine Intelligence Research Institute’s Blog, 5 di maggio.

Voci correlate

allineamento dell’IA • metodo di selezione della motivazione