Normatività indiretta
La normatività indiretta è un approccio al problema dell’allineamento dell’IA che tenta di specificare i valori dell’IA in modo indiretto, ad esempio facendo riferimento a ciò che un agente razionale valuterebbe in condizioni idealizzate, piuttosto che attraverso una specificazione diretta.
Ulteriori letture
Nick Bostrom (2018) Superintelligenza: tendenze, pericoli, strategie, Torino: Bollati Boringhieri, chap. 13.
Paul Christiano (2012) A formalization of indirect normativity, Ordinary Ideas, 21 di aprile.
Eliezer Yudkowsky (2013) Five theses, two lemmas, and a couple of strategic implications, Machine Intelligence Research Institute’s Blog, 5 di maggio.
Voci correlate
allineamento dell’IA • metodo di selezione della motivazione