IA simbolica: logica epistemica
Una logica per ragionare su conoscenza e opinione
Last updated
Was this helpful?
Una logica per ragionare su conoscenza e opinione
Last updated
Was this helpful?
Questa parte si basa su un paio di testi:
Hans van Ditmarsch, Joseph Y. Halpern, Wiebe van der Hoek, Barteld Kooi. An Introduction to Logics of Knowledge and Belief. Capitolo 1 di Handbook of Epistemic Logic, 2015.
Rasmus Rendsvig, John Symons, and Yanjing Wang. Epistemic Logic, , Edward N. Zalta & Uri Nodelman (eds.), 2023.
La logica epistemica studia la nozione di conoscenza (knowledge in inglese; episteme in greco) e la logica doxastica studia la nozione di credenza (belief in Inglese; in greco antico doxa significa opinione). In senso più ampio, queste logiche studiano la nozione di informazione.
Il ragionamento sulla conoscenza presenta sottigliezze che vanno oltre quelle che si presentano nella logica proposizionale o dei predicati. Prendiamo, ad esempio, la legge del terzo escluso nella logica classica, che dice che per qualsiasi proposizione , deve valere o o (la negazione di ); formalmente, .
Nel linguaggio della logica epistemica, scriviamo per dire che "l'agente conosce " e intuitivamente intendiamo che "in tutti i possibili mondi accessibili dall'agente la proposizione è vera".
Qui un mondo è intuitivamente uno stato di conoscenza. Ad esempio se Alice si sta chiedendo se Bob arriverà puntuale o in ritardo, i possibili mondi sono due: quello in cui Bob arriva in orario e quello in cui Bob arriva in ritardo.
Questa semplice aggiunta al linguaggio ci permette di porre nuove questioni. Ad esempio, che tipo di situazioni descrivono le seguenti formule? Quali di loro dovrebbero essere valide?
: l'agente conosce o l'agente non conosce
: l'agente conosce o l'agente conosce la sua negazione
: l'agente conosce o la sua negazione
: l'agente conosce o l'agente non conosce la sua negazione
Abbiamo che, data la semantica che ci interessa, solo la prima e la terza formula sono valide, in quanto sono riformulazioni epistemiche di tautologie proposizionali. La seconda non è valida in quanto l'agente potrebbe non conoscere e neppure la sua negata, ovvero avere incertezza su . Anche la quarta formula non è valida in quanto afferma che l'agente conosce oppure considera possibile, ma potrebbe darsi che l'agente conosca la negazione di (ovvero sia vera in tutti i mondi accessibili dall'agente ), rendendo falsa la formula.
Una delle caratteristiche interessanti della logica epistemica è che va oltre la conoscenza fattuale che gli agenti hanno. La conoscenza può riguardare la conoscenza stessa, quindi possiamo scrivere espressioni come : l'agente sa che se conosce allora consce anche (i verbi sapere e conoscere sono usati come sinonimi in questo testo). Le affermazioni sulla conoscenza fattuale vengono anche chiamate di prim'ordine, quelle sulla conoscenza della conoscenza vengono dette di ordine superiore.
Ancora più interessante è la possibilità di modellare la conoscenza degli altri, un aspetto importante quando si ragiona sui protocolli di comunicazione. Supponiamo che Anna conosca un fatto : "Sono incinta". Quindi abbiamo .
Supponiamo che Anna invii questo messaggio via e-mail a Baldo (il padre del bambino) e che Baldo lo legga. Abbiamo quindi .
Naturalmente sia Anna che Baldo sanno di sapere, ovvero . Abbiamo anche ? A meno che Anna non abbia informazioni sul fatto che Baldo abbia effettivamente letto il messaggio, non può presumere che l'abbia fatto, quindi abbiamo .
Essendo un gentiluomo, Baldo potrebbe rispondere ad Anna dicendo di aver letto il messaggio. A questo punto vale . Abbiamo anche (Anna sa che Baldo sa che lei sa, perché Baldo ha risposto a Anna) ma, poiché Baldo non può presumere che Anna abbia letto la conferma, non abbiamo ancora .
A questo punto Anna e Baldo potrebbero prendere il telefono e parlarsi! L'uso del telefono è un buon protocollo che garantisce la conoscenza comune tra Anna e Baldo, ovvero:
Si noti che la formula della conoscenza comune è infinita e la sua lunghezza cresce in modo esponenziale al crescere dell'ordine della conoscenza. Sviluppando la formula abbiamo 2 congiunzioni al prim'ordine, 4 al second'ordine, 8 al terz'ordine, e in generale all'ordine .
La logica modale epistemica estende la logica proposizionale. Il linguaggio della logica proposizionale presuppone un insieme di proposizioni primitive (o atomiche), tipicamente indicate con . Esse si riferiscono tipicamente ad affermazioni considerate elementari, cioè prive di struttura logica, come "piove" o "Anna è incinta".
La logica proposizionale utilizza gli operatori booleani, come ("non"), ("e"), , ("o"), ("implica") e ("se e solo se"), per costruire formule più complesse. Gli unici operatori necessari sono e , infatti:
è uguale a
è uguale a
equivale a
Inoltre, definiamo il simbolo vero come e il simbolo falso come , ovvero .
Quando ragioniamo sulla conoscenza, dobbiamo poter fare riferimento al soggetto, cioè all'agente di cui stiamo parlando. Un agente è un'entità umana o artificiale. Per fare ciò, assumiamo un insieme finito Ag di agenti. Per ragionare sulla conoscenza, aggiungiamo al linguaggio della logica proposizionale gli operatori , dove denota "l'agente conosce ". Sia l'insieme degli operatori di conoscenza per ogni agente. Il duale dell'operatore di conoscenza è e denota "l'agente considera possibile "; è definito come:
Siamo pronti a definire il linguaggio della logica modale epistemica con la seguente grammatica BNF (Backus-Naur Form):
dove e .
Si noti che una formula è illimitata ma finita. Inoltre, il linguaggio della logica proposizionale è e il linguaggio della logica (uni-)modale è ; nel caso della logica uni-modale è indicato come e è indicato come . Quando c'è più di un agente si parla di logica multimodale.
Definiamo ora un modo per determinare sistematicamente il valore di verità di una formula, cioè di dare una semantica al linguaggio modale epistemico. Nella logica proposizionale, il fatto che una proposizione sia vera o meno dipende dalla situazione in cui ci troviamo. Le situazioni rilevanti sono formalizzate utilizzando le valutazioni, dove una valutazione è una funzione che determina il valore di verità delle proposizioni primitive.
Una valutazione può essere estesa in modo da determinare la verità di tutte le formule, utilizzando una semplice definizione induttiva:
è vera in sse sia che sono vere in ;
è vera in sse è falsa in .
Per modellare la conoscenza utilizziamo idee che risalgono al filosofo finlandese Jaakko Hintikka.
Pensiamo a un agente che considera possibili un certo numero di situazioni diverse, chiamate mondi o stati, che sono coerenti con le informazioni di cui l'agente dispone.
Per esempio, se l'agente sa che oggi è un giorno di fine settimana, allora in un mondo possibile oggi è sabato e in un altro mondo possibile oggi è domenica, ma non esiste un mondo in cui oggi è lunedì.
Quindi ogni agente ha la sua relazione di accessibilità che dice quali mondi sono accessibili (considerati possibili) a partire da un dato mondo.
Diremo che un agente conosce una formula in un mondo se la formula è vera in tutti i mondi che l'agente considera possibili a partire da quel mondo.
Quindi, piuttosto che usare una singola situazione per dare significato alle formule modali, come nella logica proposizionale, usiamo un insieme di tali situazioni; inoltre, in ogni situazione, consideriamo, per ogni agente, quali altre situazioni l'agente considera possibili.
La struttura risultante è un grafo etichettato, chiamato modello di Kripke, dove i nodi sono i mondi e gli archi sono i collegamenti di accessibilità per gli agenti:
ogni mondo è etichettato con le proposizioni atomiche vere in quel mondo;
ogni arco è etichettato con un insieme non vuoto di agenti che usano quel collegamento nella propria relazione di accessibilità.
Segue un esempio con 4 mondi e due agenti ( e ).
Formalmente, dato un insieme di proposizioni primitive e un insieme di agenti, un modello di Kripke è una struttura , dove:
è un insieme di stati (o mondi);
è una funzione che per ogni agente restituisce una relazione di accessibilità (un insieme di coppie di stati);
è una funzione che per ogni stato restituisce una valutazione delle proposizioni nello stato .
La classe di tutti i modelli di Kripke è indicata con . Una struttura di Kripke si concentra solo sul grafo sottostante un modello, senza considerare la valutazione.
Siamo pronti a definire la verità di una formula in un modello di Kripke e uno stato del modello. Dato un modello e un mondo , definiamo cosa significa che una formula è vera in , scritto , induttivamente come segue:
sse per
sse e
sse non vale (scritto anche come )
sse per ogni tale che (scritto anche come )
Si ricordi che ; segue facilmente che:
sse per qualche tale che
Quindi l'operatore modale corrisponde ad una quantificazione universale del tipo e il suo duale corrisponde ad una quantificazione esistenziale del tipo .
Infine scriveremo se per ogni mondo .
Vediamo un esempio. Anna e Baldo si sono dati appuntamento per la prima volta per un aperitivo, ma, essendo la prima uscita, nessuno sa il numero di telefono dell'altro. Ognuno sa quanto tempo serve per arrivare da casa al luogo dell'incontro, quindi, assumendo che entrambi abbiano un orologio, ognuno è consapevole se sarà puntuale o in ritardo all'appuntamento, ma non potendo comunicare con l'altro, non ha questa informazione per l'altro. Possiamo modellare questa situazione con il modello di Kripke rappresentato in figura, dove le etichette e sugli archi indicano rispettivamente la relazione di accessibilità di Anna e Baldo e le proposizioni e indicano rispettivamente che Anna e Baldo sono puntuali (quindi indica che Anna è in ritardo e similmente per Baldo).
Si noti che, per esempio, se Anna sa di essere puntuale (mondi e ), i mondi possibili per Anna sono quelli in cui Baldo è puntuale () o in ritardo (). Similmente per Baldo. Inoltre, se Anna sa di essere in ritardo (mondi e ), i mondi possibili per Anna sono quelli in cui Baldo è puntuale () o in ritardo (). Similmente per Baldo. Ognuno dei quattro mondi rappresenta una delle possibili situazioni di puntualità e ritardo per Anna e Baldo. Si noti che i mondi e , ad esempio, non sono mutuamente accessibili né per Anna né per Baldo. Infatti, se Anna sa si essere puntuale nel mondo , è inconcepibile per lei il mondo in cui è in ritardo; d'altronde se Anna sa di essere in ritardo nel mondo non potrà essere puntuale nel mondo ; lo stesso per Baldo.
Valgono le seguenti:
: nel mondo sia Anna che Baldo sono puntuali
: nel mondo sia Anna che Baldo sanno che saranno puntuali
: nel mondo sia Anna che Baldo non sanno se l'altro sarà puntuale. Equivalentemente possiamo scrivere , ovvero nel mondo sia Anna che Baldo ritengono possibile che l'altro sia in ritardo
: in ogni mondo Anna sa se sarà puntuale o in ritardo (in quanto ha un orologio) e lo stesso vale per Baldo
: in tutti i mondi Anna sa di essere puntuale oppure non sa di esserlo. Si noti che questa è una tautologia, quindi è vera indipendentemente dal modello
Ricordiamo che è la classe di tutti i modelli. Sia una classe di modelli e una formula. Diremo che:
è valida in , e scriveremo , se per ogni modello ;
è soddisfacibile in se per qualche modello e stato del modello.
Ad esempio, come abbiamo osservato sopra, è una formula valida. Inoltre è soddisfacibile (basta prendere il modello di sopra e un qualunque stato del modello), ma non è valida in , la classe di tutti i modelli. E' facile costruire un modello in cui esiste un mondo tale che è vera in alcuni mondi raggiungibili da e falsa in altri, dunque non è vero che è sempre vera o sempre falsa in tali mondi, dunque . D'altronde se scegliamo come la classe dei modelli lineari, ovvero in cui ogni mondo ha esattamente un successore, allora , cioè è valida in .
Definiamo infine una serie di classi di modelli in termini di proprietà delle relazioni di accessibilità in tali modelli. Poiché dipendono solo dalla relazione di accessibilità, avremmo potuto definirle anche per le strutture sottostanti; infatti, le proprietà sono talvolta chiamate proprietà delle strutture.
Sia una relazione di accessibilità su un dominio di stati :
Se non ha alcuna proprietà particolare, indicheremo la relativa classe dei modelli di Kripke con .
è riflessiva se per tutti gli si ha . La classe dei modelli di Kripke riflessivi è indicata con .
è simmetrica se per tutti gli , se allora . La classe dei modelli di Kripke simmetrici è indicata con .
è transitiva se per tutti , se e allora . La classe dei modelli di Kripke transitivi è indicata con .
è seriale se per tutti gli esiste un tale che . La classe dei modelli di Kripke seriali è indicata con .
è Euclidea se per tutti gli , se e allora . La classe dei modelli di Kripke euclidei è indicata con .
è una relazione di equivalenza se è riflessiva, simmetrica e transitiva. La classe dei modelli di Kripke in cui le relazioni sono relazioni di equivalenza è denotata con e più spesso con .
Vale che una relazione di equivalenza partiziona l'insieme dei mondi in insiemi non vuoti, disgiunti e la cui unione restituisce l'intero insieme dei mondi.
La classe dei modelli associati a relazioni di equivalenza è stata tipicamente usata per modellare la conoscenza. In tal caso la relazione di accessibilità è anche detta relazione di indistinguibilità, in quanto due mondi associati dalla relazione sono indistinguibili in base all'informazione che l'agente ha a disposizione. Ad esempio, se ho la sola informazione che è un giorno del fine settimana, il mondo del Sabato e della Domenica sono indistinguibili.
Vediamo quali sono le formula valide che contraddistinguono la classe dei modelli e i sui sovrainsiemi fino alla classe di tutti i modelli.
Se è una istanza modale di una tautologia proposizionale, allora .
Ad esempio, dato che e sono tautologie proposizionali, allora anche le seguenti formule sono sempre valide: e .
Se e allora .
Se allora
Ovvero, gli agenti conoscono tutte le formule valide. Questa regola è anche chiamata regola della necessità (necessitation rule). E' valida per la classe di tutti i modelli.
Questo assioma, tradizionalmente conosciuto come K, stabilisce il modus ponens come regola di inferenza a livello epistemico. E' valido per la classe di tutti i modelli.
Ovvero, se conosco qualcosa, lo ritengo anche possibile. L'assioma di consistenza, noto come D, è valido per la classe dei modelli seriali .
L'assioma D è equivalente a : se conosco qualcosa, non posso conoscere anche il suo contrario. Ovvero sono consistente. Esso è anche equivalente a , cioè non conosco il falso, o equivalentemente , cioè credo nel vero.
Questo assioma, noto anche come T, dice che se un agente conosce dei fatti, questi devono essere veri (nel mondo corrente). L'assioma T è valido per la classe dei modelli riflessivi .
Questo assioma può essere espresso anche nella sua contrapposizione: , ovvero se qualcosa è vero nel mondo corrente non posso conoscere il suo contrario.
L'assioma di verità è spesso considerato la principale caratteristica che distingue la conoscenza (knowledge) dalla credenza (belief). Come vedremo, nella logica doxastica l'assioma di verità T è sostituito dall'assioma di coerenza D.
L'assioma dell'introspezione positiva, noto come 4, afferma che se un agente conosce qualcosa, allora sa di saperlo.
Equivalentemente, questo assioma dice che se non so di sapere allora non so:
Questo assioma è valido per la classe dei modelli transitivi .
L'assioma dell'introspezione negativa, noto anche come assioma 5, dice che se un agente non conosce qualcosa, allora sa di non saperlo.
Equivalentemente, questo assioma dice che se non so di non sapere allora so:
Questo assioma è valido per la classe dei modelli euclidei .
L'assioma di simmetria, noto anche come assioma B, dice che se qualcosa è vero, allora un agente sa di ritenerlo possibile.
Equivalentemente, questo assioma dice che se un agente ritene possibile di conoscere qualcosa, allora quel qualcosa è vero:
Questo assioma è valido per la classe dei modelli simmetrici .
Si noti che se e sono insiemi di modelli e , allora implica . Dato che una relazione di equivalenza è per definizione riflessiva, simmetrica e transitiva, e inoltre è Euclidea e seriale, allora la classe di modelli , eredita tutti gli assiomi elencati in questa sezione, che quindi potremmo definire gli assiomi della conoscenza.
è spesso definita la logica della conoscenza, caratterizzata da:
l'assioma della verità T (che cattura la riflessività dei modelli)
l'assioma dell'introspezione positiva 4 (che cattura la transitività dei modelli)
l'assioma dell'introspezione negativa 5 (che cattura l'essere Euclideo dei modelli)
Come abbiamo detto, 4 è ridondante in dato che una relazione riflessiva e Euclidea è anche transitiva.
La logica della credenza, detta anche logica doxastica, è invece spesso rappresentata da ed è quindi caratterizzata da:
l'assioma della coerenza D (che cattura la serialità dei modelli)
l'assioma dell'introspezione positiva 4 (che cattura la transitività dei modelli)
l'assioma dell'introspezione negativa 5 (che cattura l'essere Euclideo dei modelli)
In questo caso l'assioma 4 è necessario. La differenza tra credere e conoscere sta dunque nell'assioma della verità T, presente nella conoscenza, che è sostituito con quello della coerenza D per catturare la credenza.
Dato che una relazione rilessiva è anche seriale, accettare l'assioma della verità implica accettare anche quello della coerenza. In altri termini sia la conoscenza che la credenza sono coerenti, ovvero non posso conoscere e non posso credere in una contraddizione (il falso). Inoltre, la conoscenza è più forte della credenza: se conosco un fatto allora credo in quel fatto. Ma non vale il viceversa: posso credere in qualcosa che non conosco (purché non conosca il suo contrario).
Tipicamente la conoscenza si associa al rigore (scientifico o matematico). Ad esempio conosco che la terra è sferica o che esistono infiniti numeri primi. La credenza è una modalità più debole e in generale posso credere in qualsiasi cosa che non sia una palese contraddizione. Ad esempio posso credere nell'esistenza della materia oscura o nel fatto che ogni numero pari maggiore di 2 sia la somma di due numeri primi (congettura di Goldbach), anche se non ho le prove scientifiche o matematiche di tali affermazioni. Ma non posso credere che la terra sia piatta o che esista un numero primo maggiore di tutti gli altri primi, dato che queste affermazioni non sono valide scientificamente (la terra è sferica) o matematicamente (i numeri primi sono infiniti).
Se volessimo rappresentare entrambe le modalità, conoscenza e credenza per ogni agente nello stesso linguaggio modale, occorre fare attenzione a come costruire i modelli di Kripke. Come abbiamo visto, le relazioni di accessibilità associate alla conoscenza e associate alla credenza hanno proprietà strutturali diverse (per esempio una è riflessiva e l'altra solo seriale), dunque vanno tenute distinte. Fissata la modalità, ovvero conoscenza o credenza, le relazioni di accessibilità per ogni agente hanno invece le stesse proprietà strutturali (godono degli stessi assiomi).
Nella vita ordinaria, ragioniamo su ciò che gli altri sanno. In particolare, ci preoccupiamo di ciò che gli altri sanno (o credono) di noi, e spesso in modo specifico di ciò che loro sanno di ciò che noi sappiamo.
Anna sa che Baldo sa che lei è incinta? Baldo sa questo?
La logica epistemica può rivelare interessanti caratteristiche epistemiche dei sistemi che coinvolgono gruppi di agenti. In alcuni casi, ad esempio, i fenomeni sociali emergenti dipendono dal fatto che gli agenti ragionano in modi particolari sulla conoscenza e sulle credenze di altri agenti.
Ad esempio, gli automobilisti sanno che un semaforo rosso indica che devono fermarsi a un incrocio. Tuttavia, affinché la convenzione dei semafori funzioni, è necessario che gli automobilisti sappiano che anche gli altri automobilisti sanno che il rosso significa stop. Il ruolo convenzionale dei semafori si basa sul fatto che tutti gli automobilisti sanno che tutti gli automobilisti conoscono la regola, ovvero che la regola è un elemento di conoscenza comune.
Vi sono tre tipi di conoscenza di gruppo: distribuita, mutua e comune. Facciamo un esempio. Il docente mantiene un canale Telegram dove partecipano gli studenti del corso. Per premiare gli studenti per il loro impegno ha deciso di creare un wallet bitcoin, depositare alcuni fondi, e condividere con gli studenti la relativa seed phrase (SP) del wallet. Può condividere la SP in diversi modi:
suddivide la stringa della SP in tanti pezzi quanti sono gli studenti e invia in privato un pezzo ad ogni studente;
confida ad ogni studente in privato l'intera SP;
pubblica la SP sul canale in modo che tutti la vedano.
Le tre conoscenze sono diverse:
nel primo caso la SP è conoscenza distribuita. Ovvero se tutti gli studenti mettono assieme la loro conoscenza, ottengono la chiave d'accesso. Ma nessuno individualmente conosce la SP. Una volta prelevati i fondi, possono decidere come spartirseli (ad esempio in parti uguali o sorteggiando un vincitore);
nel secondo caso la SP è conoscenza mutua. Ogni studente conosce interamente la SP, ma non sa che gli altri la conoscono. Ad esempio, se la ricompensa andasse solo al primo che riesce ad accedere al wallet prelevando i fondi, in tal caso gli studenti non avrebbero fretta di prelevare i fondi, non sapendo di essere in competizione;
nel terzo caso la SP è conoscenza comune. Tutti sanno la SP e tutti sanno che tutti sanno la SP e così via all'infinito. Nel caso di competizione per la ricompensa, gli studenti si affretterebbero a prelevare i fondi, sapendo di essere in competizione con gli altri.
Si noti che la conoscenza mutua implica quella distribuita: se un agente del gruppo conosce qualcosa allora lo può distribuire al gruppo. Inoltre, la conoscenza comune implica quella mutua: se il gruppo ricorsivamente conosce qualcosa allora ogni agente del gruppo la conosce direttamente.
La conoscenza distribuita è la conoscenza che un gruppo di agenti avrebbe se condividesse l'informazione che ognuno possiede. Gli agenti di un gruppo conoscono in modo distribuito se un ipotetico agente saggio che avesse tutta la conoscenza degli agenti del gruppo conosce .
Definiamo il nuovo operatore modale per la conoscenza distribuita. La formula si legge: è conoscenza distribuita tra il gruppo di agenti in .
L'operatore ha semantica sull'intersezione delle relazioni di accessibilità degli agenti in . L'idea è che se anche solo uno degli agenti esclude che un mondo sia accessibile dal mondo corrente, allora tale sarà per l'intero gruppo. Sia dunque:
Consideriamo l'esempio in figura:
Nell'esempio di sopra, solo i tre cappi sui nodi appartengono alla relazione , con .
La semantica dell'operatore è quindi:
sse per ogni tale che
Nell'esempio di sopra, vale che e con .
Gli agenti di un gruppo conoscono in modo mutuo se tutti gli agenti del gruppo conoscono singolarmente . La conoscenza mutua è un sottoinsieme di quella distribuita: conoscere mutuamente qualcosa implica che la si conosce anche in modo distribuito ma non vale il viceversa.
Possiamo quindi definire un nuovo operatore di conoscenza mutua (everybody knows) definito nel seguente modo:
La formula is legge: è mutuamente conosciuta da tutti gli agenti del gruppo . Nell'esempio di sopra, se , allora vale che ma , in quanto .
Il fatto che tutti gli agenti di un gruppo conoscano un fatto in prim'ordine non significa the conoscano quel fatto con un ordine superiore di conoscenza. Gli agenti di un gruppo conoscono in modo comune se ognuno conosce e ognuno sa che sé stesso e gli altri agenti conoscono e così via ab infinitum. In altri termini, usando una definizione ricorsiva:
è conoscenza comune se tutti gli agenti conoscono e tutti gli agenti ricorsivamente sanno che è conoscenza comune.
La conoscenza comune è dunque la più restrittiva tra quelle analizzate ed in particolare è un sottoinsieme di quella mutua (e quindi anche di quella distribuita). Nell'esempio di sopra, vale che ma .
Potremmo pensare di definire l'operatore modale di conoscenza comune in termini di quello di conoscenza mutua come segue:
dove indica applicazioni di , ovvero:
per ,
Ad esempio, se , allora:
dove nell'ultimo passaggio abbiamo usato la proprietà distributiva del quantificatore universale rispetto alla congiunzione .
Questa definizione di conoscenza comune è però problematica, in quanto la formula con cui abbiamo definito è infinita, mentre il nostro linguaggio modale contiene solo formule finite. Procediamo dunque in modo diverso. Definiamo una nuova relazione di accessibilità per la conoscenza comune come la chiusura riflessiva e transitiva dell'unione delle relazioni di accessibilità degli agenti del gruppo, ovvero:
Data una relazione , la sua chiusura riflessiva e transitiva
dove:
sse
per , abbiamo che sse esiste tale che e
In termini topologici, rappresenta la relazione cammino di lunghezza e è la relazione cammino di lunghezza arbitraria sul grafo che contiene l'unione delle relazioni degli agenti nel gruppo , ovvero un mondo è accessibile da un mondo attraverso se esiste un cammino - una sequenza di nodi uniti da archi - di lunghezza finita (possibilmente nulla) da a sul grafo formato dalle relazioni degli agenti nel gruppo .
La semantica dell'operatore è quindi:
sse per ogni tale che
Nell'esempio di sopra, vale che dato che è raggiungibile da attraverso un cammino di lunghezza 2 che passa prima per un arco di e poi un arco di ; inoltre in non vale . In altri termini, .
E' facile mostrare che la seguente formula, che caratterizza la gerarchia tra le conoscenze di gruppo, è valida in tutti i modelli per ogni agente e formula :
Finora la formalizzazione del ragionamento è stata definita in base alla nozione di verità: significa che è vera in tutti i modelli di .
In questa sezione, discutiamo una forma di ragionamento in cui una conclusione è inferita puramente sulla base della sua forma sintattica. Sebbene esistano diversi modi per farlo, nella logica epistemica il modo più diffuso per definire l'inferenza deduttiva è la definizione di un sistema di assiomi alla Hilbert. Tali sistemi forniscono una nozione molto semplice di prova formale. Alcune formule sono valide a priori solo perché hanno una certa forma sintattica. Questi sono gli assiomi del sistema. Le regole del sistema dicono che si può concludere che una formula è un valida perché altre formule sono valide.
Cominciamo col definire un sistema assiomatico di base chiamato K su un linguaggio modale con .
Assioma 1. Tutte le istanze di sostituzione delle tautologie proposizionali
Assioma K. per ogni
Regola MP (modus ponens). Da e deriva
Regola Nec (regola della necessità). Da deriva per ogni
Una prova formale (detta anche dimostrazione o derivazione) è un elenco di formule, dove ogni formula è un assioma del sistema o può essere ottenuta applicando una regola di inferenza del sistema alle formule che si trovano prima nell'elenco. Una prova di è una derivazione la cui ultima formula è . Se esiste una prova di nel sistema di assiomi K diremo che è un teorema di K e scriveremo .
La seguente figura mostra un esempio di prova in K per il seguente teorema:
Si noti che la tautologia al passo 9 è della forma: . Questo teorema può essere usato, assieme agli assiomi e alle regole del sistema logico, per dimostrarne altri. Osserviamo che questo teorema è anche una formula valida nella classe di tutti i modelli di Kripke. Infatti, la quantificazione universale distribuisce rispetto alla congiunzione : se in ogni mondo accessibile valgono entrambe e , allora in ogni mondo accessibile vale e inoltre in ogni mondo accessibile vale . Quindi possiamo anche scrivere:
Questa corrispondenza tra sintassi e semantica, ovvero tra derivabilità (mediante una prova, o proof-theoretic) e validità (su una classe di modelli, o model-theoretic), è una delle proprietà fondamentali di un sistema logico. In particolare, se è un linguaggio, una classe di modelli, e X un sistema di assiomi, diremo che:
X è corretto (sound in Inglese) rispetto a e se ogni teorema in X è una formula valida in , ovvero implica ;
X è completo (complete in Inglese) rispetto a e se ogni formula valida in è un teorema in X, ovvero implica .
Possiamo estendere il sistema logico K con altri assiomi per la conoscenza e la credenza, in particolare:
T: (riflessività)
D: (serialità)
B: (simmetria)
4: (transitività)
5: (proprietà Euclidea)
Ad esempio, indicheremo con KT il sistema logico che estende K con T e KT5 il sistema logico che estende K con T e 5.
Fissato il linguaggio della logica epistemica con vale che:
K è corretto e completo rispetto a (qualsiasi modello)
KT è corretto e completo rispetto a (modelli riflessivi)
KD è corretto e completo rispetto a (modelli seriali)
KB è corretto e completo rispetto a (modelli simmetrici)
K4 è corretto e completo rispetto a (modelli transitivi)
K5 è corretto e completo rispetto a (modelli Euclidei)
Questi risultati si estendono ad ogni combinazione di assiomi, ad esempio il sistema S5, ovvero KT5, è corretto e completo rispetto ai modelli con relazione di equivalenza .
La dimostrazione della correttezza è semplice: basta dimostrare che gli assiomi del sistema logico sono validi e poi per induzione che il processo di dimostrazione che usa le regole logiche preserva la validità. Dimostrare la completezza è un po' più difficile. Esistono diversi approcci, ma quello comune consiste nel dimostrare che se una formula non è dimostrabile, allora esiste un modello in cui è falsa. Esiste un modello speciale, chiamato modello canonico, che lo dimostra simultaneamente per tutte le formule.
Possiamo anche definire assiomi per la conoscenza di gruppo, ovvero per i due operatori (conoscenza comune) e (conoscenza distribuita) per cui abbiamo dovuto introdurre nuove relazioni di accessibilità.
Per quanto riguarda la conoscenza distribuita basta introdurre come minimo un assioma che afferma che la conoscenza dei singoli agenti è conoscenza distribuita: per ogni . Altri assiomi, ad esempio quello della riflessività, possono essere introdotti per caratterizzare ulteriormente la relazione di accessibilità.
Per la conoscenza comune, occorre aggiungere un assioma e una regola:
Assioma Fix:
Regola Ind: Da segue
L'assioma del punto fisso Fix dice che la conoscenza comune può essere vista come il punto fisso di un'equazione: la conoscenza comune di è valida se tutti sanno sia che è valida sia che è, ricorsivamente, una conoscenza comune.
Ind è chiamata regola di induzione e può essere utilizzata per derivare la conoscenza comune induttivamente. Se è vero che è "evidente", nel senso che se è vera, allora tutti la conoscono (ad esempio perché la scriviamo in un posto dove tutti la possono leggere), allora possiamo dimostrare per induzione che se è vera, allora lo è anche per tutti i , ma questo significa che è vera. Sebbene la conoscenza comune sia stata definita come un operatore infinito, un po' sorprendentemente questi assiomi e regole finite la caratterizzano completamente.
Dato un linguaggio e una classe di modelli , possiamo indagare almeno i seguenti problemi:
Soddisfacibilità: Data una formula , verificare se esiste un modello e un mondo del modello tale che
Validità: Data una formula , verificare se per tutti i modelli e per ogni mondo del modello vale che
Verifica di modello (model checking): Data una formula , un modello e un mondo del modello , verificare se
Il campo della complessità computazionale si occupa della questione della quantità di risorse necessarie per risolvere un problema specifico. Le risorse di maggiore interesse sono il tempo di calcolo e lo spazio di memoria. La complessità computazionale pone quindi domande del tipo: se il mio input aumentasse di dimensione, quanto spazio e tempo in più sarebbero necessari per calcolare la risposta? Formulare la domanda in questo modo presuppone già che il problema in questione possa essere risolto in tempo finito con un algoritmo, cioè che il problema sia decidibile (si noti che esistono problemi indecidibili). Fortunatamente, questo è il caso dei problemi elencati sopra.
Per ragionare sulla complessità di un algoritmo, distinguiamo varie classi di complessità. Se un algoritmo deterministico può risolvere un problema in un tempo polinomiale rispetto alla dimensione dell'input, si dice che il problema è in P. E' possibile mostrare che il problema del model checking per la logica modale epistemica (con molti agenti) è polinomiale.
La classe NP è la classe dei problemi risolvibili da un algoritmo non deterministico in tempo polinomiale. Un algoritmo non deterministico è in un certo senso molto più potente di uno deterministico, perché può indagare in parallelo una pluralità di possibili scelte. Se immaginiamo queste scelte rappresentate da una struttura ad albero, un algoritmo deterministico deve percorrere una dopo l'altro, ovvero sequenzialmente, i cammini di scelta, mentre un algoritmo non deterministico li elabora in modo parallelo.
La soddisfacibilità della logica proposizionale è un esempio di problema in NP: un algoritmo non deterministico di soddisfacibilità prima sceglie una tra le tante assegnazioni di verità per le proposizioni primitive e poi verifica che la formula sia effettivamente vera sotto questa assegnazione di verità.
Un problema che è difficile almeno come qualsiasi problema in NP è detto NP-hard. Un problema è NP-completo se è sia in NP che NP-hard; è noto che il problema della soddisfacibilità per la logica proposizionale è NP-completo. Queste definizioni si generalizzano a tutte le classi di complessità.
Nessuno ha ancora dimostrato se P = NP o meno. La congettura corrente è che P sia un sottoinsieme stretto di NP (si noti infatti che ogni problema polinomiale in modo deterministico è anche polinomiale in maniera non deterministica). I problemi NP-completi sono dunque considerati problemi difficili da risolvere, ovvero con complessità più che polinomiale e tipicamente utilizzano un tempo esponenziale rispetto alla dimensione dell'input.
Infine, PSPACE è la classe dei problemi risolvibili usando spazio polinomiale rispetto alla dimensione dell'input e EXPTIME è la classe dei problemi risolvibili in un tempo esponenziale rispetto alla dimensione dell'input. Si sa che:
P ⊆ NP ⊆ PSPACE ⊆ EXPTIME
Abbiamo che:
Il problema della soddisfacibilità per le logiche della conoscenza e della credenza per un solo agente, e , è esattamente difficile come il problema della soddisfacibilità per la logica proposizionale, ovvero NP-completo;
Il caso generale multi-agente (senza conoscenza comune) è PSPACE-completo;
Il caso generale multi-agente con conoscenza comune è EXPTIME-completo.
La complessità del problema della validità è equivalente a quella della soddisfacibilità.
Mostriamo infine che il problema del model checking per la logica epistemica ha complessità polinomiale, in particolare lineare nel prodotto della lunghezza della formula da verificare e la dimensione del modello. La seguente procedura implementa un model checker per la logica epistemica multi-agente. L'idea è di etichettare ogni mondo del modello con le sotto-formule della formula da verificare che sono vere in quel mondo, partendo dalle variabili proposizionali e incrementando progressivamente la dimensione della sotto-formula fino ad arrivare alla formula da verificare.
Sia il numero di mondi del modello, il numero di archi del modello e la lunghezza della formula , ovvero il numero di operatori più il numero di proposizioni presenti della formula. Si noti che il numero di sottoformule in è . Quindi, il ciclo principale della procedura viene eseguito per volte. I casi booleani costano e il caso modale costa . Pertanto, la complessità del model checking risulta nel caso peggiore. La complessità è dunque lineare nel prodotto della lunghezza della formula e della dimensione del modello.
L'approccio logico ha dei limiti pratici e concettuali. Come abbiamo visto, ragionare con la logica epistemica è un problema computazionalmente difficile, in particolare se deve essere affrontato in tempo reale. Solo la verifica di modello, infatti, è un problema trattabile computazionalmente. Viceversa, verificare se un formula è un teorema (è valida) ha complessità esponenziale nella lunghezza della formula. Se la formula è moderatamente lunga, o peggio se è dinamica e cresce in lunghezza nel tempo, la complessità del ragionamento logico diventa proibitiva.
Da un punto di vista concettuale, occorre tenere presente che gli assiomi della conoscenza sono idealizzazioni e, in effetti, i logici non sostengono che siano validi per tutte le possibili interpretazioni della conoscenza. Vediamo alcune criticità.
È umano affermare un giorno di conoscere un certo fatto, per poi ritrovarsi ad ammettere il giorno dopo di essersi sbagliati, il che mette in crisi l'assioma T - - che afferma che se un agente conosce un fatto allora questo è vero. Ad esempio, alcuni teoremi matematici sono stati creduti veri per un lasso di tempo, salvo poi riscontrare che non lo erano, ovvero trovare un errore nella dimostrazione. Allo stesso modo, alcune teorie scientifiche sono state invalidate col tempo.
Anche l'introspezione positiva è stata considerata problematica. L'assioma 4 - - afferma che se un agente sa un fatto allora sa di saperlo. Ma, ad esempio, si consideri un allievo a cui viene posta una domanda di cui non conosce la risposta. Può darsi che, ponendo altre domande, l'allievo sia in grado di rispondere prima o poi alla domanda originale. A quanto pare, l'allievo conosceva la risposta, ma non era consapevole di saperlo, quindi non sapeva di conoscere la risposta (si parla di memoria inconsapevole).
L'assioma più discutibile è quello dell'introspezione negativa, ovvero 5 - - che afferma che se non conosco un fatto, so di non saperlo. È possibile che un lettore di questo corso non sappia (ancora) cos'è una rete neurale ricorrente, perché non l'ha mai sentita nominare, ma prima di leggere questa frase sapeva di non saperlo?
L'effetto Dunning-Kruger è un fenomeno psicologico secondo cui le persone inesperte o poco competenti in un determinato ambito tendono a sovrastimare notevolmente le proprie abilità e conoscenze. Al contrario, le persone esperte o molto competenti tendono a sottostimare la propria competenza. Ad esempio, una persona sta iniziando a investire in borsa e pensa erroneamente di conoscere tutti i concetti necessari, ma in realtà ignora fondamentali aspetti tecnici. In generale, chi ha poche informazioni su temi complessi tende spesso ad avere opinioni più radicali e a considerarle più affidabili rispetto a chi è molto informato e consapevole della complessità.
Questi esempi suggeriscono che una ragione dell'ignoranza può essere la mancanza di consapevolezza.
Si potrebbe sostenere che gli assiomi "problematici" per la conoscenza dovrebbero essere semplicemente omessi, o forse indeboliti, per ottenere un sistema appropriato per la conoscenza. Ma che dire dei principi fondamentali della logica modale, l'assioma K e la regola di inferenza Nec? Quanto sono accettabili per la conoscenza? Come ci si potrebbe aspettare, non dobbiamo dare nulla per scontato.
L'assioma K di distribuzione della conoscenza - - presuppone ragionatori perfetti, in grado di inferire le conseguenze logiche della loro conoscenza. Può accadere di conoscere dei fatti ma di non averli messi in relazione, e quindi di non aver dedotto una conseguenza. Per esempio, questo assioma implica che un agente sa che giorno della settimana sarà il 26 luglio 5018, assumendo che l'agente conosca la data e il giorno della settimana di oggi e conosca le regole del calendario.
La regola Nec della necessità afferma che se è valida allora lo è anche . La necessità presuppone che gli agenti possano inferire tutti i teoremi del sistema logico. Poiché dire se una formula è valida è computazionalmente difficile, questo non sembra così plausibile. Questa idealizzazione è spesso riassunta come onniscienza logica: il nostro agente conoscerebbe tutto ciò che è logicamente deducibile.
In sostanza, il problema è che agenti finiti, biologici o artificiali, sono vincolati da limiti alle loro capacità cognitive e di ragionamento. L'approccio della logica epistemica e doxastica sembra invece implicare abilità sovrumane come la conoscenza di tutte le tautologie. Pertanto, la preoccupazione è che queste logiche siano semplicemente inadatte a catturare la conoscenza e la credenza reali, così come queste nozioni figurano nella vita umana ordinaria.
Curiosamente, il fatto che, nella realtà, gli agenti non siano ragionatori ideali, né logicamente onniscienti, è talvolta una caratteristica sfruttata dai sistemi computazionali. La crittografia, ad esempio, è utile perché gli intrusi artificiali o umani, a causa delle loro capacità limitate, non sono in grado di calcolare i fattori primi di un grande numero in un tempo ragionevole.
Nonostante questi problemi, le proprietà della logica della conoscenza si sono dimostrate essere un'utile idealizzazione della conoscenza per molte applicazioni nel campo dei sistemi distribuiti e dell'economia.
Una delle regole classiche del ragionamento, la storia del risale all'antichità: il primo a descriverla esplicitamente fu Teofrasto (371 circa – 287 circa a.C.).
e hanno prodotto una ragionevole dimostrazione del primo punto e trovato l'errore del ragionamento del secondo. Gemini ha pensato più a lungo.
ha prodotto una elegante dimostrazione per assurdo del primo punto ma non ha risolto il secondo punto, sconfessando di fatto la dimostrazione data e affermando che l'assioma di introspezione negativa non caratterizza i modelli Euclidei (sbagliando dunque).
ha trovato una dimostrazione per il primo punto (pensando molto a lungo) ma non ha saputo controbattere il controesempio del secondo punto. A questo punto, in modo impreciso, ha sostenuto che in logica epistemica i modelli sono euclidei e riflessivi (ovvero relazioni di equivalenza), e in tal caso l'assioma è valido. Non è falso, ma impreciso, dato che il mio modello non presuppone la riflessività.
ha pensato molto a lungo (11 minuti) e ha fornito una prova elegante del primo punto. Al secondo punto ha risposto: The server is busy. Please try again later.