import utils

model = utils.student_model()
utils.render(model)


node = "Grade" # try "Intel"
utils.print_cpd(model.get_cpds(node))

+------------+------------------+------------------+------------------+------------------+
| Intel      | Intel(Average)   | Intel(Average)   | Intel(High)      | Intel(High)      |
+------------+------------------+------------------+------------------+------------------+
| Difficulty | Difficulty(Easy) | Difficulty(Hard) | Difficulty(Easy) | Difficulty(Hard) |
+------------+------------------+------------------+------------------+------------------+
| Grade(A)   | 0.3              | 0.05             | 0.9              | 0.5              |
+------------+------------------+------------------+------------------+------------------+
| Grade(B)   | 0.4              | 0.25             | 0.08             | 0.3              |
+------------+------------------+------------------+------------------+------------------+
| Grade(C)   | 0.3              | 0.7              | 0.02             | 0.2              |
+------------+------------------+------------------+------------------+------------------+


from itertools import product

utils.print_cpds(model)
print("---")
print(f"Joint: {len(list(product(*model.states.values())))} values")
print(f"PGM: {sum(cpd.values.size for cpd in model.cpds)} values")

P(Difficulty), 2 values
P(Intel), 2 values
P(Grade|Intel, Difficulty), 12 values
P(Letter|Grade), 6 values
P(SAT|Intel), 4 values
---
Joint: 48 values
PGM: 26 values


from pgmpy.inference import VariableElimination

node = "Grade"

infer = VariableElimination(model)
print(infer.query([node]))

+----------+--------------+
| Grade    |   phi(Grade) |
+==========+==============+
| Grade(A) |       0.3620 |
+----------+--------------+
| Grade(B) |       0.2884 |
+----------+--------------+
| Grade(C) |       0.3496 |
+----------+--------------+


node = "Grade"
evidence = {"SAT": "Good", "Intel": "High"}

map_est = infer.map_query([node], evidence=evidence, show_progress=False)
print(infer.query([node], evidence=evidence))
print(f"MAP estimate: {map_est}")

+----------+--------------+
| Grade    |   phi(Grade) |
+==========+==============+
| Grade(A) |       0.7400 |
+----------+--------------+
| Grade(B) |       0.1680 |
+----------+--------------+
| Grade(C) |       0.0920 |
+----------+--------------+
MAP estimate: {'Grade': 'A'}


nodes = ["Grade"]

utils.render(model)
model.local_independencies(nodes)

(Grade ⟂ SAT | Intel, Difficulty)


cascade = model.copy()
cascade.remove_nodes_from(["Intel", "SAT"])
cascade.latents = {"Difficulty", "Letter"}
utils.render(cascade)
cascade.get_independencies(include_latents=True)

(Letter ⟂ Difficulty | Grade)
(Difficulty ⟂ Letter | Grade)


fork = model.copy()
fork.remove_nodes_from(["Letter", "Difficulty"])
fork.latents = {"Grade", "SAT"}
utils.render(fork)
fork.get_independencies(include_latents=True)

(SAT ⟂ Grade | Intel)
(Grade ⟂ SAT | Intel)


collider = model.copy()
collider.remove_nodes_from(["Letter", "SAT"])
collider.latents = {"Intel", "Difficulty"}
utils.render(collider)
collider.get_independencies(include_latents=True)

(Intel ⟂ Difficulty)
(Difficulty ⟂ Intel)


node = "Host" # try "Prize"

mh_model = utils.monty_hall_model()
utils.print_cpd(mh_model.get_cpds(node))

+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+
| Choice  | Choice(0) | Choice(0) | Choice(0) | Choice(1) | Choice(1) | Choice(1) | Choice(2) | Choice(2) | Choice(2) |
+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+
| Prize   | Prize(0)  | Prize(1)  | Prize(2)  | Prize(0)  | Prize(1)  | Prize(2)  | Prize(0)  | Prize(1)  | Prize(2)  |
+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+
| Host(0) | 0.0       | 0.0       | 0.0       | 0.0       | 0.5       | 1.0       | 0.0       | 1.0       | 0.5       |
+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+
| Host(1) | 0.5       | 0.0       | 1.0       | 0.0       | 0.0       | 0.0       | 1.0       | 0.0       | 0.5       |
+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+
| Host(2) | 0.5       | 1.0       | 0.0       | 1.0       | 0.5       | 0.0       | 0.0       | 0.0       | 0.0       |
+---------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-----------+


mh_infer = VariableElimination(mh_model)
print(mh_infer.query(["Prize"], evidence={"Choice": 0, "Host": 2}))
utils.render(mh_model)

+----------+--------------+
| Prize    |   phi(Prize) |
+==========+==============+
| Prize(0) |       0.3333 |
+----------+--------------+
| Prize(1) |       0.6667 |
+----------+--------------+
| Prize(2) |       0.0000 |
+----------+--------------+


A = {"Difficulty"}
B = {"SAT"}
C = {"Intel"} # try {"Intel", "Letter"}, {"Letter"}, and set()

model.latents = model.nodes - C
active_trail_nodes = model.active_trail_nodes(list(A), observed=C, include_latents=True)
active_trail_nodes = set.union(*active_trail_nodes.values())
dseparated = not bool(active_trail_nodes.intersection(B))
print(f"d-separated: {dseparated}") 
if dseparated:
    print(f"{A} ⟂ {B} | {C}")
utils.render(model)

d-separated: True
{'Difficulty'} ⟂ {'SAT'} | {'Intel'}


node = "Intel" 

ext_model = model.copy()
for tail, head in zip(["Edu", "Country", "Subject"], ["Intel", "Edu", "Difficulty"]):
    ext_model.add_edge(tail, head)
blanket = set(ext_model.get_markov_blanket(node))
print(f"Markov blanket of '{node}': {blanket}")
ext_model.latents = ext_model.nodes - blanket
utils.render(ext_model, grid_unit=3.5)

Markov blanket of 'Intel': {'SAT', 'Edu', 'Difficulty', 'Grade'}


from pgmpy.models import BayesianNetwork

nodes = {"B", "C1", "C2"}
for head in nodes:
    utils.render(BayesianNetwork([(n, head) for n in nodes - {head}], latents=nodes))


node = "A"
markov_model = utils.voting_model()
blanket = set(markov_model.markov_blanket(node))
print(f"Markov blanket of '{node}': {blanket}")
markov_model.latents = markov_model.nodes - blanket
utils.render(markov_model)

Markov blanket of 'A': {'C', 'D'}


markov_model.latents = markov_model.nodes
utils.render(markov_model)
markov_model.latents = {"C", "D"}
utils.render(markov_model)
markov_model.latents = {"A", "B"}
utils.render(markov_model)


clique_index = 0
print(markov_model.factors[clique_index])
print(markov_model.get_partition_function())

+------+------+------------+
| A    | C    |   phi(A,C) |
+======+======+============+
| A(0) | C(0) |     5.0000 |
+------+------+------------+
| A(0) | C(1) |     1.0000 |
+------+------+------------+
| A(1) | C(0) |     1.0000 |
+------+------+------------+
| A(1) | C(1) |    10.0000 |
+------+------+------------+
11327.0


from pgmpy.inference import BeliefPropagation

evidence = {"B": 1} # try {"D": 1} and {"D": 1, "C": 0}

markov_model.latents = markov_model.nodes - set(evidence.keys())
voting_infer = BeliefPropagation(markov_model)
print(voting_infer.query(["A"], evidence=evidence))
utils.render(markov_model)

+------+----------+
| A    |   phi(A) |
+======+==========+
| A(0) |   0.0216 |
+------+----------+
| A(1) |   0.9784 |
+------+----------+


utils.render(BayesianNetwork([("A", "C"), ("B", "C")], latents={"A", "B"}))

Introduction to probabilistic graphical models¶

Bayesian inference¶

Bayesian models¶

Example: Student model¶

Joint distribution¶

Inference¶

Local independence¶

Independence (3 nodes)¶

Independence (3 nodes)¶

Independence (3 nodes)¶

Example: Monty Hall problem ¶

Independence (d-separation)¶

Markov blanket¶

Imperfect map¶

Markov random fields¶

Joint distribution¶

Imperfect map¶

Pros & Cons¶

Introduction to probabilistic graphical models¶

Bayesian inference¶

Bayesian models¶

Example: Student model¶

Joint distribution¶

Inference¶

Local independence¶

Independence (3 nodes)¶

Independence (3 nodes)¶

Independence (3 nodes)¶

Example: Monty Hall problem¶

Independence (d-separation)¶

Markov blanket¶

Imperfect map¶

Markov random fields¶

Joint distribution¶

Imperfect map¶

Pros & Cons¶

Example: Monty Hall problem ¶