co to znamená správně přemýšlet?
co když věci nejsou černobílé?
jak správným rozhodováním maximalizovat užitek (zisk)?
jak se stroje můžou samy udržovat při (správném) chodu?
psychologie – jak lidé a zvířata myslí a jednají
lingvistika – jak jazyk souvisí s myšlením
neurověda – jak mozek zpracovává informace?
před zrozením oboru umělé inteligence
zrod AI
zlatá éra, první léto
první zima
druhé léto
expertní systémy – zabývají se konkrétními obory lidské činnosti
druhá zima
třetí léto
co bude dál?
AI je o kontrukci racionálních agentů
racionální agent by měl zvolit akci, o které se očekává, že maximalizuje užitek
záleží na prostředí, v němž agent operuje
agent – vnímá prostředí pomocí senzorů, aktuátory mu umožňují jednat
reprezentace stavů
problem solving agent
Lloydova patnáctka
ne všechny stavy jsou dosažitelné – zachovává se parita permutace
budeme potřebovat abstrakci prostředí
dobře definovaný problém
(state, action) -> state
graph-search vs. tree-search
algoritmy neinformovaného prohledávání
extenze BFS pro funkci určující cenu kroku (tedy cenu hrany)
best-first search
co chceme od heuristiky u algoritmu A*
když heuristika dává větší hodnoty než , tak se říká, že dominuje
pokud je přípustná a pokud se nepočítá výrazně déle než , tak je zjevně lepší než
backtracking vs. DFS
problém rozmístění královen na šachovnici, aby se neohrožovaly
forward checking v sudoku
CSP
CSP můžeme řešit tree-search backtrackingem
arc consistency (hranová konzistence)
jak zkombinovat AC a backtracking
silnější konzistence … -konzistence
globální podmínky
v jakém pořadí brát proměnné a hodnoty v backtrackingu
constraint programming je deklarativní přístup k řešení problémů
často lze prohodit proměnné a hodnoty (hodnoty se stávají proměnnými, proměnné hodnotami) → vznikne duální model
znalostní agenti
plánování…
potřebujeme heuristiku, aby naváděla prohledávání
další formy plánování
shrnutí – automatizované plánování
zdroje nejistoty
bayesovská síť je orientovaný acyklický graf, kde vrcholy odpovídají náhodným proměnným
konstrukce bayesovské sítě
z bayesovských sítí můžeme provádět inferenci – odvozovat pravděpodobnost proměnných pomocí pravděpodobností skrytých proměnných
formální model
základní inferenční úlohy
skryté proměnné popisují stavy světa
skryté Markovovy modely
markovovský rozhodovací proces (MDP)
částečně pozorovatelný markovský rozhodovací proces (POMDP)
více agentů
někdy ve hrách hraje roli náhoda (tzv. stochastické hry)
hry na jeden tah
k čemu používáme teorii her
jak je to s hrami dnes?
učení vs. přímé programování chování
zpětná vazba, z nichž se agenti učí
rozhodovací strom
logická formulace učení
lineární regrese
zpětné šíření chyby
parametrický model
neparametrický model
support-vector machine
někdy se neučíme úplně od nuly, už máme částečnou znalost, snažíme se naučit něco navrch – statistické učení
bayesovské sítě, parameter learning (učení se parametrů)
reinforcement learning (zpětnovazební učení)