Wenn Sie haben a priori Kenntnis der Umgebung, aber unvollkommene Fähigkeit, Ihren Standort in der Umgebung (und wahrscheinlich unvollkommene Handlungen) zu erfassen, kann das, was Sie beschreiben, ein teilweise beobachtbarer Markov-Entscheidungsprozess (POMDP.) Ihr Vier-Knopf-Sensor passt gut in diese Idee.
Wenn Sie nicht einmal Vorkenntnisse über die Umwelt haben, müssen Sie den POMDP -Begriff mit Elementen des Erforschung oder maschinellen Lernens erweitern.
Beachten Sie, dass POMDPs auf Szenarien mit "Belohnungen" ausgerichtet sind und dass POMDPS zwar ziemlich gut verstanden ist, effiziente Lösungen immer noch ein Thema der Forschung sind. Wie sind ML/POMDP -Hybriden.