Если у вас есть априори Знание окружающей среды, но несовершенная способность ощущать ваше местоположение в окружающей среде (и, вероятно, несовершенные действия), тогда то, что вы описываете, может быть частично наблюдаемым процессом принятия решений Маркова (POMDP.) Ваш четырехпутный датчик прекрасно вписывается в эту идею.
Если у вас даже нет предварительных знаний об окружающей среде, вам необходимо увеличить понятие POMDP элементами исследования или машинного обучения.
Обратите внимание, что POMDP ориентированы на сценарии с «наградами», и что, хотя POMDP довольно хорошо понятны, эффективные решения по -прежнему являются темой исследований. Как и гибриды ML/POMDP.