Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Wyszukujesz frazę "Markov decision process" wg kryterium: Temat


Wyświetlanie 1-6 z 6
Tytuł:
Analiza algorytmów Deep Q-learning oraz Proximal Policy Optimization.
Analysis of Deep Q-learning and Proximal Policy Optimization algorithms
Autorzy:
Dyczek, Jakub
Słowa kluczowe:
Uczenie przez wzmacnianie, Deep Q-learning, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova
Reinforcement learning, Deep Q-learning, Proximal Policy Optimization, machine learning, Markov decision process
Pokaż więcej
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
Tytuł:
Wykorzystanie uczenia maszynowego w programowaniu zachowania stada drapieżników
Use of machine learning in predator flock behaviour programming
Autorzy:
Tyrała, Maciej
Słowa kluczowe:
artificial intelligence, python, unity, reinforcement learning, Markov decision process, temporal difference, deep Q-Learning, neural networks, approximation methods
sztuczna inteligencja, python, unity, uczenie przez wzmacnianie, proces decyzyjny Markova, różnica chwilowa, deep Q-Learning, sieci neuronowe, metody aproksymujące
Pokaż więcej
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
Tytuł:
Skuteczne uczenie ze wzmocnieniem dla pojazdów autonomicznych w ruchu mieszanym
Effective reinforcement learning strategies for Connected Autonomous Vehicles (CAVs) in mixed-traffic environment
Autorzy:
Górski, Kamil
Słowa kluczowe:
autonomiczne pojazdy, uczenie przez wzmacnianie, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova, symulacje ruchu drogowego, FLOW
autonomous vehicles, reinforcement learning, Proximal Policy Optimization, machine learning, simulation of urban mobility, Markov decision process, simulation of urban mobility, FLOW
Pokaż więcej
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
Tytuł:
Long-term portfolio optimization with transaction costs: applications of reinforcement learning for risk-sensitive criterion.
Długookresowa optymalizacja portfelowa z kosztami transakcyjnymi: zastosowania uczenia ze wzmocnieniem dla kryterium wrażliwego na ryzyko.
Autorzy:
Chmura, Michał
Słowa kluczowe:
Portfolio optimization, Transaction costs, Risk, Reinforcement learning, Risk-sensitive criterion, Bellman operator, Markov decision process, Entropic utility function, Investment strategies, Computational efficiency
Optymalizacja portfela, Koszty transakcyjne, Ryzyko, Uczenie ze wzmocnieniem, Kryterium wrażliwe na ryzyko, Operator Bellmana, Proces decyzyjny Markowa, Entropiczna funkcja użyteczności, Strategie inwestycyjne, Efektywność obliczeniowa
Pokaż więcej
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
Tytuł:
Efficiency of counting cards strategy in multi-deck blackjack game
Skuteczność strategii liczenia kart w grze black jack przy użyciu wielu talii kart.
Autorzy:
Drozd, Bartłomiej
Słowa kluczowe:
blackjack counting cards markovian decision process markov chain caino game basic strategy gambling
blackjack liczenie kart decyzyjny proces markowa gra kasynowa strategia podstawowa hazard
Pokaż więcej
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
    Wyświetlanie 1-6 z 6

    Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies