Temat: Markov decision process

Skocz do pozycji: 1.

Tytuł:: Analiza algorytmów Deep Q-learning oraz Proximal Policy Optimization.
Analysis of Deep Q-learning and Proximal Policy Optimization algorithms
Autorzy:: Dyczek, Jakub
Słowa kluczowe:: Uczenie przez wzmacnianie, Deep Q-learning, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova
Reinforcement learning, Deep Q-learning, Proximal Policy Optimization, machine learning, Markov decision process; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Skocz do pozycji: 2.

Tytuł:: Wykorzystanie uczenia maszynowego w programowaniu zachowania stada drapieżników
Use of machine learning in predator flock behaviour programming
Autorzy:: Tyrała, Maciej
Słowa kluczowe:: artificial intelligence, python, unity, reinforcement learning, Markov decision process, temporal difference, deep Q-Learning, neural networks, approximation methods
sztuczna inteligencja, python, unity, uczenie przez wzmacnianie, proces decyzyjny Markova, różnica chwilowa, deep Q-Learning, sieci neuronowe, metody aproksymujące; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Skocz do pozycji: 3.

Tytuł:: Uczenie maszynowe z językiem Python
Machine learning with Python
Autorzy:: Jancarz, Mateusz
Słowa kluczowe:: sztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowa
artificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision process; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Skocz do pozycji: 4.

Tytuł:: Skuteczne uczenie ze wzmocnieniem dla pojazdów autonomicznych w ruchu mieszanym
Effective reinforcement learning strategies for Connected Autonomous Vehicles (CAVs) in mixed-traffic environment
Autorzy:: Górski, Kamil
Słowa kluczowe:: autonomiczne pojazdy, uczenie przez wzmacnianie, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova, symulacje ruchu drogowego, FLOW
autonomous vehicles, reinforcement learning, Proximal Policy Optimization, machine learning, simulation of urban mobility, Markov decision process, simulation of urban mobility, FLOW; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Skocz do pozycji: 5.

Tytuł:: Long-term portfolio optimization with transaction costs: applications of reinforcement learning for risk-sensitive criterion.
Długookresowa optymalizacja portfelowa z kosztami transakcyjnymi: zastosowania uczenia ze wzmocnieniem dla kryterium wrażliwego na ryzyko.
Autorzy:: Chmura, Michał
Słowa kluczowe:: Portfolio optimization, Transaction costs, Risk, Reinforcement learning, Risk-sensitive criterion, Bellman operator, Markov decision process, Entropic utility function, Investment strategies, Computational efficiency
Optymalizacja portfela, Koszty transakcyjne, Ryzyko, Uczenie ze wzmocnieniem, Kryterium wrażliwe na ryzyko, Operator Bellmana, Proces decyzyjny Markowa, Entropiczna funkcja użyteczności, Strategie inwestycyjne, Efektywność obliczeniowa; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Skocz do pozycji: 6.

Tytuł:: Efficiency of counting cards strategy in multi-deck blackjack game
Skuteczność strategii liczenia kart w grze black jack przy użyciu wielu talii kart.
Autorzy:: Drozd, Bartłomiej
Słowa kluczowe:: blackjack counting cards markovian decision process markov chain caino game basic strategy gambling
blackjack liczenie kart decyzyjny proces markowa gra kasynowa strategia podstawowa hazard; Pokaż więcej
Dostawca treści:: Repozytorium Uniwersytetu Jagiellońskiego

Inne

Szczegóły

Informacja