Matteo Papini

Cited by

	All	Since 2019
Citations	741	722
h-index	12	12
i10-index	14	14

200

100

150

201720182019202020212022202320244 13 30 97 161 181 193 60

Public access

View all

10 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Marcello RestelliAssociate Professor, Politecnico di MilanoVerified email at polimi.it
Alberto Maria MetelliAssistant Professor, Politecnico di MilanoVerified email at polimi.it
Matteo PirottaResearch Scientist, Meta (FAIR)Verified email at fb.com
Andrea TirinzoniMetaVerified email at fb.com
Alessandro LazaricResearch Scientist, Facebook Artificial Intelligence ResearchVerified email at inria.fr
Gergely NeuArtificial Intelligence and Machine Learning group, Universitat Pompeu FabraVerified email at upf.edu
Giuseppe CanonacoJP Morgan AI ResearchVerified email at jpmorgan.com
Damiano BinaghiArtificialyVerified email at artificialy.com
Pierluca D'OroMila & MetaVerified email at mila.quebec
Francesco FaccioThe Swiss AI Lab IDSIA / USI & SUPSI, KAUST AI InitiativeVerified email at idsia.ch
Mario BerahaDepartment of Economics and Statistics, University of TorinoVerified email at polimi.it
Lorenzo BisiAI Specialist, ML cubeVerified email at polimi.it
Edoardo Vittori, PhDIntesa SanpaoloVerified email at polimi.it
Luca SabbioniPolitecnico di MilanoVerified email at polimi.it
Nico MontaliWaymo ResearchVerified email at google.com
Lorenzo LupoLaboratoire d'Informatique de GrenobleVerified email at univ-grenoble-alpes.fr
Julia OlkhovskayaTU DelftVerified email at tudelft.nl
Ludovic SchwartzPhD Student at UPF BarcelonaVerified email at upf.edu
Aldo PacchianoBroad Institute of MIT and HarvardVerified email at broadinstitute.org
Ahmed TouatiMeta AIVerified email at umontreal.ca

Matteo Papini

Politecnico di Milano

Verified email at polimi.it - Homepage

Reinforcement Learning Machine Learning Artificial Intelligence


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Stochastic variance-reduced policy gradient M Papini, D Binaghi, G Canonaco, M Pirotta, M Restelli Proceedings of the 35th International Conference on Machine Learning 80 …, 2018	178	2018
Policy optimization via importance sampling AM Metelli, M Papini, F Faccio, M Restelli Advances in Neural Information Processing Systems 31, 2018	103	2018
Feature selection via mutual information: New theoretical insights M Beraha, AM Metelli, M Papini, A Tirinzoni, M Restelli 2019 international joint conference on neural networks (IJCNN), 1-9, 2019	81	2019
Risk-averse trust region optimization for reward-volatility reduction L Bisi, L Sabbioni, E Vittori, M Papini, M Restelli arXiv preprint arXiv:1912.03193, 2019	62	2019
Importance sampling techniques for policy optimization AM Metelli, M Papini, N Montali, M Restelli Journal of Machine Learning Research 21 (141), 1-75, 2020	52	2020
Adaptive batch size for safe policy gradients M Papini, M Pirotta, M Restelli Advances in neural information processing systems 30, 2017	47	2017
Gradient-aware model-based policy search P D'Oro, AM Metelli, A Tirinzoni, M Papini, M Restelli Proceedings of the AAAI Conference on Artificial Intelligence 34 (04), 3801-3808, 2020	42	2020
Optimistic policy optimization via multiple importance sampling M Papini, AM Metelli, L Lupo, M Restelli International Conference on Machine Learning, 4989-4999, 2019	40	2019
Smoothing policies and safe policy gradients M Papini, M Pirotta, M Restelli Machine Learning 111 (11), 4081-4137, 2022	31	2022
Leveraging good representations in linear contextual bandits M Papini, A Tirinzoni, M Restelli, A Lazaric, M Pirotta International Conference on Machine Learning, 8371-8380, 2021	28	2021
Reinforcement learning in linear mdps: Constant regret and representation selection M Papini, A Tirinzoni, A Pacchiano, M Restelli, A Lazaric, M Pirotta Advances in Neural Information Processing Systems 34, 16371-16383, 2021	20	2021
Balancing learning speed and stability in policy gradient via adaptive exploration M Papini, A Battistello, M Restelli International conference on artificial intelligence and statistics, 1188-1199, 2020	14	2020
Policy optimization as online learning with mediator feedback AM Metelli, M Papini, P D'Oro, M Restelli Proceedings of the AAAI Conference on Artificial Intelligence 35 (10), 8958-8966, 2021	12	2021
Lifting the information ratio: An information-theoretic analysis of thompson sampling for contextual bandits G Neu, I Olkhovskaia, M Papini, L Schwartz Advances in Neural Information Processing Systems 35, 9486-9498, 2022	11	2022
Offline primal-dual reinforcement learning for linear mdps G Gabbianelli, G Neu, M Papini, NM Okolo International Conference on Artificial Intelligence and Statistics, 3169-3177, 2024	4	2024
Scalable representation learning in linear contextual bandits with constant regret guarantees A Tirinzoni, M Papini, A Touati, A Lazaric, M Pirotta Advances in Neural Information Processing Systems 35, 2307-2319, 2022	4	2022
Online learning with off-policy feedback G Gabbianelli, G Neu, M Papini International Conference on Algorithmic Learning Theory, 620-641, 2023	3	2023
Safe policy optimization M Papini Italy, 2021	3	2021
Automated Reasoning for Reinforcement Learning Agents in Structured Environments. A Gianola, M Montali, M Papini OVERLAY@ GandALF, 43-48, 2021	3	2021
Importance-weighted offline learning done right G Gabbianelli, G Neu, M Papini International Conference on Algorithmic Learning Theory, 614-634, 2024	1	2024

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors