Tengyang Xie

인용

	전체	2019년 이후
서지정보	1137	1136
h-index	12	12
i10-index	12	12

440

220

110

330

20192020202120222023202410 57 157 246 430 234

공개 액세스

모두 보기

자료 8개

자료 0개

공개

비공개

재정 지원 요구사항 기준

공동 저자

Nan JiangAssistant Professor of Computer Science, UIUCillinois.edu의 이메일 확인됨
Ching-An ChengMicrosoft Researchmicrosoft.com의 이메일 확인됨
Yu BaiResearch Scientist, Salesforce Researchsalesforce.com의 이메일 확인됨
Paul MineiroMicrosoftmineiro.com의 이메일 확인됨
Alekh AgarwalGooglegoogle.com의 이메일 확인됨
Yu-Xiang WangAssociate Professor of Computer Science, UC Santa Barbaracs.ucsb.edu의 이메일 확인됨
Yifei MaApplied Scientist, Amazon.Comamazon.com의 이메일 확인됨
Dylan J. FosterPrincipal Researcher, Microsoft Researchmicrosoft.com의 이메일 확인됨
Caiming XiongSalesforce Researchsalesforce.com의 이메일 확인됨
Huan WangSalesforce Researchyale.edu의 이메일 확인됨
Wen SunAssistant Professor, Cornell Universitycornell.edu의 이메일 확인됨
Nathan KallusCornell Universitycornell.edu의 이메일 확인됨
Masatoshi UeharaGenentechgene.com의 이메일 확인됨
Masaaki ImaizumiThe University of Tokyog.ecc.u-tokyo.ac.jp의 이메일 확인됨
Philip AmortilaUniversity of Illinois, Urbana-Champaignillinois.edu의 이메일 확인됨
Mohak BhardwajUniversity of Washingtoncs.washington.edu의 이메일 확인됨
John LangfordMicrosoft Research New Yorkhunch.net의 이메일 확인됨
Sham M KakadeHarvard Universityseas.harvard.edu의 이메일 확인됨
Yinlam ChowResearch Scientist, Google Researchgoogle.com의 이메일 확인됨
Bo LiuEx-Associate Professor, AAAI SM, IEEE SMcs.umass.edu의 이메일 확인됨

팔로우

Tengyang Xie

University of Wisconsin-Madison, Microsoft Research

cs.wisc.edu의 이메일 확인됨 - 홈페이지

Reinforcement Learning Machine Learning Artificial Intelligence


제목 서지정보순 정렬 연도순 정렬 제목순 정렬	인용 인용	연도
Bellman-consistent pessimism for offline reinforcement learning T Xie, CA Cheng, N Jiang, P Mineiro, A Agarwal Advances in neural information processing systems 34, 6683-6694, 2021	229	2021
Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance Sampling T Xie, Y Ma, YX Wang Advances in Neural Information Processing Systems, 9665-9675, 2019	167	2019
Policy finetuning: Bridging sample-efficient offline and online reinforcement learning T Xie, N Jiang, H Wang, C Xiong, Y Bai Advances in neural information processing systems 34, 27395-27407, 2021	141	2021
Batch value-function approximation with only realizability T Xie, N Jiang International Conference on Machine Learning, 11404-11413, 2021	108	2021
Adversarially trained actor critic for offline reinforcement learning CA Cheng, T Xie, N Jiang, A Agarwal International Conference on Machine Learning, 3852-3878, 2022	99	2022
Provably efficient q-learning with low switching cost Y Bai, T Xie, N Jiang, YX Wang Advances in Neural Information Processing Systems, 8004-8013, 2019	98	2019
Q* Approximation Schemes for Batch Reinforcement Learning: A Theoretical Comparison T Xie, N Jiang Proceedings of the 36th Conference on Uncertainty in Artificial Intelligence …, 2020	94	2020
Finite sample analysis of minimax offline reinforcement learning: Completeness, fast rates and first-order efficiency M Uehara, M Imaizumi, N Jiang, N Kallus, W Sun, T Xie arXiv preprint arXiv:2102.02981, 2021	60	2021
The role of coverage in online reinforcement learning T Xie, DJ Foster, Y Bai, N Jiang, SM Kakade arXiv preprint arXiv:2210.04157, 2022	43	2022
A Block Coordinate Ascent Algorithm for Mean-Variance Optimization T Xie, B Liu, Y Xu, M Ghavamzadeh, Y Chow, D Lyu, D Yoon Advances in Neural Information Processing Systems, 1073-1083, 2018	35	2018
A variant of the wang-foster-kakade lower bound for the discounted setting P Amortila, N Jiang, T Xie arXiv preprint arXiv:2011.01075, 2020	22	2020
Adversarial model for offline reinforcement learning M Bhardwaj, T Xie, B Boots, N Jiang, CA Cheng Advances in Neural Information Processing Systems 36, 2024	14	2024
Armor: A model-based framework for improving arbitrary baseline policies with offline data T Xie, M Bhardwaj, N Jiang, CA Cheng arXiv preprint arXiv:2211.04538, 2022	7	2022
Interaction-Grounded Learning T Xie, J Langford, P Mineiro, I Momennejad International Conference on Machine Learning, 11414-11423, 2021	7	2021
Interaction-grounded learning with action-inclusive feedback T Xie, A Saran, DJ Foster, L Molu, I Momennejad, N Jiang, P Mineiro, ... Advances in Neural Information Processing Systems 35, 12529-12541, 2022	4	2022
Privacy preserving off-policy evaluation T Xie, PS Thomas, G Miklau arXiv preprint arXiv:1902.00174, 2019	4	2019
Marginalized Off-Policy Evaluation for Reinforcement Learning T Xie, YX Wang, Y Ma NeurIPS 2018 Workshop on Causal Learning, 2018	3	2018
Harnessing density ratios for online reinforcement learning P Amortila, DJ Foster, N Jiang, A Sekhari, T Xie arXiv preprint arXiv:2401.09681, 2024	2	2024
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences C Rosset, CA Cheng, A Mitra, M Santacroce, A Awadallah, T Xie arXiv preprint arXiv:2404.03715, 2024		2024
Towards Principled Representation Learning from Videos for Reinforcement Learning D Misra, A Saran, T Xie, A Lamb, J Langford arXiv preprint arXiv:2403.13765, 2024		2024

현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.

학술자료 1–20

연간 인용횟수

중복된 서지정보

병합된 서지정보

공동 저자 추가공동 저자

팔로우

인용

공동 저자