Ruiqi Zhang

2022202320248 52 35

공개 액세스

자료 2개

자료 0개

공개

비공개

재정 지원 요구사항 기준

Peter BartlettProfessor, EECS and Statistics, UC Berkeleycs.berkeley.edu의 이메일 확인됨
Spencer FreiUC Davisucdavis.edu의 이메일 확인됨
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton Universityprinceton.edu의 이메일 확인됨
Chengzhuo NiPrinceton Universityprinceton.edu의 이메일 확인됨
Xuezhou ZhangBoston Universitybu.edu의 이메일 확인됨
Xiang JiPrinceton Universityprinceton.edu의 이메일 확인됨
Andrea ZanetteAssistant Professor, Carnegie Mellon Universityandrew.cmu.edu의 이메일 확인됨
Zhaorun ChenPh.D. Student, UChicago CSuchicago.edu의 이메일 확인됨
Zhuokai ZhaoPhD Candidate, University of Chicagouchicago.edu의 이메일 확인됨
Huaxiu YaoAssistant Professor of Computer Science and Data Science, UNC Chapel Hillcs.unc.edu의 이메일 확인됨
Bhiksha RajCarnegie Mellon Universitycs.cmu.edu의 이메일 확인됨
Xiang LiCarnegie Mellon Universityandrew.cmu.edu의 이메일 확인됨
Licong LinPhD student at UC Berkeleyberkeley.edu의 이메일 확인됨
Song MeiAssistant Professor at UC Berkeleyberkeley.edu의 이메일 확인됨
Yu BaiResearch Scientist, Salesforce Researchsalesforce.com의 이메일 확인됨
Jingfeng WuUniversity of California, Berkeleyberkeley.edu의 이메일 확인됨
Yuexiang ZhaiUC Berkeleyberkeley.edu의 이메일 확인됨

Ruiqi Zhang

Ph.D. Student, Statistics Department at University of California, Berkeley

berkeley.edu의 이메일 확인됨 - 홈페이지


제목 서지정보순 정렬 연도순 정렬 제목순 정렬	인용 인용	연도
Trained Transformers Learn Linear Models In-Context R Zhang, S Frei, PL Bartlett Journal of Machine Learning Research 25 (49), 1-55, 2024	68	2024
Off-policy fitted q-evaluation with differentiable function approximators: Z-estimation and inference theory R Zhang, X Zhang, C Ni, M Wang International Conference on Machine Learning, 26713-26749, 2022	18	2022
Optimal estimation of policy gradient via double fitted iteration C Ni, R Zhang, X Ji, X Zhang, M Wang International Conference on Machine Learning, 16724-16783, 2022	4*	2022
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition Z Chen, Z Zhao, Z Zhu, R Zhang, X Li, B Raj, H Yao NAACL 2024, 2024	2	2024
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data R Zhang, A Zanette Advances in Neural Information Processing Systems, 2024, 2023	2	2023
Negative Preference Optimization: From Catastrophic Collapse to Effective Unlearning R Zhang, L Lin, Y Bai, S Mei arXiv preprint arXiv:2404.05868, 2024	1	2024
Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement R Zhang, Y Zhai, A Zanette arXiv preprint arXiv:2402.15703, 2024		2024
In-Context Learning of a Linear Transformer Block: Benefits of the MLP Component and One-Step GD Initialization R Zhang, J Wu, PL Bartlett arXiv preprint arXiv:2402.14951, 2024		2024

현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.

학술자료 1–8

연간 인용횟수