Ziang Song

20212022202320243 30 61 29

공개 액세스

자료 2개

자료 0개

공개

비공개

재정 지원 요구사항 기준

Song MeiAssistant Professor at UC Berkeleyberkeley.edu의 이메일 확인됨
Yu BaiResearch Scientist, Salesforce Researchsalesforce.com의 이메일 확인됨
Tianle CaiPhD Student, Princeton Universityprinceton.edu의 이메일 확인됨
Tiancheng YuTwo Sigmamit.edu의 이메일 확인됨
Chi JinAssistant Professor, Princeton Universityprinceton.edu의 이메일 확인됨
Weijie SuAssociate Professor, University of Pennsylvaniawharton.upenn.edu의 이메일 확인됨
Jason D. LeeAssociate Professor of Electrical Engineering and Computer Science, Princeton Universityprinceton.edu의 이메일 확인됨

Ziang Song

stanford.edu의 이메일 확인됨


제목 서지정보순 정렬 연도순 정렬 제목순 정렬	인용 인용	연도
When can we learn general-sum Markov games with a large number of players sample-efficiently? Z Song, S Mei, Y Bai arXiv preprint arXiv:2110.04184, 2021	86	2021
Efficient Phi-Regret Minimization in Extensive-Form Games via Online Mirror Descent Y Bai, C Jin, S Mei, Z Song, T Yu Advances in Neural Information Processing Systems 35, 22313-22325, 2022	13	2022
Reward collapse in aligning large language models Z Song, T Cai, JD Lee, WJ Su arXiv preprint arXiv:2305.17608, 2023	12	2023
Sample-efficient learning of correlated equilibria in extensive-form games Z Song, S Mei, Y Bai Advances in Neural Information Processing Systems 35, 4099-4110, 2022	11	2022
Reward Collapse in Aligning Large Language Models: A Prompt-Aware Approach to Preference Rankings Z Song, T Cai, JD Lee, WJ Su ICML 2023 Workshop The Many Facets of Preference-Based Learning, 2023	1	2023

현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.

학술자료 1–5

연간 인용횟수