pickxiguapi

Yifu Yuan pickxiguapi

Achievements

CleanDiffuserTeam/CleanDiffuser CleanDiffuserTeam/CleanDiffuser Public

CleanDiffuser: An Easy-to-use Modularized Library for Diffusion Models in Decision Making

Jupyter Notebook 314 28
Clean-Offline-RLHF Clean-Offline-RLHF Public

Offline RLHF codebase implementation for "Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback" (ICLR2024)

Python 31 2
Uni-RLHF-Platform Uni-RLHF-Platform Public

Uni-RLHF platform for "Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback" (ICLR2024)

Python 29 1
euclid-iclr2023 euclid-iclr2023 Public

Official implementation for "EUCLID: Towards efficient unsupervised reinforcement learning with multi-choice dynamics model" (ICLR2023)

Python 1
ED2 ED2 Public

Forked from ED2-source-code/ED2

the ED2 implementation

Python
Mini-Uni-RLHF Mini-Uni-RLHF Public

Minimal implementation for easy-to-use RLHF annotation

Python 1