北邮人论坛的十大热门帖子的汇总文章 2023_06_30,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_29
北邮人论坛的十大热门帖子的汇总文章 2023_06_29,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_28
北邮人论坛的十大热门帖子的汇总文章 2023_06_28,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_27
北邮人论坛的十大热门帖子的汇总文章 2023_06_27,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_26
北邮人论坛的十大热门帖子的汇总文章 2023_06_26,使用手机端打开不需要登录,使用电脑端打开需要登录。
Deep Reinforcement Learning from Human Preferences 阅读
本文是对 Deep Reinforcement Learning from Human Preferences 的论文阅读,这篇文章介绍了一种从人类反馈中学习奖励函数的方法。感觉是...
北邮人论坛十大_2023_06_25
北邮人论坛的十大热门帖子的汇总文章 2023_06_25,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_24
北邮人论坛的十大热门帖子的汇总文章 2023_06_24,使用手机端打开不需要登录,使用电脑端打开需要登录。
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation 阅读
本文是 Reward Model 在 Text-to-Image 上的一个应用,训练 RM 模型来判断模型生成的结果如何。本文作者主要对 text-to-image 领域提出了一个...
北邮人论坛十大_2023_06_23
北邮人论坛的十大热门帖子的汇总文章 2023_06_23,使用手机端打开不需要登录,使用电脑端打开需要登录。