北邮人论坛的十大热门帖子的汇总文章 2023_06_24,使用手机端打开不需要登录,使用电脑端打开需要登录。
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation 阅读
本文是 Reward Model 在 Text-to-Image 上的一个应用,训练 RM 模型来判断模型生成的结果如何。本文作者主要对 text-to-image 领域提出了一个...
北邮人论坛十大_2023_06_23
北邮人论坛的十大热门帖子的汇总文章 2023_06_23,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_22
北邮人论坛的十大热门帖子的汇总文章 2023_06_22,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_21
北邮人论坛的十大热门帖子的汇总文章 2023_06_21,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_20
北邮人论坛的十大热门帖子的汇总文章 2023_06_20,使用手机端打开不需要登录,使用电脑端打开需要登录。
RLHF 技术笔记
本文会介绍 RLHF 的相关内容,主要从原理层面,介绍 RLHF 的三个步骤,(1)预训练语言模型;(2)训练奖励模型;(3)使用强化学习微调语言模型;也会包含 InstructG...
北邮人论坛十大_2023_06_19
北邮人论坛的十大热门帖子的汇总文章 2023_06_19,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_18
北邮人论坛的十大热门帖子的汇总文章 2023_06_18,使用手机端打开不需要登录,使用电脑端打开需要登录。
北邮人论坛十大_2023_06_17
北邮人论坛的十大热门帖子的汇总文章 2023_06_17,使用手机端打开不需要登录,使用电脑端打开需要登录。
309