Page 1 of 1

然后将标记的数据反馈给机器

Posted: Sat Apr 19, 2025 3:43 am
by jsarmin
机器学习周期
这是一个持续的过程。 Bing 不断向算法提供反馈,以便算法能够改进。

经过上述定义的步骤 3,人类评判者对结果进行评估和标记。

算法团队利用这些数据来调整特征和规则,

负反馈被机器用来进行调整和改进。积极的反馈有助于巩固已经获得的知识。

所以这对我们所有人来说似乎都是一次学习经历。

Bing 的人工评判指南
重要的是,人类法官的反馈是有结构的,而不仅仅基于人类的直觉,因为如果仅沙特阿拉伯电子邮件列表仅基于直觉,不同法官的反馈就会有所不同,这会使机器的反馈感到困惑或矛盾。

该结构采用一组指南的形式(相当于Google 的质量评估指南),以确保一致性并最大限度地提高给予机器的反馈的客观性。

人类对结果的评估会不断反馈到 Bing 的算法中(见上文),从而使机器能够适应和改进特征权重,并有望随着时间的推移改善其结果。

每个团队(多媒体、问答/精选片段、知识面板等)都有自己的人工评审小组和指导方针,重点关注特定丰富元素的要求。

这似乎表明谷歌可能还有其他审核员指南,这也非常有趣。

这也意味着(至少对我来说),无论是谁编写这些指南,都会对排名因素(所谓的特征)的相对权重产生强大而间接的影响。