本文作者:独特魅力

OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频

独特魅力 04-07 256
OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频摘要: 在人工智能领域很少有像这样的学者在岁的年龄还能高度活跃于社交媒体都是以直言不讳的批评者形象活跃于人工智能领域在拥有世界模型能够划重点为训练模型转录了超过一百万小时的视频和也遇到了数...

在人工智能领域,很少有像YannLeCun这样的学者,在65岁的年龄还能高度活跃于社交媒体。YannLeCun都是以「直言不讳的批评者」形象活跃于人工智能领域。在拥有世界模型、能够

划重点:

- ⭐ 为训练 模型转录了超过一百万小时的 视频

- ⭐ Google 和 Meta 也遇到了数据获取限制的挑战

- ⭐ AI 公司面临数据获取困难,采取争议性手段应对

4月7日 消息:AI 公司在获取高质量训练数据方面遇到的挑战,OpenAI 为了训练其最先进的大型语言模型 GPT-4,使用了超过一百万小时的 YouTube 视频副本。

据了解,该公司通过其 Whisper 音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,OpenAI 仍认为这属于合理使用。

Google 对此表示关注,指出其条款禁止未经授权地获取 YouTube 内容。同时,Google 和 Meta 也遇到了训练数据获取的限制,为了跟进 OpenAI 的步伐,这两家公司也采取了一些争议性的做法。

OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频

AI 领域正面临训练数据短缺的挑战,而解决方案尚未明朗,公司们需要权衡利弊并寻求合理途径应对这一问题。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享