DeepMind AI模型能为YouTube Shorts视频自动加描述,提升曝光度

谷歌旗下AI事业群DeepMind本周发布能为短视频服务YouTube Shorts自动生成描述文字的AI模型Flamingo,方便这些视频为用户搜索。

DeepMind AI模型能为YouTube Shorts视频自动加描述,提升曝光度

YouTube Shorts为类似Tiktok的短视频,通常只有几分钟,大部份也都未包含描述文字及有用的标题,使这些视频难以被人搜寻。 因此DeepMind推出视觉语言模型Flamingo以协助产生描述文字。

DeepMind说明,Flamingo分析Shorts 视频最初的讯框后即可解释屏幕上的内容为何,例如「一只狗头顶着一叠饼乾」。 这段文字可存成YouTube的metadata,以便更有效率分类视频,并且让搜索引擎找给用户。

目前新上传的数十万则Shorts视频已经都有AI产生的视频描述,YouTube计划把这项技术渐次推到所有Shorts视频。

Flamingo是DeepMind和YouTube合作的最新一个项目,也是4月间谷歌宣布DeepMind和谷歌 Brain合并成一个单一AI事业群的最新成果。

最早DeepMind以其AI模型MuZero改善YouTube压缩传送的VP9 codec。 2018年DeepMind又和YouTube合作,教育视频创作者如何借由为视频搭配符合YouTube政策的广告以增加营收,因此两公司发展了标签品质模型(label quality model,LQM)以更精准标注内容。 模型提升了广告精准度,也强化YouTube上的观众、创作者及广告商的信任度。

而后YouTube视频增加分段篇章,方便观众更快找到想要的段落,为此DeepMind又和YouTube搜寻部门开发可自动处理视频、影音内容转录文字,以及建议篇章切分及标题的AI系统。 名为AutoChapters的功能在谷歌 I/O 2022上,由首席执行官Sundar Pichai宣布,不再需要用户辛苦慢慢寻找,也缩短创作者加篇章的时间。 现在 AI 自动分篇章的视频已经用于 800 万则视频,DeepMind 计划明年扩充到 8000 万则 。

YouTube Shorts产制部门对媒体表示,Flamingo产生的metadata不会显示给创作者,目的在大幅提升搜寻精确性。 同时谷歌也会确保Flamingo所产生的文字符合其责任标准,不会出现文字负面呈现视频内容的情形。

Flamingo AI标示准确性值得观察。 8年前谷歌 Photos曾将2个非裔人士标注为黑猩猩,因此谷歌 Photos这服务迄今不会标注任何东西为「猴子」。

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注