6月19日消息:ChatGPT 和 Google 的Bard 等生成式人工智能使用自然语言处理和机器学习生成特定文本以响应提问。Meta 的新生成人工智能 Voicebox 做事有点不同——生成任意音频。
Facebook 的母公司 Meta 在日前宣布了一项名为 Voicebox 的新型生成式人工智能技术。Voicebox 可以利用一段 2 秒钟的音频样本合成语音。通过这个样本,它可以匹配音频风格,并进行文本转语音生成,或重新创建可能被外部噪音打断的语音部分。Voicebox 还可以利用这个样本,将英文文本朗读成其他语言,比如法语、德语、西班牙语、波兰语或葡萄牙语。
Meta 表示,Voicebox 可以为虚拟助手或元宇宙中的非玩家角色提供自然真实的语音。元宇宙是人们在其中聚集工作、娱乐和交流的数字世界。它还可以被视力受损的人使用,让他们听到朋友们的声音来朗读信息。
Voicebox 仍处于研发阶段,尚未向公众提供。Meta 表示,他们意识到这种人工智能技术可能带来的潜在危害,并正在努力找到一种有效的方式来区分真实语音和由 Voicebox 生成的音频。