大模型资讯:
ChatGPT疯狂变现,OpenAI 营收将突破 10 亿美元
据The Information报道,OpenAI目前有望在未来12个月内通过销售人工智能软件和为其提供动力的计算能力获得超过10亿美元的收入。一位知情人士透露,这远远超出了该公司此前与股东分享的收入预期。
10亿美元的收入数字意味着,这家微软支持的公司每月产生的收入超过8000万美元。今年早些时候,投资者从现有股东手中购买股票时,该公司的账面价值为270亿美元。去年,OpenAI在其开创性的聊天机器人ChatGPT开始收费之前,仅创造了2800万美元的收入。
收入的快速增长表明,应用程序开发商和公司——包括华尔街公司简街(Jane Street)这样的神秘公司——正在越来越多地寻找使用OpenAI的对话式文本技术来赚钱或节省成本的方法。微软、谷歌和无数其他试图从同一技术中赚钱的企业都在密切关注OpenAI的增长。
微软发布Turing Bletchley v3视觉语言模型:必应搜索图片更精准
微软今天宣布推出第三代Turing Bletchley视觉语言模型,并逐步整合到必应(Bing)等相关产品中,可以大幅改进图像搜索体验。
微软于 2021 年 11 月发布初版 Turing Bletchley 视觉语言模型,并于 2022 年秋季开始邀请用户,测试 Turing Bletchley v3 视觉语言模型。经过长时间的打磨之后,微软不断根据用户的反馈和建议,积极调整该模型,能够根据关键词提供更精准的图像内容
微软表示目前已使用 Turing Bletchley v3 视觉语言模型,用于审核 Xbox 游戏服务上的内容,它可以帮助团队识别 Xbox 玩家上传到其个人资料中的图像和视频,营造更和谐的社区环境。
谷歌云与英伟达宣布扩大合作伙伴关系
谷歌云与英伟达宣布扩大合作伙伴关系以推进AI计算、软件和服务的发展。
英伟达创始人兼首席执行官黄仁勋表示,“我们正处于一个拐点,加速计算和生成式人工智能结合在一起,以前所未有的速度加速创新。我们与谷歌云扩大合作将帮助开发人员加快基础设施、软件和服务的工作,从而提高能源效率并降低成本。”
阿拉伯语 AI 大模型 Jais 正式开源,参数达130亿
据 HuggingFace 页面显示,阿联酋研究团队近日宣布开源阿拉伯语大模型Jais 。
据悉,Jais 是一个经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 2790 亿个英语/代码词块的数据集上进行训练。该模型由Cerebras、阿联酋人工智能大学和G42旗下子公司Inception合作研发。
目前这款模型现已开源,用户可以从HuggingFace 下载其代码。
MSCI与谷歌云深化合作伙伴关系
国际指数编制公司MSCI宣布与谷歌云(Google Cloud)深化合作伙伴关系,加速投资行业生成式人工智能解决方案的开发。
这些解决方案由谷歌云的生成式人工智能平台Vertex AI和气候技术平台(包括BigQuery Geospatial和Earth Engine)提供支持,将助力MSCI的客户更好地管理其投资组合中所存在的风险和机遇,以做出明智的投资决策。
此外,通用汽车也在今天宣布将与谷歌云合作,把对话式人工智能技术引入通用汽车中。
Uber Eats 正开发新款 AI 聊天机器人,可帮助用户下单
据 TechCrunch 报道,Uber East 正在开发一款聊天机器人,为用户提供点单推荐,加快客户的下单速度。
据报道,这款聊天机器人将由 AI 技术驱动。它会询问用户的预算、偏好和位置,帮助用户选择合适的菜品和餐厅。目前这款AI 机器人的具体细节尚未公布。
Uber 曾在8月初宣布正在开发 AI 聊天机器人,这款机器人将被集成到其应用程序之中。
谷歌推出全新人工智能助理 Duet AI
谷歌在今天的 Nest 大会上宣布,Duet AI将全面进入Workspace,并且向大家演示了最新的Duet AI的界面、新功能和一些完整的操作流程。
首先,Duet AI将以侧边栏、对话框的形式存在,它可以帮用户自动交叉调用工作空间中的文件和信息,并根据指令来处理和生成文件。谷歌表示,包括Gmail、Drive、Slides、Docs 等应用都将会接入Duet AI。
今天Duet AI全面进入Workspace之后,所有用户都可以在谷歌官网上申请免费试用。但谷歌也表示将在未来几个月为消费者、中小型企业和其他人提供额外的等级和定价。
重点论文:
韩国科学技术院大学发布论文,为无声电影生成语音
韩国科学技术院大学的研究人员近日发布论文,介绍了一款利用大模型技术来为无声电影配音的方法。
研究团队希望从无声视频中通过唇部运动来生成高质量语音,完成唇语到语音的转换。该方法使用自监督语音表示来消除同音异形,使用声学变异信息来建模多样化的语音风格。此外,研究团队还采用了基于流的后处理网络来捕捉和优化生成语音的细节。
论文表示,该方法在语音自然性和可理解性方面达到了接近真实人类语音的生成质量。
论文地址:点此前往
0 条评论
请「登录」后评论