在过去的几天里,有一些关于AI的重要新闻发布,特别是生成模型方面的新闻。
基于AI的生成模型主要用于图像,以及视频和文本,并且变得越来越逼真。
Summary
更强大的生成型AI模型:最新新闻
一个重要的消息是关于Stability AI的,该公司宣布发布Stable Diffusion 3.5,这是一个开源的AI图像生成模型。
这是一个开放版本,包括多种高度可定制的变体,基于它们的尺寸,可在消费者硬件上运行,并且根据宽松的Stability AI Community License,免费用于商业和非商业用途。
可以从 Hugging Face 下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo,包括 GitHub 上的代码。而 Stable Diffusion 3.5 Medium 将于 10 月 29 日发布。
稳定扩散 3.5
Stable Diffusion 3.5 是迄今为止由 Stability AI 创建的最强大的生成 AI 模型。
在六月,他们发布了Stable Diffusion 3 Medium,这是Stable Diffusion 3系列的第一个开放版本,但并没有完全满足社区的期望。
因此,在听取了社区本身的反馈后,Stability AI 开发了一个新版本,以推进他们将视觉媒体转变的使命。
Stable Diffusion 3.5 希望为创作者提供广泛可访问的、最先进的和免费的工具,以满足大多数使用场景的需求,并提供多种模型,以满足科学研究人员、业余爱好者、初创公司和企业的需求。
这个版本是市场上最可定制和可访问的基于AI的图像生成模型之一,同时在响应速度和图像质量方面表现出色。
AI新闻和生成模型领域的更新:鼠标和键盘的自主管理
但还有其他的。
Anthropic 宣布推出其基于AI的新版本beta模型Claude,这将允许使用API的开发人员甚至可以控制鼠标光标,以自主点击按钮和字段并输入文本。
此更新实际上允许开发人员指示Claude像人一样使用计算机,即查看屏幕、移动光标、点击按钮和输入文本。根据Anthropic的说法,Claude 3.5 Sonnet是第一个在公开测试版中提供计算机使用的AI模型,尽管在此阶段它仍然是实验性的,因此有时显得笨拙并容易出错。
已经在试验这一新功能的有 Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company。
Claude 3.5 Sonnet的更新现已向所有用户开放。
负面消息
然而,关于生成型AI模型的发展,并不只有积极的消息。
例如,Penguin Random House (PRH) 在版权页中引入了一项新声明,无论是新书还是再版书籍,其中声明其书籍的任何部分都不得以任何方式用于训练<bull或bear技术或系统的人工智能。
PRH 是世界上最大的商业出版商,因此从这个角度来看,它可能会成为 bull 和 bear 的榜样。
声明引用了欧洲议会的一项指令,旨在禁止人工智能公司使用其文本来开发聊天机器人和其他数字工具。
另一方面,在美国已经出现了多起此类版权侵犯的案例,许多书籍已经在未经授权的情况下被用于训练人工智能工具。
PRH 是五大英语商业出版商中第一个修改其版权信息以用于此类目的的公司。
加速与减速
正如几乎总是发生的那样,一个快速扩张的新领域会产生强劲的加速和巨大的制动。
在这些情况下,问题在于加速可能会使其大幅前进,以至于刹车可能只能减缓加速而无法将其停止。
然而,并非所有闪闪发光的都是金子,在所有的演变中,总是有一个破坏的成分。
在这种情况下,风险在于破坏一些信息生产者的商业模式,并通过实际盗窃知识产权来实现这一点。
也不一定说立法者能够跟上这些快速的演变,因此可能需要一些时间才能审查所有更为棘手的问题,并可能加以解决。
然而,很明显,这不仅仅是一种时尚,或是昙花一现,而是那些推动人类社会无可争议地主宰这个世界的重大进步之一。