业界领先的这些大模型,都被一家「收编」了

日期:2023-10-17 15:05:02 / 人气:568

这些在行业内处于领先地位的大机型,都被一家公司“收编”了,“机心报告”

毫无疑问,GPT-4的发布是可以载入AI史册的大事件。但随着时间的推移,人们也发现,即使是最先进的大型模型,也不足以强大到无所不能。比如你在GPT-4的对话框里粘贴一段很长的文字,它会告诉你文字太长,无法处理(它支持的上下文窗口只有32k的token,大概25000个汉字)。
再比如,如果你需要计算8位数以上的数乘法,或者涉及小数和分数的运算(其多位数乘法运算的准确率仅为4.3%),GPT-4可能不会给出正确答案。
看来,现阶段我们还没有达到理想的“通用人工智能”,比GPT-4更好也不是完美的。这也意味着,对于大型模型的用户或希望在其上开发应用程序的技术人员来说,GPT-4可能不是唯一的选择,甚至不是最合适的选择。
那么,在生成式AI的后半部分,应该如何构建应用呢?这不是一个可以简单回答的问题。很多时候,我们恨不得把现有的强势模式都尝试一遍。但要做到这一点并不容易,因为很多机型在发布的同时并没有提供太多的“配套服务”,试用是有成本和费用的。
幸运的是,拥有强大基础设施的亚马逊云技术也在关注这些问题。近日正式上线的亚马逊基岩(Amazon基岩)以“提供更多选择”为目标,支持服务。
克劳德,骆马2,稳定扩散...超级全明星模型库
除了ChatGPT,人们在更多领域应用生成式AI还面临着挑战:我们必须建立一个专用于生成式AI的硬件基础设施,用自己的数据优化大模型,不断更新和部署,同时保护私有数据的安全。即使对于科技公司来说,这也是一件非常复杂的事情。
对此,亚马逊云技术想出了一套“基础设施”,帮助人们构建大规模的模型应用。
今年4月,亚马逊云技术正式发布了Amazon基岩,这是一套生成式AI全托管服务,包括业界领先的基础模型和构建生成式AI应用所需的一系列功能。
亚马逊基岩汇集了行业内几乎所有领先的基础大机型。面对不同的应用场景,它允许人们使用AI21 Labs、Anthropic、Cohere、Meta Llama2和Stability AI等公司的先进大模型,通过单个API构建自己的应用。
提到亚马逊,很多人可能会想起前段时间的一个重要融资事件:计划投资40亿美元——open ai的头号竞争对手Anthropic。
在大模创业领域,Anthropic是一个非常耀眼的存在。它是由OpenAI前研究副总裁达里奥·阿莫代伊(Dario Amodei)和GPT-3论文的第一作者汤姆·布朗(Tom Brown)在2021年共同创立的。其创始成员大多是OpenAI的核心员工,曾深度参与OpenAI的GPT-3,并率先引入人类偏好强化学习(RLHF)等技术。
这个强大的阵容造就了同样耀眼的车型——克劳德(最新版本是克劳德2)。在某些方面,这个模型甚至做了GPT-4没有做的事情,比如100k token的上下文窗口,代码生成能力已经超过了最初的GPT-4。这些都是亚马逊选择投资Anthropic的重要原因。
更重要的是,亚马逊云技术发布的消息中有一段话:“作为投资协议的一部分,Anthropic将使用亚马逊云技术的服务来承担任务关键型工作负载,并在安全研究和未来基础模型开发方面进行合作。使用亚马逊云技术的开发人员和工程师将能够通过亚马逊基岩,基于最先进的Anthropic模型构建应用程序。」
没错,现在生成式AI的应用有了新的思路:有人把性能优秀的模型放到AI基础平台上,让用户选择最适合的。为了扩大经营范围,亚马逊基岩不仅推出了克劳德2,还有开源界的骆马2,还有侏罗纪-2,Command等口碑不错的机型。
来自AI21实验室的Jurassic-2是业界最大、最强大的基本模型之一。亚马逊基岩甚至提供了一个拥有数千亿参数的Ultra版本,可以应用于任何复杂的语言生成任务,如问答、摘要、长格式副本生成、高级信息抽取等,还支持多种语言。
Command是另一个明星创业公司Cohere,这是一个文本生成模型,可以通过用户的个性化命令进行训练。企业用户将自己的数据与Command结合后,可以生成针对特定应用的语言模型,在实际业务中可以起到立竿见影的作用。除了520亿个参数之外,Command的性能超过了许多更大的模型。
另外在ChatGPT之前已经席卷AI圈,生成图片能力强的稳定扩散也在他们的模型列表中。
至此,在大规模模型应用的方向上,一条道路逐渐清晰。
生成式AI落地全流程服务
最近在行业内,人们逐渐形成了一个关于大模型应用方向的思路:使用行业内领先的大模型作为基础模型,用自己的数据进行训练和调优,然后针对不同的业务场景构建应用。亚马逊云技术迅速让这条路成为现实,进一步降低了入门难度。
在亚马逊基岩的基础上,企业可以更方便快捷地尝试各种领先的基础模型,进行提示工程,完成微调和检索增强生成(RAG)等动作,并以自己的专有数据定制模型。
使用Amazon基岩代理工具的生成式AI应用程序的开发、部署、管理和其他代理功能汇集在一起。像AutoGPT一样,我们可以在不编写任何代码的情况下创建一个AI代理,并让它指挥大模型执行复杂的任务,如旅行预订、处理保险索赔、规划广告活动和管理库存。
只要指令是用自然语言写的,代理就能理解要完成的目标。
在平台和硬件上,作为专门为人工智能打造的平台,亚马逊基岩连接了亚马逊云技术的基础设施,从硬件和软件上对AI计算进行了特别优化,覆盖了从构建、训练到大型模型部署的一系列工作负载。由于亚马逊基岩采用了无服务器技术,客户可以在熟悉的亚马逊云技术服务平台上安全地将生成式AI能力集成和部署到应用程序中,而无需管理任何基础设施。
如果要应用大模型,一个不可回避的问题就是计算能力的成本。最近有人给微软GitHub Copilot的服务算了一笔账:每个用户每月收费10美元,结果微软要倒贴20美元。
对于亚马逊云科技等服务商来说,提升计算能力、降低成本的系统化解决方案才是他们最擅长的。以亚马逊EC2 P5为例,它使用了最先进的AI芯片NVIDIA H100,可以为训练大型模型提供高达20 exaflops的计算性能。与上一代基于GPU的实例相比,训练时间最多可缩短6倍,训练成本最多可降低40%。
具体到每代币的价格,亚马逊基岩上Claude系列机型的价格比GPT系列有明显优势。
当然,亚马逊基岩也充分考虑了安全和隐私保护。客户可以使用亚马逊PrivateLink在亚马逊基岩和虚拟专用网络(VPC)之间建立特殊的安全连接,以确保任何数据传输都不会暴露在公共网络上。
有趣的是,除了高效构建生成式AI应用,亚马逊云技术还充分利用技术帮助我们提高其他层面的工作效率,比如使用大型模型工具编写你自己的风格代码。
亚马逊CodeWhisperer是亚马逊云技术提出的AI编码应用,可以在IDE中生成一整行代码,完成功能代码建议,帮助人们加快工作速度。它在今年6月发布了预览版,对个人开发者免费。目前,它可以帮助人们生成15种编程语言的代码,包括Python、Java和JavaScript。
近日,亚马逊云科技推出了CodeWhisperer企业计划,实现定制化的AI代码生成和建议服务。基于新的功能,用户可以使用企业中的代码库作为训练数据,这样AI就可以相应地调整代码生成建议。管理员还可以从控制台管理定制,查看控制台上的评估指标,估计每个定制的执行模式,并有选择地部署给开发人员,从而确保企业的质量和安全标准。
除了开发新技术,我们还可以应用生成式AI来提高业务评估和诊断的效率。亚马逊QuickSight提供了创成式BI的数据分析功能,可以创建交互式仪表盘、分页报表和嵌入式分析,同时具备自然语言查询能力,使业务分析师能够更方便快捷地探索数据,轻松创建使用自然语言描述的可视化报表。
在所有流程中,亚马逊云技术提供的能力大大降低了高级大模型的落地门槛。人们在使用技术领先的大模型的同时,已经免去了管理环境、配置硬件和安全管理的事务,只需要关心业务创新。
生成式AI的转型应该走这条路。
我们知道,生成式AI的前景是无限的。
随着AI基础设施触及门槛,我们可以期待:在医疗健康领域,让AI自动提取关键细节,并基于临床医生和患者的交互创建文档摘要;在药物发现中,利用生成性AI工具进行蛋白质折叠、蛋白质序列、对接和分子设计,加速药物发现和设计的进程;在制造业,生成式AI可以通过提取历史数据来实时诊断设备故障,并建议维护操作,如输入调整、维修或可能的备件。
使用现成的生成式AI服务来提高创新效率,更快地构建实际应用,可能是大模型时代创新的正确方式。
从这个角度来说,搭建平台、降低门槛的意义和Llama2这样的重要技术创新一样重要。
正如亚马逊首席执行官安迪·杰西(Andy Jaessy)所说:“让任何人,哪怕是在宿舍或车库里刚刚开始创业之旅的人,都能获得大企业那样先进的基础设施和成本,实现自己的创新。我们希望帮助所有的初创企业都有机会成为明天的“巨人”。」
亚马逊云技术提供的服务正在将这场AI浪潮的许多旁观者变成参与者。我们可以期待,在不久的将来,生成式AI将会颠覆更多的行业。

作者:杏耀注册登录测速平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT © 杏耀注册登录测速平台 版权所有