• 微信:WANCOME
  • 扫码加微信,提供专业咨询
  • 服务热线
  • 0769-23063100
    13027920428

  • 微信扫码访问本页
技术分享
用什么技术建设知识变现系统?用哪种开发技术比较好?选用哪种数据库?

云架构中加入生成式AI的几点建议

旺道.商弈 -> 技术分享

图片


作者 | David Linthicum

策划 | 言征

 

从数据可用性、安全性到模型选择和监控,生成式AI的加入便意味着要重新审视云架构。

 

所以,如果在构建一个云架构同时也在设计生成式AI驱动的系统。你需要做哪些不一样的改变?还需要做什么?目前出现了哪些最佳做法?

 

结合过去20年的经验,以下是作者给出的一些建议,整理如下,望诸位有所启发。

 

图片

理解你的用例

 

明确定义云架构中生成人工智能的目的和目标。如果我反复看到任何错误,那就是没有理解商业系统中生成人工智能的含义。了解您的目标是实现什么,无论是内容生成、推荐系统还是其他应用程序。这意味着写下内容,并就目标、如何实现目标以及最重要的是如何定义成功达成共识。这对于生成人工智能来说并不新鲜;这是赢得每一次迁移和构建在云中的全新系统的一步。

 

我看到许多云中的整个生成AI项目都以失败告终,因为它们没有很好地理解业务用例。公司制造了一个很酷的东西,但不会给业务带来任何价值。这是行不通的。

图片

图片

数据来源和质量是关键

 

识别生成人工智能模型训练和推理所需的数据源。数据必须是可访问的、高质量的,并经过仔细管理。您还必须确保云存储解决方案的可用性和兼容性。生成型人工智能系统高度以数据为中心。我称之为面向数据的系统;数据是推动生成性人工智能系统产生结果的燃料。垃圾进,垃圾出。

 

因此,将数据可访问性作为云架构的主要驱动因素是有帮助的。您需要将大多数相关数据作为训练数据进行访问,通常将其保留在现有位置,而不是将其迁移到单个物理实体。否则,你最终会得到多余的数据,没有单一的真相来源。

 

在将数据输入人工智能模型之前,考虑高效的数据管道来预处理和清理数据。这样可以确保数据质量和模型性能。这大约是使用生成人工智能的云架构成功率的80%。然而,这一点最容易被忽视,因为云架构师更多地关注生成人工智能系统的处理,而不是为这些系统提供数据。数据就是一切。


图片

数据安全和隐私

 

正如数据很重要一样,应用于数据的安全性和隐私性也很重要。人工智能的生成处理可以将看似毫无意义的数据转化为可以暴露敏感信息的数据。


实施强有力的数据安全措施、加密和访问控制,以保护生成人工智能使用的敏感数据以及生成人工智能可能产生的新数据。至少要遵守相关的数据隐私法规。这并不意味着在你的架构上安装一些安全系统作为最后一步;安全性必须在每一步都融入到系统中。


图片

可扩展性和推理资源

 

规划可扩展的云资源,以适应不同的工作负载和数据处理需求。大多数公司都考虑自动扩展和负载平衡解决方案。我看到的一个更重大的错误是构建规模良好但成本高昂的系统。


最好平衡可扩展性和成本效率,这是可以做到的,但需要良好的架构和finops实践。此外,检查训练和推理资源。我想你已经注意到,云会议上的许多话题都围绕着这个话题,这是有充分理由的。选择具有GPU或TPU的适当云实例进行模型训练和推理。再次,优化资源分配以提高成本效率。


图片

考虑模型的选型

 

根据您的具体用例和需求,选择示例性的生成AI架构(通用对抗性网络、转换器等)。考虑用于模型培训的云服务,如AWS SageMaker和其他服务,并找到优化的解决方案。这也意味着要理解你可能有许多相互关联的模型,这将是常态。

 

实施稳健的模型部署策略,包括版本控制和容器化,使AI模型可供云架构中的应用程序和服务访问。


图片

监控和日志记录


设置监控和日志系统以跟踪AI模型性能、资源利用率和潜在问题不是可选的。建立异常警报机制,以及为处理云中生成人工智能而构建的可观察性系统。

 

此外,持续监控和优化云资源成本,因为生成式人工智能可能是资源密集型的。使用云成本管理工具和实践。这意味着让finops监控部署的各个方面——最低限度的运营成本效率和评估架构是否最佳的架构效率。大多数体系结构都需要调整和持续改进。 


图片

其他考虑

 

需要故障切换和冗余来确保高可用性,灾难恢复计划可以在系统故障时最大限度地减少停机时间和数据丢失。必要时实施冗余。此外,定期审计和评估云基础设施内生成人工智能系统的安全性。解决漏洞并保持合规性。

 

制定人工智能道德使用指南是个好主意,尤其是在生成内容或做出影响用户的决策时。因此,需要解决偏见和公平问题。目前有关于人工智能和公平的诉讼,你需要确保你做的是正确的事情。持续评估用户体验,以确保人工智能生成的内容符合用户期望,并提高参与度。

 

无论你是否使用生成人工智能,云计算架构的其他方面都是一样的。关键是要意识到,有些事情要重要得多,需要更加严格,而且总有改进的空间。

 

参考链接:

https://www.infoworld.com/article/3706094/adding-generative-ai-systems-may-change-your-cloud-architecture.html

 

 ——好文推荐——


终于决定了!知名IDE JetBrains宣布重仓这款Linux桌面服务器 !

TypeScript被放弃!又一知名前端利器决意转回JS,社区不满:这在开倒车!


图片

医疗管理系统(HIS)最最基础入门,不信你看不懂。

医疗行业管理系统是一个重要的工具,可以帮助医疗机构提高效率、提升服务质量。它的设计和功能模块需要针对医疗行业的特点进行考虑,以满足医疗机构的需求

桌面应用开发常用技术栈

开发电脑桌面应用可以使用多种技术栈,具体选择取决于开发者的需求和偏好。以下是一些常见的技术栈:前端开发技术栈:通常使用桌面应用开发框架,如Ele

产品经理必备知识——API接口

进入互联网时代之后,API接口的出现为不同应用程序搭建起了桥梁,那么,你是否真的了解API呢?这篇文章里,作者对API接口的分类、原理、API接

JavaScript、PHP、Golang、Haskell、Elixir,哪个才是最佳编程语言?

函数式编程:你可能知道,刚开始的时候 JavaScript 是“一种类似于 Scheme 的浏览器编程语言,只不过使用的是 Java 语法。”生

软件开发:敏捷开发模式,无论是产品还是运营都要懂

本文笔者将从软件工程的角度来聊一聊敏捷开发模式,会涉及瀑布。V字、RUP、迭代、螺旋等开发模型,同时重点分享下敏捷模式的核心思想。

生意之道:想赚大钱,就要学会与人分钱

只要你得到了好处 ,你就一定要分给别人,你只要每次都给了别人好处,你就会有源源不断的生意,就会源源不断地赚到许多莫名其妙的钱财,哈哈,这个莫名其... ...

2024流量共生,公域做规模,私域要复利

公域和私域是共生关系,在单独探讨一方时候总不自觉地思考与另一方的关系和联动。有很多企业两者之间会有所侧重,比如重公域销售,跑通投产比就持续放大,... ...

Nginx 常用配置汇总!从入门到干活足矣

众所周知,Nginx 是 Apache服务不错的替代品。其特点是占有内存少,并发能力强,事实上 Nginx 的并发能力在同类型的网页服务器中表现... ...

分布式架构和微服务架构的区别

1、含义不同微服务架构是一种将一个单一应用程序开发为一组小型服务的方法,每个服务运行在自己的进程中。分布式系统是若干独立计算机的集合,这些计算机... ...

大屏可视化综合展示平台解决方案

概述建立大屏可视化综合展示平台,构建各业务板块统一的大数据分析平台,构建数据驾驶舱与智慧调度平台。深入探索挖掘企业的客户信息数据,以“大数据”理... ...

Ideogram:一款秒杀Midjourney,免费无限生成的AI绘画神器

导读:Ideogram AI是一个文本生成图片的平台,它最大的优点就是好用、免费又没有生成限制,因此可以秒杀MJ和SD。AI绘画是人工智能领域的... ...

陈春花:营销的根本在于理解消费者

巨变时代,企业曾经行之有效的经验和方法也许不再有效,营销需要做合适的事情,其根本在于理解消费者,在创造顾客价值上的有所作为。春暖花开市场经济环境... ...

穷人变富需要具备的四大能力,你有吗?1 抗拒诱惑游戏、视频、麻将-今日头条

穷人变富需要具备的四大能力,你有吗?1 抗拒诱惑游戏、视频、麻将、小说等等这些东西无时不刻诱惑着我们。穷人若想变富,必须要把精力和时间用在学习知... ...

ChatGPT时代,重新定义官网

ChatGPT时代已来,人机之间用自然语言交流成为现实,用户表达需求的方式可以更自然、更直接。那么,各大网站上复杂的导航栏设计、重复性极高的筛选... ...

小红书高时效推荐系统背后的技术升级

在小红书 APP 中,推荐系统的实效性对推荐效果有着特别重要的影响,特别是作为 UGC 平台,小红书的推荐系统如果能更快地捕捉用户与笔记之间的变... ...

你的店铺真的盈利了吗?万能「烘焙运营公式」奉上!

面包王子说:做好一个店铺,并不只是运营店铺,而是在做一家企业,门店需要一家企业所要拥有的一切。包括:组织能力、战略能力和营销能力的三大方向。我们... ...

在做网站SEO优化中robots的编写方法

robots.txt是搜索引擎中的一个协议,当你的网站有一些内容不想给蜘蛛爬取,那可以利用robots.txt来告诉蜘蛛不要去爬取这些页面,不爬取这些页面当然就不收录了。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。... ...