您很快就能在 iPhone 上运行人工智能任务吗?联发科说是的

闪电发卡1年前ChatGPT907

联发科技正在与 Meta 的 Lllama 2 LLM 合作,直接在移动设备上运行生成式 AI 任务,无需基于云的处理。这样做有几个好处——但也有一个问题。

1693449369975.jpg

d3sign/盖蒂图片社


生成式 AI 是最热门的发展技术之一, OpenAI 的 ChatGPTGoogle Bard使用生成式 AI 进行聊天,以及Stable DiffusionDALL-E等图像生成系统。尽管如此,它还是有一定的局限性,因为这些工具需要使用具有数百个 GPU 的基于云的数据中心来执行每个查询所需的计算过程。 


但有一天,您可以直接在移动设备上运行生成式人工智能任务。或者您的联网汽车。或者在客厅、卧室和厨房使用 Amazon Echo、Google Home 或 Apple HomePod 等智能扬声器。


联发科相信这个未来比我们想象的更近。今天,这家台湾半导体公司宣布,它正在与 Meta 合作,移植这家社交巨头的 Lllama 2 LLM,结合该公司最新一代的 APU 和NeuroPilot软件开发平台,在设备上运行生成式 AI 任务,而无需依赖关于外部加工。

当然,有一个问题:这不会完全消除数据中心。由于 LLM 数据集的大小(它们包含的参数数量)和存储系统所需的性能,您仍然需要一个数据中心,尽管数据中心要小得多。 


例如,Llama 2 的“小”数据集有 70 亿个参数,约合 13GB,适合一些基本的生成式 AI 功能。然而,720 亿个参数的更大版本按比例需要更多的存储空间,即使使用高级数据压缩也是如此,这超出了当今智能手机的实际功能。在接下来的几年里,正在开发的 LLM 的大小将很容易达到 Llama 2 或GPT-4 10 到 100 倍,存储需求达到数百 GB 甚至更高。 


对于智能手机来说,要存储数据并具有足够的 IOPS 来提高数据库性能是很困难的,但对于专门设计的具有快速闪存和 TB RAM 的缓存设备来说肯定不是这样。因此,对于 Llama 2,现在可以在单个机架单元中托管一个为移动设备服务而优化的设备,而无需进行繁重的计算。这不是一部手机,但无论如何它都令人印象深刻!

联发科预计基于 Llama 2 的人工智能应用程序将可用于搭载下一代旗舰 SoC 的智能手机,计划于今年年底上市。


为了让设备上的生成式人工智能访问这些数据集,移动运营商必须依赖低延迟边缘网络——能够快速连接到 5G 塔的小型数据中心/设备柜。这些数据中心将直接驻留在运营商的网络上,因此在智能手机上运行的法学硕士在访问参数数据之前不需要经过许多网络“跳跃”。


除了使用联发科技等专用处理器在设备上运行 AI 工作负载之外,特定领域的 LLM 还可以通过在微型数据中心内以混合方式运行这些缓存设备(在“受限设备边缘”),从而更接近应用程序工作负载。设想。


那么,使用设备端生成式人工智能有哪些好处呢? 


减少延迟: 由于数据是在设备本身上处理的,因此响应时间显着减少,尤其是在参数数据集的频繁访问部分使用本地化缓存方法的情况下。 


改进的数据隐私: 通过将数据保留在设备上,该数据(例如用户提交的聊天对话或培训)不会通过数据中心传输;只有模型数据是。


提高带宽效率: 如今,生成式人工智能任务需要用户对话中的所有数据来回传输到数据中心。通过本地化处理,大量此类操作发生在设备上。


提高操作弹性: 通过设备上生成,即使网络中断,系统也可以继续运行,特别是在设备具有足够大的参数缓存的情况下。


能源效率:它不需要数据中心那么多的计算密集型资源,也不需要那么多的能量将数据从设备传输到数据中心。


然而,实现这些好处可能涉及拆分工作负载和使用其他负载平衡技术来减轻集中式数据中心的计算成本和网络开销。


除了对快速连接的边缘数据中心的持续需求(尽管计算和能源需求大大降低)之外,还有另一个问题:法学硕士到底能在当今的硬件上运行多强大?虽然人们不太担心设备上的数据被网络拦截,但如果管理不当,本地设备上的敏感数据会被渗透,这会带来额外的安全风险,以及更新模型的挑战数据并保持大量分布式边缘缓存设备上的数据一致性。 


最后,还有成本:谁将为所有这些迷你边缘数据中心买单?如今边缘网络由边缘服务提供商(例如 Equinix)采用,Netflix 和 Apple 的 iTunes 等服务需要边缘网络,而传统上 AT&T、T-Mobile 或 Verizon 等移动网络运营商则不需要边缘网络。OpenAI/微软、谷歌和 Meta 等生成式人工智能服务提供商需要制定类似的安排。 


设备上的生成式人工智能有很多考虑因素,但很明显科技公司正在考虑它。五年内,您的设备上的智能助手可能会完全独立思考。准备好将人工智能装进你的口袋了吗?它即将到来——而且比大多数人预期的要早得多。

相关文章

ChatGPT Plus 4.0账号购买攻略:提升您的AI体验

闪电发卡ChatGPT产品推荐:ChatGPT独享账号:https://www.chatgptzh.com/post/86.htmlChatGPT Plus独享共享账号购买代充:https://www...

如何使用 ChatGPT 进行论文、演示文稿、研究等研究

如何使用 ChatGPT 进行论文、演示文稿、研究等研究

再也不用花一秒钟漫无目的地在谷歌上滚动寻找资源了。Westend61/盖蒂图片社ChatGPT通常被认为是一种可以替代人类工作的工具,例如为学生或专业人士撰写论文。但 ChatGPT 也可以用于支持人...

GPT的架构与应用 - Transformer教程

在过去的几年里,人工智能技术取得了巨大的进展,其中最引人注目的成就是生成式预训练变换器(GPT)的出现。GPT是一种基于Transformer架构的模型,已在自然语言处理(NLP)领域掀起了革命性变化...

《精通ChatGPT:从入门到大师的Prompt指南》大纲目录

第一部分:入门指南第1章:认识ChatGPT1.1 ChatGPT是什么1.2 ChatGPT的应用领域1.3 为什么需要了解Prompt第2章:Prompt的基本概念2.1 什么是Prompt2.2...

查询OpenAI账号APIKey可用余额、使用量和使用明细接口,用python实现

现在可以使用以下接口进行实现Pythonapikey = ""     subscription_url =...

ChatGPT收费版真来了!每月134元告别排队卡顿,免费的还在,网友:蹲个「青春版」

ChatGPT收费版真来了!每月134元告别排队卡顿,免费的还在,网友:蹲个「青春版」

【导读】ChatGPT真的开始收费了!相比之前曝光的ChatGPT Pro,付费版正式名称改为ChatGPT Plus,费用对半砍,降至每月20美元。网友表示:你卖手机呢?ChatGPT正式收费了!每...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。