Apple加速AI大跃进:最新发布的MM1 模型论文

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

苹果似乎在大型语言模型(LLM)的领域里来得有点晚,跟谷歌、微软和Meta在打造强大的AI工具方面有些距离,但看起来它正在迅速追赶。

今年早些时候,CEO蒂姆·库克告诉投资者,将会有关于AI的重大宣布,这将是一个“重大突破”。许多人猜测这将是一个新版的Siri,由与谷歌的助手更换为双子星类似的LLM驱动。

苹果的研究人员刚刚揭示了这个下一代Siri的可能基础的细节,如果传言属实,它可以在iPhone上与双子星并行工作,提供选择。

作为一篇预印研究论文发布的MM1,本质上提供了一种使用AI生成的数据和标签来加速新模型训练的新方法——包括可能的Siri 2.0。

MM1的核心是一种使用合成数据(包括图像和文本)训练多模态模型的新方法。MM1的研究者声称,他们的新方法加快了性能,并减少了获得所需结果所需的后续提示次数。能够改善提示理解,并尽可能少地与AI互动就得到所需输出,对于消费技术来说是完美的,特别是在将由各种技术能力的人群使用的Siri中。

这些模型在预训练指标上达到了最先进的水平,并在微调后在多模态基准测试上表现出竞争力。MM1似乎是一个AI模型家族,最大的模型大约有300亿个参数。这比GPT-4和Claude 3 Opus中的万亿以上参数要小得多,但研究者仍然声称由于效率提高而达到关键基准。这一突破性成就特别体现在视觉方面,尤其是对图像和其他视觉内容的分析能力以及理解输出的能力。我最近测试了ChatGPT、Claude和双子星在这项任务上的表现如何。

MM1使用不同于其他模型的架构,包括更高分辨率的图像编码器,采用了不同的预训练和标注方法,并专注于使用数据混合来提高单一提示的总体性能。

它还使用了一种混合专家(MoE)模型来在保持处理要求低的同时扩大规模,这进一步暗示了它在iPhone或笔记本电脑等设备上的潜在用途,而不是在云中运行。

苹果是否会用MM1驱动Siri 2.0?尽管这篇论文没有提到Siri或任何潜在产品,但对性能和效率的关注、实现最少提示下的稳定结果以及对广泛多模态能力的需求确实暗示了苹果未来可能会如何发展Siri。由于苹果长期以来的隐私立场,许多LLM驱动的Siri的功能可能必须“在设备上”运行,特别是处理个人信息方面。能够开发一个非常强大的模型,能够从与用户的互动中学习,并且足够小到可以在iPhone上运行,这是一个重大进步。

随着最近的消息称苹果可能会将双子星带到iPhone上,以及之前的传言称公司也在与ChatGPT制造商OpenAI进行谈判,看起来苹果正在采取多方面的方法来实现库克向投资者承诺的AI“大爆炸”。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-19 21:14:04       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-19 21:14:04       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-19 21:14:04       87 阅读
  4. Python语言-面向对象

    2024-03-19 21:14:04       96 阅读

热门阅读

  1. 代码随想录算法训练营第24天|理论基础|77. 组合

    2024-03-19 21:14:04       42 阅读
  2. Linux之shell条件判断

    2024-03-19 21:14:04       37 阅读
  3. 中文编程入门(Lua5.4.6中文版)第六章 Lua 运算符

    2024-03-19 21:14:04       41 阅读
  4. 安卓面试准备汇总

    2024-03-19 21:14:04       40 阅读
  5. 驱动开发中的DMA是什么

    2024-03-19 21:14:04       35 阅读
  6. 如何用数字万用表检测信号的短路和解决短路问题

    2024-03-19 21:14:04       116 阅读
  7. 华岳M9制造企业管理软件业务流程 1/4

    2024-03-19 21:14:04       37 阅读
  8. XR虚拟拍摄助力短剧制作:探索未来影视新纪元

    2024-03-19 21:14:04       50 阅读
  9. Linux Shell中的echo命令详解

    2024-03-19 21:14:04       44 阅读