智东西(公众号:zhidxcom)
作者 | 智东西编辑部
一夜之间,微软的AI全宇宙已经成型。
今日凌晨,在一年一度的2024微软Build大会上,微软CEO萨蒂亚·纳德拉(Satya Nadella)一口气宣布了50多项AI能力更新,覆盖GPT-4o上云、自研Cobalt芯片、团队版Copilot、SOTA小模型等多个方面。
作为一场AI圈“开发者盛宴”,本次微软Build大会的发布主要有以下核心亮点:
1、宣布GPT-4o在Azure AI上普遍可用,并引入Cohere、Databricks、Meta、Mistral等公司以及开源社区Hugging Face的多个大模型,一边手握OpenAI,一边狠抓第三方模型及开源模型。
2、6月马上推出Windows Copilot库,包含40多种型号的模型以及多种开箱即用的本地API。
3、推出42亿参数多模态SLM(小语言模型)Phi-3-vision,支持图像理解与交互;同时提供70亿参数的Phi-3小型模型和140亿参数Phi-3中型模型,支持跨操作系统及云边端运行。
Phi-3-vision开源地址:
https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
4、推出最新端侧小模型Phi-Silica,专为Copilot+PC中的NPU设计,在SLM中取得SOTA。
5、宣布将通过Windows DirectML提供对PyTorch、WebNN框架的原生支持,开发人员将拥有了一个Web原生的机器学习框架,使其能直接访问GPU和NPU。
6、引入Copilot连接器(Copilot connectors),支持连接业务数据、工作流以及第三方SaaS应用程序,助企业构建和定制Copilot。
7、推出团队版Copilot(Team Copilot),能扮演会议主持人、记录会议笔记、制作图表、管理工程等多种角色,并扩展出Agent(智能体)能力。
8、Azure AI Studio平台将推出自定义模型功能,同时数据分析平台Microsoft Fabric增加了全新的实时智能功能。
9、向客户开放其自研芯片定制CPU Azure Cobalt预览版,性能最高提升40%。
10、宣布其将成首批提供英伟达Blackwell GPU的平台,发布配备RTX GPU的Copilot+PC;与AMD扩展合作,Azure将成为首个提供加速器ND MI300X V5通用版的云平台。
纳德拉提到,过去一年最突出的(趋势)是开发者如何利用大模型的能力去改变世界。
目前,微软已经建造了三个平台:首先是Microsoft Copilot,成为用户的日常助理,帮助用户采取行动;第二个是Copilot堆栈,帮助开发者更快构建AI应用、解决方案;第三个是Copilot+PC,第一台AI PC。(微软向苹果开火!AI PC全家桶装上GPT-4o,AI实时聊天教你打游戏,高通赢麻了)
值得一提的是,在大会进行了超过2小时的最后时刻,OpenAI CEO萨姆·阿尔特曼(Sam Altman)现身,他透露新模式和整体智能将是OpenAI下一个模型的关键,同时速度和成本也很重要。
纳德拉称,微软今天将发布50余项更新,按照Copilot堆栈的结构顺序来解读。
在AI基础设施方面,纳德拉谈道,为贯彻可持续发展,到2025年,微软所使用的能源将100%来自零碳能源。
去年11月,微软发布了首个云上AI超级计算机。现在,Azure的超算能力提升至30倍。
在与英伟达的合作上,双方覆盖了从云、AI平台到App应用的全栈流程。
微软将成为首批提供英伟达Blackwell GPU的平台,在未来几个月将发布配备RTX GPU的Copilot+PC,为游戏玩家、创作者和开发人员提供更高的性能,以应对本地AI工作负载,同时提供微软全新的Copilot+功能。
微软宣布与AMD扩展合作,Azure将成为首个提供加速器ND MI300X V5通用版的云平台,它将提供最佳的GPT-4性价比。
微软Azure Maia也持续更新,其首个集群已上线,正在为Copilot、Azure OpenAI等服务提供算力支持。
微软基于Arm的CPU Azure Cobalt进入公开预览阶段,性能最高提升40%。纳德拉称,Cobalt被用于Microsoft 365中的视频处理和权限管理,已经支持了Microsoft Teams等服务中的数十亿次对话,目前已服务了西门子、Snowflake等企业。
目前已经有超过5万个组织使用Azure AI。纳德拉称,这一切都始于其与OpenAI的战略合作。
微软宣布GPT-4o即日起在Azure AI上普遍可用。这意味着现在任何应用程序、网站都可以变成一个多模态、全双工的会话界面。
比如用户可以在网页中获取Agent的主动询问服务,当得知用户在为露营做准备时会为他提供建议,帮他挑选需要加入购物车的物品。
就在上周,OpenAI推出最新多模态模型的GPT-4o,昨天微软展示了Copilot如何在视频中利用GPT-4o,支持用户分享屏幕或会话以获取Copilot的帮助,无论是辅助游戏、编辑文档还是编程都能胜任。
比如用户在一个游戏中设法制作一把剑,Copilot可以识别用户的屏幕,与用户对话并帮他完成这项游戏任务,比如提醒他“需要一些材料”、“按键盘上的E打开装备库”、“去收集木头、石头等资源”等。
接下来,微软还带来了很多其他模型,包括Cohere、Databricks、Meta、Mistral、 Snowflake等公司的模型都可以在Azure AI获取。微软宣布接下来将从Core42、NTT DATA等平台中引入新的模型。
既要OpenAI,又要Open的AI,微软宣布加强与开源社区Hugging Face合作,将从其引入更多的模型接入Azure AI Studio。
微软不仅在发展大语言模型,还希望领导小语言模型革命。
微软现在正在扩充Phi-3系列小模型的版本,宣布推出具有语言和视觉功能的42亿参数多模态模型Phi-3-vision。它可以对图像进行推理,产生见解并回答图像相关的问题。
微软还将提供一个70亿参数的Phi-3小型模型和一个140亿参数Phi-3中型模型。通过Phi-3,用户可以构建跨Web、Android、iOS、Windows和Edge的应用程序,也可以在本地硬件和云端之间快捷转换。
从基准测试来看,最强开源模型大有易主之势。中杯Phi-3-Medium以14B的参数,性能逼近混合专家模型Mixtral 8x22B和70B参数的Llama 3。
超小杯多模态模型Phi-3 Vision表现也相当出色,以仅4.2B的参数,性能比肩Gemini 1.0 Pro V和Claude-3 Haiku。
今天,微软还宣布推出Phi-Silica这一SOTA SLM,它由专门为NPU和Copilot+PC设计的Phi-3系列构建,提供快如闪电的设备推理和首个Token响应能力。Windows是第一个拥有当下最先进的面向NPU定制的SLM平台。
为了使Windows能够成为构建AI应用程序的最佳平台,微软将于6月推出Windows Copilot库,其中包含多种开箱即用的本地API,以及40多种型号模型,涵盖了从低代码工具到复杂管道,再到完全多模态模型的多个部分。
以Recall体验为例,它依赖于与Windows深度集成的设备模型来捕获屏幕上的上下文,将数据转换为向量嵌入并建立索引,从而支持用户直接回到应用程序过去的位置并进行操作。Edge和Microsoft 365应用程序都已经支持这一功能,很快Recall就会在微软365图表中提取上下文。
Windows Copilot库还提供RAG(检索增强生成)能力,用户可以用它来处理本地数据,在自己的应用程序中使用该能力。
微软宣布即日起,将通过Windows DirectML提供对PyTorch、WebNN框架的原生支持,这意味着Web开发人员终于拥有了一个Web原生的机器学习框架,使其能直接访问GPU和NPU。
此外,微软宣布让微软Teams成为开发人员与AI合作编程的最佳场所,在本周将发布完整的政策公告。
开发者将可以在微软Teams中使用并获取源代码,同时微软宣布推出 “现在见面(Meet Now)”功能,支持Teams团队成员之间在几秒钟内解决问题。此外用户将可以在Teams中使用自定义表情符号。
昨天微软宣布Copilot接入PC,但构建一个强大的AI平台需要的不仅是一个芯片或模型,而是从上到下重构整个系统。
新的Windows Copilot运行时是将Copilot堆栈扩展到Windows系统,Windows Copilot运行时是Windows 11的一个新组成部分。它包括Windows Copilot库、AI框架和工具链,同时它建立在强大的客户端芯片基础上。
Windows Copilot运行时在操作系统方面,用户可以借助Copilot Runtime回溯他们在电脑收件箱中看到的任何东西;照片和绘画方面的应用程序让用户可以使用实时图像生成和一些滤镜效果将想法变为现实。
Copilot是生成式AI时代的第一款热门产品,目前GitHub Copilot已经有超过180万开发者,微软正在授权让开发者都能使用自己的母语访问编程语言和知识。
GitHub Copilot WorkSpace可以根据其对代码库的深刻理解创建规范,然后创建计划,用户就可以执行计划生成代码,这个过程中,从计划到代码,开发者都可以进行编辑,这是一种从根本上构建软件的新方法。微软将在未来几个月内广泛提供这一工具。
同时,微软通过Copilot连接了更广泛的开发人员工具和服务生态系统。
GitHub正在推出第一组由微软和第三方合作伙伴开发的GitHub Copilot扩展的私人预览版。这些新增功能允许开发人员和组织直接在GitHub Copilot Chat中使用Azure、Docker、Sentry等自定义GitHub Copilot体验。
GitHub工程副总裁Neha Batra演示了GitHub Copilot的能力。例如,开发者可以要求它用Java写一段质数测试,但是用西班牙语语音交互。
Created by Tan KW | Nov 17, 2024
Created by Tan KW | Nov 16, 2024
Created by Tan KW | Nov 16, 2024
Created by Tan KW | Nov 16, 2024
Created by Tan KW | Nov 16, 2024
Created by Tan KW | Nov 16, 2024
Created by Tan KW | Nov 16, 2024