生成式AI继续狂飙,正以“天”为单位迭代

生成式AI继续狂飙,正以“天”为单位迭代-创新湾

本文来自微信公众号:甲子光年(ID:jazzyear),作者:刘杨楠、简春燕,编辑:赵健,头图:Pixabay。

ChatGPT带来的AI浪潮,正在蔓延至更广的地方。

近期,GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言接连出场;英伟达、Adobe紧跟其后;OpenAI推出插件功能,点亮“AI的AppStore时刻”。

此外,李开复、阿里VP贾扬清、前字节跳动视觉技术负责人王长虎多为商业大咖入场AI大模型创业;阿里M6大模型前带头人杨红霞被曝加入字节AI Lab,参与语言生成大模型的研发;还有一系列整合AI的新产品雨后春笋般涌现。

相信所有关注AI的人都有一种感受:每天都不知道明天和OpenAI的新产品到底哪一个会先来。

OpenAI 发布重磅研究,80%打工人或被颠覆

3月20日,OpenAI与宾夕法尼亚大学共同探索大型语言模型如何影响美国劳动力市场,研究估计,对于19%的岗位,至少50%的工作内容会被影响;对于80%的岗位,也至少有10%的工作内容被波及。

受到影响较大的职业,包括作家、数学家、新闻从业者、会计与审计、金融量化分析师等。十年前有传统观点认为,人工智能将首先影响体力劳动,然后是认知劳动,最后可能会影响到那些需要创造力的工作。但如今看来,一切都是相反的顺序。

Adobe推出名为Adobe Firefly的 “创造性生成AI模型系列”

3月21日,Adobe推出自己的AI图像生成器,宣布了一个名为Adobe Firefly的 “创造性生成AI模型系列”,并发布了利用这些模型的前两个工具——一个类似DALL-E或Midjourney,用户输入提示后,工具便能创建一个图像;另一个可生成风格化的文本,类似人工智能驱动的WordArt。

对Adobe来说,此次发布意义重大。过去一年,面对AIGC的冲击,作为创意应用领域头部企业的Adobe一直在观望。如今,Adobe终于有所动作。

“我们不害怕变化,我们正在拥抱这种变化,”Adobe公司生成型人工智能和Sensei的副总裁Alexandru Costin说,“我们可以产生高质量的内容,而不是随意品牌和他人的IP”。

Firefly的前两个工具将从3月21日起提供公开测试版。非Creative Cloud用户也可以申请使用,但Adobe将限制进入测试版的人数。

从十年前的深度学习,到如今的AI大模型,英伟达一直在“赢”

3月21日,在年度活动GTC(GPU Technology Conoference)上,英伟达发布了四款AI推理芯片,包括针对生成式AI图像处理、大模型处理的芯片;三个大模型云服务,分别适用于文本、图像和生物研究;超级计算机,以及针对场景优化的应用100个、更新功能的工业元宇宙Omniverse。

在演讲中,黄仁勋又把“AI的iPhone时刻”这句话重复了三遍。在ChatGPT以及生成式AI的热潮下,英伟达的股价今年以来涨幅超过80%,市值接近6500亿美元,一举超过特斯拉。

英伟达也把AI当做一次二次腾飞的机遇。2023年初各大科技公司财报发布,英伟达提及AI 75次,超过谷歌、微软、Meta。本周为期四天的GTC活动包含了650多场会议,由众多研究者、开发者和行业领袖参与,其中仅生成式AI的主题会议就超过70场。

黄仁勋表示:“AI正迎来有史以来最辉煌的时刻。这将是我们迄今为止最重要的一次GTC。”

阿里VP贾扬清被曝离职创业大模型

3月21日,阿里VP贾扬清被曝将离职,创立一家新的AI公司,和他一起创业的还有曾参与ONNX、PyTorch和Caffe2项目的“老战友”。

贾扬清是AI架构领域最厉害的华人之一,他创建了知名深度学习框架Caffe,还是TensorFlow、Pytorch的核心成员和共同领导者。

在阿里时,他曾率队升级了以ODPS和PAI为代表的大数据和人工智能平台产品,支撑了整个集团大数据存储、计算、分析和机器学习的需求;支持发布了魔搭(ModelScope)开源模型社区。

此次,贾扬清团队将打造一个统一、多云和可观察的人工智能平台——不仅是AI基础设施提供商,也关注包括大模型在内的AI应用。

谷歌发布Bard公测,硬刚ChatGPT

3月22日,谷歌宣布正式开放旗下ChatGPT竞争对手Bard的公测,首先将面向美国和英国地区启动。这两个国家的用户都可以在bard.google.com上进行排队等候,随着测试的推进Bard也会逐步在其他地区上线。

总体来看,Bard与New Bing的使用模式和功能基本一致。目前Bard并不具备New Bing能够给AI生成答案提供信息来源,以及基于生成答案自动提供拓展问题的功能。当用户提出一个问题之后,Bard能生成3个不同版本的答案,用户可以根据自己的内容喜好进行选择。

此外,在New Bing上线后曾出现的混乱和批评的前车之鉴下,此次谷歌十分谨慎,在Bard界面上时刻提醒用户:“Bard可能生成不准确或者略带攻击性的信息,但并不代表谷歌官方观点。”

对于ChatGPT的威胁,谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示,谷歌过去一些最成功的产品也并不是第一个推向市场的。在AI的竞争上,谷歌将依然如此。

微软宣布,Bing Chat现已整合Bing Image Creator功能

3月22日,微软宣布Bing Chat现已整合Bing Image Creator功能,允许用户通过文本生成图片,基于OpenAI旗下的深度学习模型DALL-E实现。

此外,微软表示已经整合了OpenAI的安全措施,并添加了额外的保护功能,以此限制图片生成功能被滥用。

GitHub推出全新版本Copilot X,接入GPT-4,解放程序员双手

3月22日,微软旗下代码托管平台GitHub发布了编程辅助工具Copilot的全新版本Copilot X,新版本接入GPT-4,并新增了聊天和语音功能,开发人员用自然语言询问如何完成特定的编码功能。

Copilot X更新的一系列功能包括有:GitHub Copilot Chat,可实现与AI对话完成编码;Copilot for Pull Requests,由AI协助程序员拉取请求;Copilot for Docs,智能文档编写工具;Copilot for CLI,命令工具;Copilot Voice,语音扩展功能,说话就完成程序编写。

此次更新意味着GitHub Copilot编程模型重磅级升级,GPT-4正将程序员从基础性编码工作中解放出来,很大程度上提高了生产力。

Runway发布Gen-2,三秒钟生成大片

Runway成立于2018年,是一家AI视频编辑软件提供商。Runway在文本到图像领域就曾经大放异彩,开发了大名鼎鼎的Stable Diffusion。

今年2月,Runway提出了首个AI编辑模型Gen-1,可以在原视频基础上进行编辑。但部分用户Gen-1的内测都还没拿到,Gen-2就已经来了。Gen-2进一步升级,可以用任意的图像、视频、文本,生成各种风格的创意大片。

Zapier推出自然语言操作

3月22日,无代码自动化平台Zapier推出了一个通用的、人工智能驱动的API,称为自然语言动作(NLA),以将Zapier动作集成到任何应用程序中。

NLA针对基于自然语言的产品进行了优化,例如聊天机器人或使用LLM构建的产品,但任何开发人员都可以使用。

非营利组织Mozilla新成立人工智能初创公司Mozilla.ai,旨在构建开源且“值得信赖”的AI

Firefox浏览器背后的非营利组织Mozilla新成立人工智能初创公司Mozilla.ai。

Mozilla执行总裁兼Mozilla.ai负责人Mark Surman称,这家新成立的公司名为Mozilla.ai,其使命不仅仅是构建任何 AI——它的使命是构建开源且“值得信赖”的AI。

“在可信赖的人工智能领域工作了将近五年,我一直感到既兴奋又焦虑,”Surman表示,“过去一两个月快速发布的大型科技 AI 公告没有什么不同。真正令人兴奋的新技术正在出现——新工具立即激发了艺术家、创始人……各种各样的人去做新事物。当你意识到几乎没有人在看护栏时,焦虑就来了。”

Mozilla.ai由Mozilla的母公司Mozilla基金会的3000万美元种子投资资助,是Mozilla基金会的全资子公司——很像 Mozilla Corporation(负责开发 Firefox 的组织)和 Mozilla Ventures(Mozilla基金会的VC基金)。其董事总经理是Moez Draief,他曾任华为诺亚方舟人工智能实验室首席科学家、凯捷咨询公司全球首席科学家。

值得注意的是,Mozilla.ai不是非营利组织。“最大的问题是,有多少新的、规模较小的值得信赖的 AI 初创公司能够保持独立?” Draief表示,“很明显,亚马逊、谷歌和微软等巨头的云平台正急于整合人工智能领域,所有的钱都是从这里赚来的,小公司很难不被卷入这种整合。”

阿里M6大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发

3月22日,阿里M6大模型前带头人杨红霞被曝加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发,直接向字节跳动副总裁杨震原汇报。目前,字节跳动尚未出面证实该消息。

杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson;在人工智能领域国际会议、顶级期刊有近百篇顶级论文;曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。

2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。

由于达摩院AI大模型还未找到实际落地场景,加上大厂降本增效需求迫切,大模型无法得到更多支持,这也间接导致包括杨红霞在内的多位顶级人才离职,如智能研究领域负责人金榕、城市大脑实验室负责人华先胜。

腾讯高管:AI大模型是增长的加速器,会进一步投资

3月22日, 腾讯发布2022年财报。在晚间的电话会议上,针对市场热议的人工智能和ChatGPT相关话题,腾讯高管表示,生成式AI可以用来提升腾讯旗下旗舰产品的用户体验。未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式AI纳入微信和QQ。

腾讯高管进一步表示,对于腾讯而言,AI和大模型是一个增长的加速器,会帮助改善现有业务,加速商业化,腾讯会在资源上进一步投资,来建立腾讯自己的大模型,同时会确保打好打牢模型建设的基础。

微软协作平台Micro Loop上线,剑指Notion AI

3月23日,微软协作平台Loop官方账号宣布Microsoft Loop正式开启公测,并同步开放公众预览版下载。无需Waiting list,用户现在就可以登录Microsoft Loop并直接体验。

尽管Loop对标Notion AI,但在用户体验上,Loop远不如NotionAI。

百度回应网友对文心一言文生图功能的反馈

文心一言推出后,因文生图功能不够准确,许多网友开始调侃“文心一言”,甚至开始用文心一言生成的图片做起了”看图猜词的游戏。更有甚者,有人开始质疑百度文心一言并非自研,只是套在国外模型上的一个空壳产品。

3月23日,有消息称李彦宏接受采访时表示,中国基本不会再出现一个像OpenAI的公司了。李彦宏称,OpenAI 之所以诞生是因为美国大厂都不看好这个方向(所以没人竞争),但现在中国大厂都看好AI大模型,所以都在做这个方向。表示,创业公司重新做一个ChatGPT没有多大意义,基于大语言模型开发应用机会很大,所以没有必要再重新发明一遍轮子。

此外,李彦宏还回应了文心一言发布会为何用录屏的问题,他表示,他是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来有两个因素让他改变了主意:“一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。”

前字节跳动视觉技术负责人王长虎加入AI创业大潮

据报道,前字节跳动视觉技术负责人王长虎近期将于龙湖集团离职,并即将组建新的创业团队。

王长虎的创业方向将聚焦于生成式AI的视觉多模态算法平台,并基于过去近20年顶级的学术研究及技术应用能力,赋能视觉相关的各大垂直应用场景。

此前,字节跳动的官方介绍也显示,王长虎于2017年加入字节跳动人工智能实验室担任总监一职,主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。

王长虎完整参与了抖音和TikTok等视频类产品从0到1的建设和发展,并搭建了数百人的视觉技术和产品团队,建设了视觉技术和业务中台,带领团队将相关技术广泛应用到字节跳动全线产品中,为集团各产品提供AI技术支撑和业务解决方案,包括今日头条、抖音、TikTok等,覆盖了视觉相关产品内容生产与消费的全流程。

OpenAI推出插件功能,ChatGPT“有了联网能力”

如果说ChatGPT是AI的“iPhone”,那么3月24日OpenAI推出的插件功能,就是“iPhone的App store”。

在目前已实现的“初步功能”来看,ChatGPT已经可以具备了三项能力:

● 访问最新信息,比如体育比分、股票价格、最新消息;

● 检索知识库信息,比如公司文件、个人笔记、运行计算;

● 代表用户执行操作,比如订机票、订餐。

目前,插件系统还处于alpha测试期,首批参与插件创建的厂商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。其他使用插件的开发者可以申请进入候补名单。OpenAI表示,在了解更多情况后将逐步开放访问范围。

OpenAI 还自己托管了两款插件,其一为网络浏览器,其二是代码解释器。OpenAI 开源了一款知识库检索插件的代码,任何开发者都可以借此托管用于增强 ChatGPT 的信息。OpenAI 将插件比喻成语言模型的“眼睛和耳朵”,能帮助模型访问因为较新、较私人或较具体而不宜包含在训练数据内的信息。为了响应用户的明确要求,插件还能帮助语言模型切实执行安全、受控的操作,从而提高整个系统的实用性

一位资深程序员感叹道,ChatGPT的插件接口可能是一生中见过最疯狂、最令人印象深刻的。

刚刚回归OpenAI不久的特斯拉前AI主管Andrej Karpathy则表示,GPT类模型是一种运行在文本上的新型计算机架构,它不仅可以与我们人类交谈,也可以与现有的软件基础设施“交谈”,API是第一步,插件是第二步。

本内容为作者独立观点,不代表创新湾(ID:EnnoBay)立场。如有异议,请与我们联系。创新湾聚焦新科技、新产业领域,致力于记录中国科创力量,让更多人洞见未来。(报道、转载、进群,联系微信:EnnoBay2020)

生成式AI继续狂飙,正以“天”为单位迭代-创新湾

生成式AI继续狂飙,正以“天”为单位迭代-创新湾

扫码进群

您的浏览器不支持 HTML5 canvas 标签。 下载图片