京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 586|回复: 0

GPT-4 震撼空降,谷歌「紧追」微软有点难

[复制链接]

1629

主题

713

回帖

7028

积分

论坛元老

积分
7028
发表于 2023-3-16 12:59:46 | 显示全部楼层 |阅读模式 来自 陕西西安
/ U2 _; h2 r4 C/ E; R

1 @! U; w1 r1 {( ^图片来源 @视觉中国  R9 k3 h- |  P0 S& S$ ~$ t7 Y
文|湃客、另镜,作者|刘雨婷,编辑|陈彦旭、丁珏汭
' ?) b. P6 j5 n* {6 G  K+ P: m海内外互联网大厂与创业者,正陷入一场有关 ChatGPT 的竞赛中。& y: c- a& k! J! v2 Q% K  p
3 月 15 日凌晨,OpenAI 推出 GPT-4 多模态预训练大模型,除语言文本外,还支持图像识别输入,以文本形式输出。
6 c' A6 S* [4 J; E5 j0 `' v在发布会上,官方人员演示 GPT-4 可以识别手绘网页草图,并仅用十秒钟左右,就根据草图写出网站代码。
* X' E& C" _$ @+ c2 M在 OpenAI 发布会前几个小时,谷歌刚刚宣布推出一系列生成式 AI 功能,用于其各种办公软件中,包括谷歌Gmail、Docs(文档)、Sheets(表格)和 Slides(幻灯片)。
: i! a3 j1 U4 K' L* ~+ F在外界看来,这是谷歌意图抢在微软 3 月 16 日预期官宣 GPT 接入 Office 之前,展现自己的成果。( Q; t4 S: U) G- G; \( B6 @
作为直接竞争对手,谷歌已走在 " 对抗 " 微软与 OpenAI 的最前列。但随着 OpenAI 空降官宣 GPT-4,谷歌又陷入下一场追逐战中。1 w) L- J+ \/ Q2 U* b3 V: d# q
ChatGPT 是 AIGC 领域的颠覆性产品,在上线后吸引了全球关注。将 ChatGPT 嵌入微软 Bing 搜索引擎后,Bing 日活首次突破 1 亿,直接影响到谷歌的用户基础。
' s  a3 Q$ u" {2 q) w面对微软的步步紧逼,苹果、Meta 和亚马逊等公司也正计划重新评估其人工智能的开发策略。
1 }" q: ]+ R; e; O: }# c3 月 16 日,百度将率先发布 " 中国版 ChatGPT" 文心一言。国内创业公司和互联网大厂,都迅速跟进,不愿成为新技术掉队者。在王兴、王慧文再度携手、开启 AI 领域创业的同时,快手前 AI 核心人物李岩也投身 " 多模态大模型 " 创业。2 r* Y: I: b  h$ f/ }
随着 OpenAI 发布 GPT-4,多模态大模型已成为最新的技术变革方向,人工智能正迈入 "iPhone 时刻 "。正如 iPhone 带来的智能手机变革,GPT 模型的出现又将影响未来 AI 领域的发展方向。) w; p7 \9 j3 l, q5 T8 M
如今,微软与谷歌竞争的不只是当前的市场,还有未来 AI 时代的定义标准与话语权。" m$ Y, u2 e& c- b4 C& \: h& p
GPT-4:多模态变革
% n( k; ]) S- p4 P面对 ChatGPT 的步步紧逼,海外大厂都在追赶和阻击微软,以动摇其目前在人工智能领域的领先地位。5 G0 N* y- t6 u" ~' y/ F6 B
在 " 对抗 " 微软与 Open AI 方面,谷歌已经走在前列。知情人士透露,谷歌高级管理层已经宣布 " 红色指令 ",其中要求在几个月时间里将 " 生成式人工智能 " 技术集成到谷歌的所有重要产品中。' [+ d) c8 L+ ~9 j9 `/ [9 t
去年 12 月,谷歌母公司 Alphabet 就曾发布 " 红色警告 ",已处于半退休状态的创始人拉里 · 佩奇和谢尔盖 · 布林重新回到公司,商讨制定了人工智能后续战略,并决定将聊天机器人纳入搜索引擎,以应对 ChatGPT 的威胁。
5 p5 ~& z* k; C8 L, [% {( g5 C但从微软和 OpenAI 近期举动来看,单纯的文本交互已无法满足其在生成式 AI 方向的野望,包含文本、图像、视频处理等在内的多模态大模型已成为其最新的技术变革发力点。
0 o' w9 u# j& o2 r7 h在 GPT4.0 发布前,今年 3 月初,微软发布了多模态 AI 大模型 Kosmos-1。微软 AI 技术专家 Holger Kenn 表示,多模态 AI 不仅能够将文本转变成图像,还可以转变成音乐和视频,尤其在编程领域,AI 模型能够更轻松的生成样板代码。. j" `) _8 G# F, Y
在微软发布 Kosmos-1 后,3 月 7 日,谷歌和柏林工业大学的团队推出了 PaLM-E 视觉语言模型,参数量高达 5620 亿,约为 GPT-3 参数量的三倍。& A0 v0 F: t( @$ u0 d& E! t* p
据悉,PaLM-E 大模型是在语言类模型 PaLM(5400 亿参数)和视觉类模型 ViT(220 亿参数)的基础上开发的。其不仅可以理解图像,还能理解、生成语言,以及将两者结合,处理复杂的机器人指令。
: Z5 l( z% u7 s谷歌与微软的较量不仅体现在生成式 AI 的场景应用层面,也聚焦于大模型底层实力。但随着 GPT4.0 的发布,多模态大模型的能力得到进一步展现,谷歌的声量又再度落于下风。% C4 q1 c! A" e" Q# y9 b0 _
今天凌晨,OpenAI 发布最新 GPT4.0 多模态大模型,引爆全网讨论。与前一代相比,最新的 GPT4.0 可以识别图片输入;文字输入上限提升至 2.5 万字;回答深度和专业性、推理和风格变化能力也显著提高。# _4 C( I7 N+ o9 x1 ^7 S
OpenAI 称,GPT-4 在各种专业学术基准上有着人类水平表现。在最新测试中,GPT-4 通过了模拟律师考试,得分约为前 10%,而 GPT-3.5 得分约为倒数 10%。GRE、SAT 数学考试成绩也有大幅提升,击败了 80% 以上的人类答题水平。- |$ s7 j3 t% B4 [& P  z- y
GPT-4 也拥有更高级的推理能力。用户在 GPT 上传了一张梗图,问这张图为什么会引人发笑:
* J- W+ e* O) T6 x" a: S+ q# M
3 l0 c) N+ U: A4 K
4 @- m% p. T8 t5 r/ {9 h# A: _
+ P& b& y) |3 b5 R! m+ F+ F) vGPT4.0 一一给出回答:( C4 [! d6 n( O0 P! @7 C
% ?3 `# B  J0 ]- w5 }' N9 N) d9 o

: t/ q0 {7 ~0 ~8 g3 R, H& R- `2 E9 {- `
在官方的示例中,GPT-4.0 可以 10 秒钟编写网站代码,可以编写剧本、计算物理题、速读专业论文、分析数据图表,甚至可以解读搞笑图片与漫画。
9 U4 m$ p! i0 [* ~在业内人士看来,生成式 AI 的产生本质上是一种生产力革命,其不仅是工具,而是直接成为生产要素的重要部分。以文本、音频、图像和视频为处理对象的多模态大模型和生成式 AI,势必会对未来的内容创作、数据处理等相关行业带来巨大冲击。% p! b6 w2 U4 p+ M  `
AI 对传统工作方式的革命和颠覆或许即将到来,未来最核心的竞争力和技能可能不再是编程,计算,甚至分析能力,而是和大模型的对话能力。7 K8 Q0 h. V( O0 C7 Y4 }" O& @
现在人工智能正处于一个决定性的时刻,就像 90 年代的互联网以及 iPhone 带来的手机变革,人工智能正朝着大规模采用的方向发展,ChatGPT 类的大模型正推动数据革命。
6 ^: u+ d+ v# W美国银行战略分析师预测,人工智能正迈入 "iPhone 时刻 ",预估到 2030 年会为全球经济带来 15.7 万亿美元的增长。/ r8 X2 x+ y3 ]  p& G7 q
在过去,苹果曾经两次定义硬件工具的交互方式:PC 时代的 Apple Lisa 电脑,是首次采用图形用户界面 ( GUI ) 和鼠标的个人电脑;到智能手机时代,iPhone 定义了触控交互。! b  Y* C7 I# S' g! t; i0 c
如今,ChatGPT 已经改变了人与文字、知识的交互方式,而下一步,ChatGPT 类的大模型又将影响未来 AI 的发展方向和人类的工作方式。
8 O4 F; [8 q; Y: y' g# L/ H+ j1 NChatGPT 开放端口是创业机会吗?
% U& S3 ?* ]( U- E' V# U5 H! a作为 OpenAI 背后的投资者,微软的相关产品已经取得了初步成果。
8 n0 _% s, h# X3 T' a微软在 GPT-4 发布后第一时间表示,新的 Bing 已经基于 GPT-4 技术运行,这是为搜索产品量身定制的模型产品。
! u! [, }9 J  u  W在集成 ChatGPT 的 Bing 搜索引擎推出一个月后,微软宣布 Bing 每日活跃用户首次突破 1 亿,每天大约有 1/3 的必应用户与 BingChat 进行交互。此外,Bing 在移动设备上的使用率也有所增长,BingChat 应用使得每日活跃用户增加了 6 倍。8 z+ K5 R2 R! ]+ c2 B- F- g
此外,微软宣布,将于 3 月 16 日召开 " 工作的 AI 未来 " 发布会,预计将展示其类似 ChatGPT 的人工智能,如何在 Teams、Word 和 Outlook 等 Office 生产力套件中发挥作用。# h2 I  B) g, Q3 S3 ~
从 Bing 浏览器到 Office 办公套件,微软正筹划将 AI 赋能更多 C 端、甚至 B 端用户。据悉,微软计划将 ChatGPT 背后的技术整合到其 Power Platform 平台上,允许用户在几乎不需要编码的情况下,就能开发自己的应用程序。
" c" B7 l2 J5 o  f3 D! `) ?% i" 我们不想把它打造成定制产品,它一开始是一个定制产品,但我们总是想办法把它打造成通用型产品,这样任何想训练大型语言模型的人都可以利用同样的改进," 微软负责云计算和人工智能的执行副总裁斯科特格思里曾对外表示," 这真的能够帮助我们成为使用更广泛的人工智能云。"
- v9 Y+ ]. V! I3 f) _对旗下平台进行 AI 赋能是互联网大厂的优势,微软、谷歌、BAT 等互联网大厂具备充足的资金和技术支持,同时具备庞大的 C 端流量入口。对于他们来说,开发自有大模型一方面可以探索更多的场景和商业模式,另一方面也是为了保证自身对于用户的竞争力和行业话语权。
8 w3 k# Z& L: w6 g& v9 O但对于资金和技术实力缺的企业或创业者来说,利用大厂开源模型,优先采用接口模式,结合自身产品,将重心放在更具体的需求场景上,或许才是最优的选择。4 {+ W5 U+ p6 R: X
ChatGPT 之父、OpenAI 创始人山姆 · 阿尔特曼在 3 月 10 日的摩根士丹利大会上透露,OpenAI 将重点开发一个平台,向开发者开放 API 接口,并创建类似 ChatGPT 的应用程序,第三方开发者被允许通过 API 将 ChatGPT 集成到他们的应用程序和服务中。6 i6 n1 k* {' H+ M
OpenAI 将推出一系列工具,让用户可以更好地控制这套生成式人工智能系统,并针对通用用户用例和具体用户用例进行改进。
) ]1 V2 r3 Z& L, R: A! W最新 GPT-4 发布后,OpenAI 把 ChatGPT 直接升级为 GPT-4 最新版本。同时,OpenAI 开放了 GPT-4 的 API。
8 a8 Y' l' W. B) XChatGPT Plus 付费订阅用户可以获得具有使用上限的 GPT-4 访问权限(每 4 小时 100 条消息),可以向 GPT-4 模型发出纯文本请求,图像输入处于研究预览阶段,仍不完全公开。. T$ J$ o( J/ `6 k( Q' w

' x! H* ^8 f6 ?$ A
  ]2 V7 u9 D! _$ j( C6 ~2 L. m0 ?- y+ E) K
用户可以申请使用 GPT-4 的 API,OpenAI 会邀请部分开发者体验,并逐渐扩大邀请范围。该 API 的定价为每输入 1000 个字符 ( 约合 750 个单词 ) ,价格为 0.03 美元;GPT-4 每生成 1000 个字符,价格为 0.06 美元。# N7 G) U3 O% O# @
与前一代模型相比,新推出的 GPT-4 API 价格提高不少。3 月 2 日,OpenAI 刚刚放出 ChatGPT API,比之前的 GPT-3.5 模型便宜 10 倍,每生成 1000 字符,价格为 0.002 美元,即 2.7 美元就可输出 100 万个字符。0 o6 \8 |. |2 w) G: E
自去年 12 月以来,ChatGPT 对于处理查询的方式进行了优化,使成本降低 90%,最终带来了面向用户的大幅降价,GPT-4 或许也能在将来重复这一过程,这将大大降低开发人员利用 ChatGPT 赋能自身产品的难度。7 M1 x: ~4 _/ c% I* v# P& K
当调用 ChatGPT 模型的能力不再是门槛,对于场景赛道的理解、商业模式的构建能力就成为企业的核心竞争优势。1 e* ^+ g+ \) O7 o$ R" y; ?" {5 q
北极光创投合伙人张朋在一场直播中向创业者提出建议,产品和服务不能仅依靠调用大模型的能力,还要实现差异化,比如工具层 + 应用层结合在客户的场景落地,让客户买的是场景的价值。
) z0 I- W& z! h9 [! r0 Z0 I张朋认为,从变现角度,最好从应用层下手," 以 Pass 为例的中间层的很难盈利,大多客户难以从通用模型框架自我研究出解决方案,还需要提供细化到应用的服务,B 端客户需要的不是工具,是解决方案。"" C  e) H" L) U# ?3 p: G0 }* G
千万美元入场券
* _9 n4 Y0 P/ W& P; p/ o& [" p. ^美团联合创始人王慧文对于 AI 的态度很明确," 关于人工智能,到现在为止,我只有一个判断,必须参与。"
, j: e4 C, y. |/ S- y6 Q8 t7 S0 [" k今年 2 月,王慧文在朋友圈发布 " 组队帖 ",要带资 5000 万美元进入 AI 赛道,设立光年之外科技有限公司,资金占股 25%,其余 75% 的股份用于邀请顶级研发人员,打造中国 Open AI。
8 {' P" }. L. r据王慧文透露,光年之外估值达 2 亿美元,下轮融资已有顶级 VC 认购 2.3 亿美元。3 月 8 日,美团创始人王兴在朋友圈回应王慧文的宣言,宣布将以个人身份参与王慧文的创业公司 " 光年之外 " 的 A 轮投资,并出任董事。8 E- P& e8 W0 x: {$ ]2 v
在 " 双王 " 三度携手、进场 AI 赛道的同时,众多互联网大佬纷纷开始招兵买马,争相抢夺人才:原京东集团高级副总裁、集团技术委员会主席周伯文同样在朋友圈发布招募研发、产品及算法人员,原搜狗 CEO 王小川对媒体回应正快速筹备 AI 大模型,快手前 AI 核心人物李岩也投身 " 大模型 " 赛道创业,成立 AI 公司元石科技,进行多模态大模型的研发。
2 v4 Q) n5 j0 Z2 K- z: h百度、腾讯、阿里、字节跳动等互联网大厂也在 " 争分夺秒 " 开发自有大模型,百度宣布将于 3 月 16 日推出类似产品 " 文心一言 ",腾讯针对类 ChatGPT 产品已成立 " 混元助手 " 项目组,阿里巴巴则表示其聊天机器人正处于研发内测阶段。  m' T2 Y3 z8 o% x' q  [
在 OpenAI 发布 GPT4.0 后,即将发布文心一言的百度压力再度增加。ChatGPT 的背后离不开大模型、大数据、大算力,大厂想要追赶 Open AI,也需要面临多方面的挑战。
( {, w$ V9 t& @/ ^% ~0 f在算力要求方面,市场调查机构 TrendForce 集邦咨询公布的最新报告指出,如果以英伟达 A100 显卡的处理能力计算,运行 ChatGPT 将需要使用到 3 万块英伟达 GPU,目前英伟达 A100 显卡的售价在 1 万 -1.5 万美元之间,3 万块售价超过 3 亿美金。
& t; N5 ~+ n: ~! O6 e除算力要求高外,需要大量的数据集得到 ChatGPT 训练成本非常高昂。其使用 Transformer 神经网络架构,训练数据来自包括维基百科,以及真实对话在内的庞大语料库,有着多达 1750 亿个模型参数。; A/ [5 T: e% X
根据中信研报测算,ChatGPT 生成一条信息的成本在 1.3 美分左右,是目前传统搜索引擎的 3-4 倍,成本问题中短期内或只能等待硬件成本的继续下降。8 q( l& u& m6 k0 Z; b! }
尽管目前技术上还在追赶 Open AI,但在这条新兴赛道上,BAT 并不想缺席。如今,现在生成式 AI 的商业模式还有待探索,但人的想象力是无穷的。ChatGPT 可以写诗,可以优化搜索,可以回复邮件,可以整理数据,也可以编写代码……' B% [9 Q" g+ Y" I: v4 u
ChatGPT 只是更伟大事物的开始,英伟达 CEO 黄仁勋表示," 你知道你今天做不到,但是当然,它总有一天会做到的 "。
; Y  L( x7 J4 Q无论现在的微软、谷歌、百度等旗下的聊天机器人表现如何,这也只是新时代 AI 技术迭代的最开始,未来的 AI 产业势必会更精彩。
- N% S4 }- E  O3 R更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-14 21:35 , Processed in 0.044946 second(s), 23 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表