|
|
8 g2 }) @. j- w. v
' t" R A% U2 j% s8 ~面向全球数学爱好者和科研机构,计划于年内推出。
2 u& s/ [+ Z& i' B+ y来源|多知网
; x: s9 r$ m. Y2 v K& q9 o. ?作者 |王上
/ y. m8 e( d* _3 S) J图片来源 |Pexels: x* M9 Y1 v$ ^& h) {( m9 z6 a0 R( P
多知网 5 月 5 日消息,多知网获悉,学而思正在进行自研数学大模型的研发,命名为 MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。
9 f6 k' V: Y' Q% j( _' p据悉,学而思已将 MathGPT 作为公司核心项目,由 CTO 田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。2 a2 w1 c# x0 i: Z4 d
01
2 Y6 c% u- g5 o, D% s3 m. { MathGPT 与大语言模型(LLM)的差异) V+ S- e" N) _ a* m6 |5 p" W
8 d, t0 A) @) i! q) R
美国 OpenAI 公司在今年三月份发布了大语言模型 GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个 " 文科生 ",在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。8 B# x+ p/ ?/ X2 b0 y
" 这种不足是由 LLM 模型的自身特点决定的。"学而思 AI 团队负责人介绍,LLM 大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于 LLM 大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研 MathGPT ——数学领域大模型,用自己在数学和 AI 上的多年积累,面向全球范围内的数学爱好者和科研机构,做好 AI 大模型时代的数学基础工作。2 N+ M8 d: y i9 N' p, i6 _/ D7 t7 [
学而思希望通过 MathGPT 弥补和攻克大语言模型的三个问题:第一,题目要解对,现在 GPT 结果经常出现错误;第二,解题步骤要稳定、清晰,现在 GPT 的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在 GPT 的解释过于 " 学术 " 和机械,对孩子的学习体验很不友好。
8 i" m( E$ Z X' I! b. e4 Y' M: {02
2 n- j/ {- L/ T9 I0 \4 K& |/ z4 @( h做 MathGPT,学而思的技术深耕4 U8 ?5 ^! [* L" ?, W
学而思作为获国家科技部批准的 " 智慧教育国家新一代人工智能开放创新平台 " 建设单位,也是教育行业唯一一家人工智能 " 国家队 " 成员,在人工智能领域有着多年的深入研究,早在 2017 年,学而思便成立了 AI lab 人工智能实验室。8 G, }' ]4 R. X1 F
据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思 AI lab 获得各类顶级学术会议比赛冠军 16 项,亚军 6 项;发表国际期刊和会议高水平学术论文 31 篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利 220 余项,授权专利 150 余项,软件著作权 60 余项。
- u! V; Z3 Y# ^/ ^1 d3 y2 r' E4 h5 U7 f
|0 T5 ]4 _5 E5 Y
. E( O( @. d# i4 d+ b学而思 AI lab 在各类顶级学术会议比赛获奖情况
- ^+ c7 B6 d0 j, G2 N( b" 以数学起家 " 的学而思至今已有 20 年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行 MathGPT 训练的必备物料。另外,学而思的海外业务 Think Academy 在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的 IMO 和 AMC 等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在 MathGPT 方向发力也顺理成章。, N8 I# [$ t F, I4 T- w8 T
另据了解,学而思学习机近期将会上线一款 "AI 助手 ",涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该 AI 产品将于 5 月 11 日开启内测。* _, [" R9 h) n$ o' @( @3 e
03
4 n+ }1 m @2 u1 y% Y2 n# C4 D( CMathGPT 的挑战和技术难题( C9 X' u& b8 `# z9 d( a6 G- D! }
如何利用大语言模型服务各行各业是当下社会的焦点问题。比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和 OpenAI 合作,在 GPT 大模型上做微调和接口调用,增强原有的产品体验。但也有一些领域如数学、医学等,对 AI 的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用 LLM 目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。
' f. M4 B/ \8 M+ @以数学领域为例,目前市场上有几个主要流派。比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品,主要利用非 LLM 的传统 AI 技术加上数据库的方式解决数学问题。走 AGI 路线的公司则尝试让通用 LLM" 更懂数学 ",比如 GPT4 在数学任务上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也专门针对数学问题进行调优。学而思选择了另一条少有人走的路,不基于现有 LLM 做微调和接口调用、不做通用 LLM,而是自研基于专业领域的 " 数学大模型 "MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。2 S3 `$ r( c! k- j" O
在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的 MathGPT 大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。
$ r0 ?+ Z8 F& S. O9 a3 o相关阅读: |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|