自现象级AI应用ChatGPT落地至今,作为应用技术商业化大国的中国,在短短半年内,对于这项能照耀未来的技术的商业化探索,堪称气象万千。

对于中国技术公司而言,若无一个类似ChatGPT应用的对标产品,可能难以显示其技术色彩。因此,但凡能数得上号的中国技术公司,截至目前,基本上都发布了各自的类ChatGPT应用。


(资料图)

5月6日,中国式ChatGPT再添新成员:科大讯飞发布星火认知大模型和多行业场景商业应用的AI能力。5月8日,科大讯飞股价涨停,为3月23日以来首次。

推动中国经济繁荣的改革开放,秉持的实用主义原则,其影响也波及了中国科技公司对于新技术的主流态度:新技术能否创造出确定的应用商业价值。有此指导思想,故其对底层技术的热情很少像对新技术的商业应用那样高涨。

但这不等于,中国技术公司缺乏底层技术探索和积累。他们只是需要有人给出这些底层技术极具商业价值想象空间的路径,然后,其应用这种底层创新技术的商业探索落地速度之快,举世无双。

科大讯飞作为一家以NLP语音技术立足的技术公司,自然也不例外——任何技术公司或文化现象,无不受宏观行业环境和历史传统影响。

那么,讯飞星火认知大模型的技术探索是什么?AI商业价值怎样落地?讯飞GPT技术能力如何与之业务匹配?强弱如何?未来这种能力怎样演进?

开放平台:如虎添翼?

5月6日,科大讯飞董事长刘庆峰发布星火认知大模型,并同步发布讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等5项应用成果。其中,讯飞开放平台是构成科大讯飞商业(技术和产业)护城河的关键要件。

科大讯飞2022年财报显示,讯飞开放平台的毛利率为28.23%,同比提升7.02个百分点。在科大讯飞四大业务板块中毛利提升速度最快、升幅最大。

以AI技术为基石,通过“平台+赛道”市场战略,凭借“算法和数据”核心技术优势,科大讯飞在C端、B端和G端的AI领域攻城略地。

据科大讯飞联合创始人、高级副总裁江涛解释,“平台+赛道”,这个“平台”,即讯飞开放平台:“星火认知大模型对讯飞开放平台极具意义。”

2021年10月25日,刘庆峰在合肥发布“科大讯飞开放平台2.0战略”。

与1.0相比,讯飞平台2.0战略新增“行业龙头”,构成新的“讯飞+行业龙头+开发者”三维结构,目的是通过讯飞开放技术平台和工具,结合行业特性和数据,形成数字底座,再通过开发者将数字底座与特定的软硬件环境做匹配,最终形成完整的行业AI数字解决方案。

在这个过程中,开发者数量决定整个开放平台的垂类应用丰富性,开放平台的底层技术能力,决定开发者能用具备怎样强悍能力的技术工具,去开发垂类应用;而行业龙头带动的行业合作伙伴,用RPA(机器人流程自动化:Robotic Process Automation)等工具开发行业应用的易用性和有效性,也与开放平台的工具能力密切相关。

若对“讯飞+行业龙头+开发者”三维结构做个解构,即由科大讯飞提供AI技术、大数据平台和相关深度学习训练算法工具,行业龙头在此基础上提供场景、专家知识和各类业务模型。之后,由双方通过贯穿AI算法的业务模型形成数字基线底座。

有了基线底座,讯飞开放平台行业开发伙伴,可以做具体场景匹配软硬件环境的技术应用工具,完善和做各种流程开发,最终形成具体的可应用的行业解决方案。

因此,一旦讯飞星火认知大模型集成到开放平台,则平台工具能力之提升幅度,将难以想象。江涛说,“大模型进一步集成到开放平台后会带来整个开放平台能力的跃升,我们会进一步地赋能这些开放平台的合作伙伴。”

刘庆峰在5月6日披露,讯飞开放平台实名认证的开发者数量,已经突破400万,行业合作伙伴突破500万大关。2021年10月25日,实名注册开发者数量是265万。

讯飞星火认知大模型的底层能力,怎样赋能讯飞开放平台的行业伙伴?刘庆峰说,讯飞将开放插件。“合作伙伴、开发者可分享这些插件,以深入至大模型。这样用星火大模型就可以直接用到这些插件能力。”

随着应用的深入,可集成越来越多的专业插件:对行业插件安全性有要求的B端用户,可用星火认知大模型做富有针对功能的插件,以供其内部使用或做平台共享。这是科大讯飞To B策略的体现:建立行业生态圈,共同繁荣整体行业。

刘庆峰透露,“已有36个行业、超3000家企业跟我们达成了合作的明确意向。”

解构“1+N”的AI应用

美国OpenAI公司推出的ChatGPT应用,AI技术名称是GPT,而“Chat”则是应用手段或形式。通过Transformer架构做AI技术开发,应用终端的AI能力源自底层AI技术对语义大模型(LLM)的训练。

概括而言,OpenAI的ChatGPT-3.5(2022年12月推出的初代版),就是用Problem Models(问题模型)加上1750亿个参数/节点,以之为基础提供巨量、有监督的学习数据,借助Transformer架构,“投喂”给AI语义训练大模型(LLM),做出的AI应用效果。

科大讯飞星火认知大模型,作用相当于OpenAI训练语义大模型(LLM)做出的AI应用效果集成和问题模型的集合。这在2022年12月15日启动的科大讯飞认知大模型专项攻关中,属于“1”,而这个“1”落地的行业垂直领域或场景,被概括为“N”。

因此,科大讯飞的类ChatGPT应用,结构就是“1+N”。“1”是指星火认知大模型(可认为是通用AI技术底座),“N”即落地多场景。若将之从商业角度做个命名,则可称为“1+N”认知智能大模型技术及应用战略。

其中,通用认知AI技术底座包括七项能力:多层次跨语种语义理解、多风格多任务长文本生成、多模态输入和表达能力、多功能多语言代码能力、多题型可解析数学能力、情境式思维链逻辑推理和泛领域开放式知识问答。

从商业价值角度,通过通过AI技术底座,科大讯飞为各个行业设计行业技术工具,并且以之构建AI应用样板间,最终1和N形成飞轮效应,实现商业价值的正向循环。

科大讯飞主要业务分产品有四个类型:即教育产品和服务、开放平台、信息工程和运营商相关业务。

星火认知大模型除了集成至讯飞开放平台,另外重要的一极是使能讯飞软件和硬件产品,以提升或重构讯飞的业务竞争力。

这些软硬件产品所属场景即处于“1+N”中的“N”。5月6日,科大讯飞推出星火认知大模型的四大行业应用成果:教育、办公、汽车和数字员工。

其中,教育和办公方面,属于人机交互。讯飞主要落地形式是软硬件,如学习机、办公本或语音遥控器,以及讯飞听见(专业级语音转文字效率工具)。江涛说,“我们相信大模型的智慧涌现一定会带来下一代人机交互的新的入口。”

科大讯飞2022年财报显示,教育产品毛利率是49.39%,在科大讯飞营收中的占比32.74%,均为最高。

与To C相比,市场更关注讯飞医疗中的AI辅助诊疗,这块属于To B场景。据江涛透露,科大讯飞的智医助理迄今为止已做了5.8亿人次的AI辅诊,中国300多个区县的基层医疗机构的医生正在使用。

一旦讯飞医疗大模型推出,将更好地帮助医生提高病历质检、辅助诊断、方案推荐和用药管理等方面的水平。这属于B端中的C端应用,比如也能做个人保健咨询、健康管理和疾病管理。

但在5月6日,讯飞医疗大模型没有推出。对此,刘庆峰表示,“因为需要相关法规,所以我们应对医疗专业领域模型更加谨慎。下一步我们会跟医疗机构合作,通用大模型也会集成医疗专业知识。”

刘庆峰透露,科大讯飞将会在今年讯飞1024开发者大会上正式对外发布医疗大模型。

历史积累和未来目标

虽然科大讯飞的“1+N”认知大模型专项攻关于2022年12月25日启动,但讯飞在AI技术领域的技术积累已有十多年历史。

从AI技术发展路径看,ChatGPT也不是最新的技术成果。在理论上,ChatGPT没有更多创建——核心技术在2017年就已出现:由谷歌创建的Transformer神经网络架构,其革命性在于能让AI“听懂人话”。

科大讯飞星火认知大模型的底层AI技术起始源点,始于2011年成立的语音及语言信息处理国家工程实验室。这比ChatGPT应用的底层AI核心技术“Transformer神经网络架构”早了整整6年。

语音及语言信息处理在大模型中的作用是什么?刘庆峰说,“讯飞星火认知大模型本质上是一次对话式通用智慧的涌现,语音和语言的核心能力是基础条件,科大讯飞是中国(该领域)的国家队。”

讯飞取得和谷歌一样的认识,也就是让AI“听懂”人话的时间节点是2014年,也比谷歌早3年。

那年,科大讯飞推出讯飞超脑计划,明确提出要让机器像人一样,具备能理解会思考的能力。2022年1月,刘庆峰在科大讯飞年度总结计划大会上,宣布讯飞超脑2030计划:要让懂知识、会学习、能进化的通用人工智能技术,以机器人的实体形态或虚拟形态,进入每个家庭。

坦率地说,在OpenAI推出ChatGPT应用前,科大讯飞在AI领域的技术探索和落地成果相对“碎片”——这也是中国技术公司的“共性”——缺乏像ChatGPT这样的AI能力验证应用体系。ChatGPT不仅仅是个AI应用,也是一个商业化体系应用的象征性标杆。

因此,OpenAI实际上起的是验证AI技术商业价值的作用,以及引领AI应用方向。一旦方向确立,大模型的海量场景应用验证得以点亮,素有积累但找不到大规模有效价值应用明确方向的中国技术公司,其类ChatGPT技术开发和场景应用激情,就如脱缰野马,不可遏制。

在2017年这个关键节点,科大讯飞的AI技术积累到什么程度?他们让机器在全球首次通过国家执业医师资格考试综合笔试测试,测试成绩超过96.3%参加考试的医生。

两年后2019年,在斯坦福大学发起的国际著名的SQUAD机器阅读理解比赛中,科大讯飞让机器在英文阅读理解中首次超过人类平均水平;2022年,在艾伦研究院组织的Open Book QA知识推理比赛中,讯飞机器单模型首次超过人类平均水平。

或许意识到体系对于AI“听懂人话”技术目标达成的重要性,科大讯飞在5月6日也推出了AI应用体系,主要用于评测AI技术能力。目前,这项体系已覆盖7大类、481个细分任务类型的通用认知大模型评测。

比如,AI技术到底发展到什么程度?下一个发展应该往哪里走?技术距离实用是不是已经达标?还有哪些工作要做?

据刘庆峰介绍,目前讯飞星火大模型在文本生成、知识问答、数学能力三项能力已超越ChatGPT,“英文如果满分以5分计算,Chat GPT现在是4.48分,我们已达到4.29分。”据刘庆峰透露,“当前讯飞星火认知大模型的文本生成、知识问答和数学能力,已超过ChatGPT。”

根据既定计划,到今年10月底,讯飞星火认知大模型目标中文能力超过Chat GPT的水平,英文能力相当。

关键词: