AI一周见闻：OpenAI要开大模型商店；LLM最新守擂赛排行：封闭完胜开源；IBM牵手Adobe，打造最懂企业的“设计师”

本周要点

(资料图片)

见智视角

1、OpenAI即将推出大模型App商店，想与微软争夺生态红利；
2、腾讯云推出MaaS，成为客户一站式服务的理想平台；
3、大模型最新排位赛，GPT-4稳居榜首，全新330亿参数「Vicuna」位列开源第一；

AI 应用

1、IBM牵手Adobe，打通企业设计需求和生成式AI之间的壁垒；
2、Midjourney更新5.2版本，无限扩展原始图像突破行业天花板；
3、最新版Stable Diffusion XL 0.9，构图细节有质的飞跃；
4、以后新闻都是AI写的？如何辨别AI创造虚假新闻是一个更大的挑战；
5、MR应用《Deskucchi》已上线，情感交互类助手需求会很大；
6、即将推出AI虚拟宠物饲养平台，多样化情感需求受关注；

见智视角

1、OpenAI即将推出大模型App商店，想与微软争夺生态红利

OpenAI深夜放大招，Sam Altman表示将打造史诗级LLM「应用商店」。打通所有ChatGPT应用，彻底抢占AI模型生态。微软在5月刚刚发布了史上最牛的插件系统。OpenAI的LLM应用商店可谓是直接对轰微软，强行抢占生态市场。

见智点评：

大模型通向应用软件的市场红利还有很大的空间，就连一向不以盈利为目的的OpenAI也眼红了，想要来应用市场分一杯羹。预计OpenAI的LLM App store会有不错的反响，毕竟ChatGPT目前持续火爆的用户量是一个很好的保障，但还不足以对微软生态有非常严重的冲击，毕竟在应用端微软的实力是不容小觑的，当时OpenAI和微软合作也是看中了微软的市场影响力。

2、腾讯云宣布推出MaaS，成为客户一站式服务的理想平台

腾讯云宣布推出MaaS（Model-as-a-Service)大模型服务，依靠腾讯云TI平台建造行业大模型精选商店，基于腾讯HCC高性能计算集群和大模型能力，为客户提供一站式大模型服务。

见智点评：

腾讯云从保护企业数据产权和隐私的角度，为客户提低成本、方便快捷的大模型服务，结合自身算力优势，从模型、数据、应用几个维度来打通企业应用大模型的困难。针对不同的应用场景，提供更适配的算力网络和智能应用助手，比如AI代码助手、会议助手等等。更重要的是，我们观察到MaaS服务可以满足客户模型的预训练、模型精调、智能开发等多样化需求，并且支持客户加入私域数据进行训练，极大的解决了企业对大模型数据安全的担忧。

3、大模型最新排位赛，GPT-4居榜首，全新330亿参数「Vicuna」位列开源第一

UC伯克利主导的「LLM排位赛」迎来了首次重磅更新！目前参加排位赛的模型已达到28个，本次排位增加了2个全新的评价标准。结果显示：在全新的评价系统下，GPT-4依然稳居第一，而GPT-3.5则成功夺回了第二的宝座。UC伯克利最新发布的330亿参数Vicuna进军第五，小幅领先微软华人团队开源的300亿参数WizardLM模型。

此外，市面上现存的评估方式在评估LLM的人类偏好时，存在着明显的不足；因此本次评价标准新增了MT-bench测试；并且用LLM给LLM打分。

MT-Bench是一个经过精心设计的基准测试，包含80个高质量的多轮问题。8个主要的类别：写作、角色扮演、提取、推理、数学、编程、知识I（科学技术工程数学）和知识II（人文社科）。其中，每个类别有10个多轮问题，总共160个问题。

见智点评：

MT-Bench可以作为对聊天机器人竞技场的质量控制补充。采用MT-Bench测试后的结果非常鲜明地显示出：GPT-4与GPT-3.5/Claude之间，以及开源和专有模型之间，有着明显的性能差距目前即便是最好的开源大模型仍旧很难达到封闭大模型的性能；GPT在各方面的能力仍旧是最好的。

AI应用

1、IBM牵手Adobe，打通企业设计需求和生成式AI之间的壁垒

IBM在官网宣布扩大与Adobe的合作伙伴关系，帮助其生成式AI产品Adobe Sensei GenAI和 Adobe Firefly加速场景化落地和应用进程。

Adobe的企业客户将有机会与IBM的咨询专家互动，其中包括超过21,000名数据、人工智能和体验方面的顾问。同时，IBM还将推出全新的Adobe咨询服务组合，旨在为客户提供安全可靠的生成式人工智能环境，并帮助他们在日常工作、供应链管理和艺术创作过程中更好地应用生成式人工智能。此服务组合还包括技术创新和功能迭代，为客户提供全面支持。

见智点评：

基于IBM和Adobe市场地位和庞大的客户存量，双方的合作能够为更多垂直应用领域提供更好的生成式AI解决方案；尤其是IBM的专家咨询能够为企业提供创新、前沿的战略，与Adobe合作相当于提供给模型训练最关键的Propmt，打通企业需求和创作设计之间的壁垒。

2、Midjourney 更新5.2版本，无限扩展原始图像突破行业天花板

此次5.2版本最亮眼的更新在于zoom out功能，它可以无限扩展原始图像，同时保持跟原始图像的细节相同。比如做出无限宇宙动画、无限放缩图片。

此外，Midjourney 5.2 版本中还提供了其他功能，例如“Make Square”，可用透视风格压缩图片长宽，使之成为正方形；

新功能“Variation Mode”则允许用户对图像的视觉差别进行微调；使用 stylize 参数还可以对生成的图片画风进行修改。

见智点评：

Midjourney Zoom Out这种凭空扩图的功能，可等同于变焦技术；理论上是一对张原画进行放大和缩小，然后可以通过合成连续桢画面，形成动图或者短视频；

现在AI图片制作的迭代几乎已经要卷向视频制作领域了，图片设计行业的天花板再次被突破。

3、最新版Stable Diffusion XL 0.9，构图细节有质的飞跃

Stability AI发布了最新版的Stable Diffusion XL 0.9（SDXL 0.9），这款模型的参数已经从beta版本的31亿提高到35亿基础参数+66亿集成管线；

在提高分辨率方面：SDXL 0.9使用了两个CLIP模型，包括迄今为止最大的OpenCLIP模型（OpenCLIP ViT-G/14）

更重要的是消费级显卡就能运行；

见智点评：

SDXL 0.9的升级主要在图片细节、清晰度上面进一步提高，并且能够清晰显示图片中的文字；最值得关注的是就构图技术的升级，比如之前在人体姿态、人物肖像、房屋结构的真实度还原上更进一步。

4、以后新闻都是AI写的？如何辨别AI创造虚假新闻是一个更大的挑战

德国的《图片报》是欧洲销量最大的报纸，计划用人工智能取代一系列编辑工作，以后新闻可能都是AI写的。首席执行官马蒂亚斯·多夫纳预测，人工智能很快就会比人类记者更擅长“信息聚合”，并表示只有创造“最佳原创内容”（如调查性新闻和原创评论）的出版商才能生存下来。

见智点评：

用AI写新闻已经被众多从业者证明可操作性非常强，这也是文生文大模型最直接的应用路径之一，但是AI不仅仅是写因为，现在市场上已经开始出现很多AI制造假新闻和污染搜索源的情况，如何辨别AI创造虚假新闻是一个更大的问题。

5、MR应用《Deskucchi》已上线，情感交互类助手需求会很大

《Deskucchi》是由 Technology Cafe Singularity 开发的一款 MR 应用，利用了 Meta Quest 系列的透视功能，用户可以将自己喜欢的游戏角色召唤到办公桌前，并与通过 ChatGPT 与他们交谈和玩游戏。采用手部追踪，允许用户使用手与空中 UI 交互，使用手势与角色交互并享受游戏。要与角色交谈，用户需要一个 ChatGPT API 密钥。用户还可以使用 Google Cloud Text to Speech API 密钥与游戏角色交流。

见智点评：

通过利用 Meta Quest 系列的实验功能“Room Setup”，该应用实现了与真实空间的无缝 MR 体验。此功能允许用户体验现实和虚拟的融合，在和应用交互上有了全新的体验，另外值得关注的是具有情感交互功能的助手和游戏市场将具有很大的发展空间。

6、即将推出AI虚拟宠物饲养平台，多样化情感需求受关注

AI宠物饲养平台Uing宣布即将在全球推出，目前正处于内部测试和互动程序的最后阶段。利用创新的AR和AI算法，Uing培养具有独特个性和习惯的用户专属虚拟宠物，有可能在每个独特的虚拟宠物提供个性化陪伴，娱乐和成长的能力中替代现实生活中的宠物。

见智点评：

与现实世界的宠物不同，虚拟宠物能够满足用户所有幻想，包括永恒的陪伴、超越肉体的灵性以及古代神兽的新奇。通过引人注目的特效，它们可以变成实体，满足用户最疯狂的想象力。尽管虚拟宠物无法替代真实的宠物，但它们可以在一定程度上满足人们的情感和娱乐需求，给予陪伴和快乐。同时，虚拟宠物也具有一些独特的优势，如灵活性、可定制性和无需实际照顾的便利性，使其成为一种具有全新体验的选择。

关键词：