商务英语证书报考时间(含金量如何?将如何改变社会?.....四问AI大模型“竞赛”)

2023-10-16 06:10:38 69
admin

“百模大战”正如火如荼地进行。

今年以来,生成式大模型越来越流行,国内企业和科研机构纷纷关停。 3月,百度“文心一言”拉开帷幕,4月阿里云“统一前问”与复旦大学“文心一言”推出“MOSS”、360“360智能大脑”上线。同时,AI科大讯飞、商汤科技等(人工智能)企业纷纷入局,百川智能等基于大模型创立的公司也开始涌现。据不完全统计,目前国内发布的大模型数量已经突破230了。

8月31日,首批注册生成人工智能大模型开始向社会开放。当大型机型正式进入应用阶段,此时此刻,正如NVIDIA创始人黄仁勋所言,人类社会已经迎来了人工智能的“iPhone时刻”,还是未来会证明这只是一个“泡沫”。当潮流退去、潮水退去的时候,盲目跟风、投资大机型的企业会意识到自己是在裸泳吗?

目前大模型“含金量”如何?

大多数还谈不上真正意义的创新

到目前为止,国内已经发布了多少款主力车型?对于这一点众说纷坛,但大车型数量超过100已成为行业共识。

5月28日,中国科学技术信息研究所所长赵志庚在中关村论坛上发布《中国人工智能大模型地图研究报告》。据不完全统计,国内已发布大型车型79款。从区域角度看北京,以广东最多。 7月,据腾讯研究院副秘书长杨旺研究分析,中国大型模型数量已增至116个。 Ucade首席执行官季新华在2023年世界人工智能大会上表示,中国大型模型数量已增至116个。已拥有130个研发大型号。模范公司。

另一方面,越来越多的大型模型选择开源。 7月19日,Meta携手微软宣布,继大型人工智能模型LLaMA开源后,LLaMA 2正式开源商用。 9月25日,阿里云开源统一钱文140亿参数模型Qwen1B及其对话模型Qwen-14B-Chat,免费商用。

多个大模型的开源,意味着想要加入“百模型之战”,技术不是问题。

“公开发布的大型车型有很多,但真正拥有自主研发创新技术的企业可能不超过十家。” 9月25日,一位负责为企业提供大模型实施服务的科研院所的人工智能从业者告诉贝壳财经记者,“如果你想买大模型,只需要‘复制’我们的模型即可。”

在她看来,在风起云涌的大模型热潮中,企业客户的大模型能否差异化的核心点在于企业自身数据的质量以及基于此对大模型的微调。

在采访中,不少企业家和专家认为,大模型的存在已经不再稀奇。这或许就是“百模大战”出现的原因。在这种情况下,如何才能“用好”大模型呢?模型是相当考验智慧的。

创新工场执行董事、前沿科技基金总经理任伯兵对贝壳财经记者表示,虽然目前不少企业都在投资建设大型模型基地,但“百模型之战”的最终胜利者将是几家领先的企业。公司,包括巨头和初创企业。公司产品技术卓越。对于AI初创企业来说,应用层和中间层有更多的创业机会。

在他看来,“百模之战”中有很多大模技术,基本上都是企业自己用的,或者是行业内其他人用的。 “‘百款大战’并不是一场只有巨头才有入场券的竞赛,战争的结果很可能是少数巨头和初创企业中科技产品领域的领先者。”

印象研究院负责人常程对贝壳财经记者表示,在大语言模型的基础算法早已开源的今天,GPT4之所以能达到现在的高度,并不是因为有多少“独家”它在模型方面掌握了“秘密”,但在模型训练过程和训练数据处理方面积累了多年的经验。 “这些经验所涉及的技能都是从大量失败的实验中积累起来的。”

被《时代周刊》评为“全球人工智能百强人物”之一的中科院自动化研究所研究员曾毅在接受贝壳财经记者采访时表示,大多数人中国目前的大型模式还不能说是真正的创新。绝大多数的努力仍在工程优化上。因此,未来在提高基础模型处理复杂问题的泛化能力方面,必须真正实现更小的数据规模和能耗,却表现出更高的智能,并在模型算法结构和体系上实现协同创新,而不是只是提升用户体验还需要一系列的努力。

为什么要做大模型?

在交互方面的优势无可比拟

“我们从去年年底就开始关注ChatGPT(OpenAI开发的聊天机器人程序),我们发现这个大模型和我们的研发路线以及我们需要解决的一些产品问题有很多相似之处”。 9月21日,容连云人工智能研究院院长刘杰向贝壳财经记者表示。

刘杰表示,大模型技术的实现其实并不复杂。 “大模型的技术方案比较清晰,但是有一些技术细节,包括我们用什么规格的模型,如何实现多机多卡并行训练。以及需要多少数据,什么样的数据,以及数据的质量等工程细节,我们花了很多时间。其中,一些技术细节需要反复摸索和调试。之后,如何将大模型与具体业务场景结合起来,实现更好的匹配,是我们下半年需要重点关注的。”

“为什么这波大模型这么受欢迎?因为它们确实实用。大模型在交互方面的优势是无与伦比的,ChatGPT已经证明了这一点。另外,上一代人工智能,例如计算机视觉,成本非常高“要实现,需要安装摄像头、软件和硬件,实现起来并不容易。相比之下,大型模型已经在很多行业实现了。”上述AI从业者说道。

她告诉贝壳财经记者,国内企业必须开发自己的大模型的另一个原因是,能够开源的国外大模型“肯定不是最好的”。要求不高的业务可以承接,但很难走得更远。此外,其他也可能存在数据安全问题。

在刘杰看来,大模型技术确实可以转化为生产力。 “大型模型可以升级公司原有的人工智能能力,例如更高的图像识别精度和更好的文本生成。大型模型具有许多功能。良好的基础知识和能力只需很少的数据训练就可以应用于新场景、新业务。当我们有了大的AI模型之后,很多以前做得不够好、无法在产品中实现的能力,现在都可以实现了。例如,灵活的问答和上下文理解。在业务逻辑上,我们不断深化AI能力与业务的紧密耦合,最终实现真正AI原生的智能产品。”

对于目前“百模之战”的行业现状,刘杰认为,竞争局面既然存在,就有一定的合理性。 “在一项技术或者某种商业模式进入完全成熟阶段之前,大家可能会对它有比较的看法。”我们有很好的期待,希望抢占战略优势,所以我们从各个角度进行深入探索。事实上,从AI技术发展的角度来看,如果谷歌和微软没有从不同的角度探索技术架构,我们可能也会看到今天还没有大规模的AI模型,所以“兄弟爬山”是有道理的一起努力”,从不同的山坡到山顶,探索不同的方向。”

为何产品纷纷接入大模型?

处在AI产品爆发的“前夜”

贝壳财经记者注意到,目前已有不少企业将大模型能力融入到自己的产品中。

9月26日,贝壳财经记者打开百度搜索首页时发现,搜索框下方最左边的选项不再是“网页”选项。相反,它是“AI对话”。点击进入后,可以切换到“AI助手”界面,直接询问大模型的问题,记者发现,如果进入“AI助手中心”,用户甚至可以创建“高清逼真图片”或用AI“模拟恋爱体验”。前者有128.2万人使用,后者有12万人使用。

8月22日,钉钉总裁叶军公布了钉钉全面智能化的最新进展:17个产品线、55个场景已全面融入大模型,完成智能化再造;钉钉还瞄准生态合作伙伴和客户。开放智能基础AI PaaS(平台即服务),表示将“用大模型帮助生态系统重新做产品”。早在4个月前,叶军就在北京演示了连接大模型后的钉钉。包括利用AI生成宣传文案、利用绘图创建应用程序、在视频会议中生成摘要等一系列功能。

Evernote也是悄然推出大模型功能的产品之一。早在4月21日,贝壳财经记者就发现,通过App的“新超级笔记”功能,可以用人工智能来总结、续写、翻译文档。在交互设计方面,AI的很多功能都指定了特定的场景,比如“写论文”、“面试题”等。

“我们不希望用户将大语言模型视为事实检查知识库系统,因为它本质上是一个统计模型。我们应该将大模型视为推理工具。如果你想写采访,大模特可以胜任。单步推理,但对于特别专业的问题,用户至少应该能够判断结果的好坏,而不能简单地期望语言模型完全取代用户自己。当然,我们也会继续对印象AI模型进行调优。”印象笔记董事长兼首席执行官唐易告诉贝壳财经记者。

多位受访者表示,目前,我们仍处于AI产品爆发的“前夜”。也许大型生成模型已经开始改变人们的生活,但这一切都悄然发生,就像iPhone之后智能手机的出现一样。普及过程是一样的。值得注意的是,8月31日首批注册生成人工智能大模型开始向公众开放后,不少大模型的访问量整体上升。

方正证券发布的研报显示,百度文心一言、科大讯飞Spark、商汤科技将在8月底出现一波访问量增长,主要得益于大机型商业化的政策批准。百度文心一言的流量增幅最为明显,这可能得益于百度在搜索引擎中的流量优势。具体来说,“文心一言和科大讯飞Spark 的浏览量明显高于其他三个制造商。另值得注意的是,商汤科技讨论的平均访问时长较长,主要是因为商汤科技的大模型编程、图像生成、模型预标注等功能吸引了更多专业用户。字节豆宝的浏览量和平均访问时长一度飙升,但随后又出现下降。”

百度9月22日发布的首份《文心一言用户使用报告》显示,其最大的用户群体是一线及超一线城市的中青年上班族,占比最高的两大行业是IT、互联网和教育。最常使用的三个场景是知识问答、文本创作和编码能力,以及每天24小时每分钟都有人问文心一言问题。从行业分布来看,IT互联网、教育、社会公共管理、医药卫生、能源矿产化工、金融保险、日化百货等七大行业占比超过50%。其中,IT互联网和教育行业用户占比最高,每4名用户中,就会有1名工程师和教师。

目前,一些数据可以大致显示出未来不同大模型之间可能存在的差异。方正证券研报数据显示,从受众兴趣云图来看,科大讯飞星火、文心一言、字节豆宝、统一新闻等用户对新闻资讯、门户、检索等兴趣较高,字节码占比较大豆袋椅适用于书签、互联网和电视剧等部分感兴趣的领域。商汤科技讨论的用户兴趣包括产品经理、数据库、互联网工具、云计算等,可以看出以工作为目的的用户相对较多。

大模型将如何改变社会?

将引领新工业革命

今年以来,大车型之所以火爆,是因为越来越多的观点认为大车型将从根本上改变现有行业和主流产品。正如英伟达创始人黄詹勋所言,这就像iPhone带来的变化一样。就像手机市场一样,人工智能也已经到了“iPhone时刻”。

创新工场董事长兼首席执行官李开复也是这一观点的支持者之一。早在今年3月,创新工场就在其官网首页列出了“Project AI 2.0”(AI2.0项目),并表示将在全球范围内寻找具有AI大模型、语言能力的优秀技术人员和研究人员生成模型、多模态等领域。

李开复在中关村论坛上表示,大模型不仅会改革人工智能,还会在企业之间造成巨大的平台式鸿沟。脱颖而出的企业一定是“没有大AI模型就无法成立”的企业,即“AI优先”。在他看来,大AI模型是一个不容错过的历史机遇。它将成为历史上最大的平台,比Windows 和Android 强大10 倍。它将重写每一个应用,重构人类的工作,将人类的生活转化为可以放大10倍甚至更多的匠心,取代大量的重复劳动。

对此,任伯冰表示,“我们将AI 2.0生态系统分为基础模型层、中间层(工具层)和应用层。相对而言,应用层和中间层有更多的创业机会。 AI 2.0平台生态一旦建立起来,市场规模将比Windows、Android等时代大十倍,我个人出生在PC时代,在当时的互联网时代和移动互联网时代接下来的时代,我接触新鲜事物的能力还可以,但现在很多孩子都处于AI时代,他们的教育模式和职业选择需要改革,但好消息是孩子的接受能力会更强“新事物。AI 2.0创业者也可以在应用端大胆思考开发一些关注年轻一代需求的产品,新的应用。”

9月25日,360在回复贝壳财经记者采访时表示,大机型不是趋势,也不是泡沫。大模型作为新一代生产力工具,将引领新工业革命,赋能行业数字化发展。未来,不会只有一个大模型,而是会像数据库一样成为每个数字系统的标准功能。

360认为,当前国家的重要战略之一就是产业数字化。因此,中国的发展模式也必须抓住产业机遇,赋能数百个产业,推动产业数字化向智能化升级,走向数字化巅峰。但一般的大模型无法直接用于企业级场景,存在业务深度不足、无法“读懂”企业、数据安全风险等六大问题。因此,未来大模型的发展趋势是“垂直化”,这也将成为中国在全球大模型技术竞争格局中的又一条突破路径。

“目前来说,大模型是一个可以放大人类能力的工具。就像互联网是一个提供信息的好工具一样,大模型是一个很好的智能工具,可以帮助我们处理信息、与外界沟通。世界实际上是相互作用的。”响应能力强,应用场景也很多,表现如何,根本上取决于使用工具的人以及所处的场景。长期以来,业界仍然要关注如何开发和设计大规模应用。然后可以以合理的成本将模型的能力应用于适当的场景。”刘杰说。

新京报贝壳财经记者罗一丹

编辑张兵校对贾宁

收藏
分享
海报
69