如何破解大模型选择困难症？新华网评测：文心一言多项得分高，产业落地规模大

帮助中心

如何破解大模型选择困难症？新华网评测：文心一言多项得分高，产业落地规模大2023/8/8 9:37:41

了考验。大模型必须具备行业化、场景化的服务能力，才能满足不同企业的要求。”

文心一言在安全、常识、数学、阅读等方面优势明显

新华网物联网技术总监葛振斌认为，评测大模型有5项维度非常重要：一是把控生成内容安全性的能力，背后涉及意识形态、政治体制、非法涉黄等维度，每一项都事关一个社会文明的底线；二是常识推断计算的能力，涉及自然、文化、地理、历史和生活等多个领域，必须先吃透这些方面的常识，才能避免生成不恰当的内容结果；三是对长文本的语义理解能力。这可以考验大模型产出的内容是否正确且言之有理，是否具有较好的说服力；四是数学运算及数学推理能力；五是主观思维能力，考验大模型是否可以准确理解当地风俗习惯或者传统文化。

新华网评测报告显示，文心一言因中文搜索引擎和算法模型优势，在安全、常识、数学、阅读等方面优势明显。在五个维度上的得分计算均值，文心一言的综合得分为94.7分，排名第一，高于GPT-3.5的76.9分。这说明当前文心一言在总体能力（中文处理）上已经超越了GPT-3.5模型。

新华网测试报告：百度文心一言综合得分第一

凭借上述表现，文心一言在“最适合中国”方面抢占领先身位，领跑国内大模型。

专家：开发者基于文心大模型抢占发展先机

如今，参考权威机构评测成为客户选择大模型的一个重要方式。如同生活中常见的智能手机评测，汽车驾驶评测，是用户选择产品和服务的重要参考。

除了新华网评测报告，近期，还有IDC等多个权威机构发布评测报告，结果均显示由文心大模型3.5支持的文心一言综合能力评测得分超过ChatGPT3.5。比如IDC报告显示，文心大模型3.5拿下12项核心指标的7个满分，综合评分位列国内主流大模型第一，并在算法模型、行业覆盖两大关键指标上拿下唯一满分。

中国传媒大学新媒体研究院院长赵子忠建议，创业者和开发者以及中小企业，其实不需要从0到1的打造自己的大模型，可以基于文心大模型打造智能应用，避免重复造轮子，把精力放在自己擅长的创新上。谁先做出来满足用户需求的应用，谁就抢占了发展先机。

百度2019年推出文心大模型1.0，今年5月份升级到3.5版本。通过飞桨深度学习平台与文心大模型的协同优化，文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

目前百度文心大模型已拥有中国最大的产业落地规模，超过15万家企业申请文心一言内测，其中有超300家生态伙伴在400多个具体场景取得测试成效，覆盖办公提效、知识管理、智能客服、智能营销等领域，联合国家电网、浦发银行、泰康、吉利等企业，联合发布了 11个行业大模型。百度还设立了 10 亿创投基金鼓励大模型创意、繁荣大模型生态。

软通动力CTO刘会福曾表示，我们非常期待在文心大模型的基础上，开拓更多的应用实践。北京宝兰德软件董事长易存道表示，如何把大模型在垂直行业做好，是目前各个企业都要考虑的问题，多数企业无法像百度一样有能力建设大模型。怎么能够把百度的大模型能力和企业业务有效结合起来，创造更强的价值，是企业非常好的弯道超车机会。金山办公助理总裁田然表示，金山办公要跟中国优秀的大模型提供方站在一起。金山办公和文心的合作，会进一步推动大模型在办公领域的应用和快速落地。

“转载请注明出处”

首页

域名

域名注册 ∨

域名服务 ∨

域名管理 ∨

虚拟主机

香港共享全能型免备案

国内虚拟主机超高防御

美国虚拟主机免备案

香港独享全能型独立IP

企业邮箱

企业邮箱企业邮箱

云主机

香港云服务器免备案，快速稳定

国内云服务器速度快，高防御

美国云服务器免备案，20G防御

美国高防云主机免备案，200G防御

企业建站

服务器租用

大宽带

智能客服

帮助中心

帮助中心

公告

主营业务

关于我们

快速链接

联系方式

0745-4651672