当前位置：搞趣网 >OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好

OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好

2023年03月15日来源：搞趣网作者：zzz 搞趣网官方微博

GPT-4 可以更准确地解决你的难题，多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章，在高级推理方面的表现超过其前辈（当前公开版 ChatGPT 基于 GPT-3.5）。当然，正如大家所猜测的那样，微软 New Bing 的聊天功能确实基于 GPT-4。

此外，该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力（注：Be My Eyes 是一款即将推出的智能手机 App，可以识别场景并对其进行描述，类似于大家常见的 AI 识图的加强版）。

除了介绍网站，OpenAI 还提供了描述 GPT-4 功能的技术性论文，以及详细描述其局限性的系统模型 Card。

OpenAI 推出 GPT-4 大型语言模型1.jpg

OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4 的文本功能支持，但目前还需要等待。IT之家这里需要提醒一下，GPT4 目前仅 ChatGPT plus 账号可用，可选 GPT4 模式进行对话，每 4 小时限制发送 100 条消息。

收费方面，大约 750 个单词的提示收取约 3 美分的费用，约 750 个单词的响应则收取 6 美分（就是问和答的区别）。

OpenAI 推出 GPT-4 大型语言模型2.jpg

OpenAI 声称，ChatGPT-4 比迭代前的 GPT-3.5“更大”，这意味着它接受了更多的数据训练，模型文件中有更多的权重（参数），这也使得它的运行成本更高。

该公司声称，该模型“比以往任何时候都更具创造性和协作性”，“可以更准确地解决难题”。它可以解析文本和图像输入，尽管它只能通过文本进行响应。

就任务而言，GPT-4 的表现比前辈更好，它可以遵循自然语言的复杂指令并生成技术或创意内容，而且它可以还更深入地做到这一点：它支持生成和处理多达 32768 个标记（约 25000 个文本单词），从而实现比前辈更长的内容创建或文本分析。

OpenAI 承认，该公司使用了微软云计算平台 Azure 来训练其模型，微软已经向 OpenAI 投资了数十亿美元。OpenAI 以竞争为由，没有公布具体的模型大小或用于训练它的硬件等细节，这些细节可以用来重建模型。

官方表示，GPT-4 错误答案更少，而且也会减少偏离话题的可能，也尽可能不会再谈论禁忌话题，甚至在许多标准化测试中比人类表现得都要更好一些。

例如，GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右，在 SAT 阅读考试中排名前 7% 左右，在 SAT 数学考试中排名前 11% 左右。相比之下，GPT-3.5 在律师考试中的得分一般都是倒数 10% 左右。当然，它们考个研究生还是没问题的。

当然，AI 毕竟是 AI，OpenAI 也表示目前 GPT-4 并不完美，它在很多场景下的能力都不如人类。

据称，该模型仍然存在“幻觉”或编造事实的问题，并且在事实方面也不一定总是可靠的，“它倾向于坚持认为它是正确的，即使它错了”。OpenAI 表示，GPT-4 正在努力解决其局限性，例如社会偏见、幻觉和敌意回复等。

在一次随意的谈话中，GPT-3.5 和 GPT-4 之间的区别很小。而当任务的复杂性达到足够的阈值时，差异就会显现出来：GPT-4 比 GPT-3.5 更可靠、更有创造力，并且能够处理更多细微差别的指令。”

OpenAI 表示，该公司已经与多家公司合作以将 GPT-4 整合到他们的产品中，包括 Duolingo、Stripe 和 Khan Academy 等。这款新模型通过 OpenAI 每月 20 美元的 ChatGPT 订阅服务 ChatGPT Plus 向用户开放，并为微软的必应聊天机器人提供动力。同时，GPT-4 也将作为 API 的一部分提供，该 API 允许程序员将 AI 集成到自己的应用程序中。

【责任编辑：狂野的榴莲】

免责声明：本文图片引用自网络，如有侵权请联系我们予以删除

搞趣网发布此文仅为传递信息，不代表搞趣网认同其观点。

OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好

推荐阅读

热门资讯

OpenAI 推出 GPT-4 大型语言模型 诸多测试中表现比人类都好

推荐阅读

热门资讯

OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好