谈谈GPT-4模型的亮点

欢迎关注微信公众号

专注于网络安全领域，跟踪漏洞动态，深耕互联网，做一个深谙攻防之道的公众号。
同时涉足多个领域，是哲学，抑或是文学与艺术，关注金融市场，研究全球市场经济发展方向。

开门见山

直观标题，今天要聊的依然是人工智能聊天机器人，也就是和ChatGPT有关的，与其说聊，不如说应该侃侃而谈。

相信各位长期混迹于各大短视频平台，也早已知道OpenAI在当地时间3月14日发布了GPT-4这个消息了吧。

所以我只做一些其他的补充，但是这个补充不会参考其他同主题的文章。

根据GPT-4模型的宣传片，GPT-4有以下三大特点：图像识别、高级推理、庞大的单词掌握能力。

1.图像识别

简单来说，GPT-4能够分析你提供的图片，并给出一些与图片有关的信息。需要注意的是，GPT-4的图像识别能力与DALL·E2模型所掌握的能力并不一样，前者是注重于识别，而后者是创建和扩展图像，也就是说一个是分析师，另外一个是画家。

比如下面的案例：

GPT-4可以根据你提供的冰箱食材图片，给你生成几份菜谱。所以我的康帅傅和六个核弹……

以及OpenAI提供的一个我认为比较幽默的案例。

我来解说一下：首先是用户提供了三张图片，并问GPT-4这些图片有什么幽默之处，每张图片都描述一遍。

于是GPT-4是这么回答的：

当然，如果这个案例不是出于OpenAI团队，那么就是网友们为了调侃GPT-4而已，不过这也充分证明了GPT-4模型强大的图片识别能力。

2.高级推理

这里说的推理能力应该不是像柯南那样身体虽然变小，但是醒来发现自己的声优被换了人……而是说GPT-4能够回答上下文关联性比较复杂的问题，比如在各种专业测试以及相关学术考试评测中，成绩也把之前的GPT-3.5甩得远远的。

3.强大的单词掌握能力

在GPT-4模型中，单次提问的文字字数限制将提升到25000个单词，并且几乎支持所有的编程语言。

可能不同于让ChatGPT翻译一部短篇小说或者论文那样，因为在我看来，正常情况下一个人不会提问一个超过一万字的问题，即使内容有很大的关联性或者许多细节。所以，这可能对于“你”写一份充满BUG的代码是有好处的，但前提是你得拥有它。

而且，要知道，在GPT-3模型中，中文所占训练语料的比例不到0.2%，英文却占了92%，这是惊人的，哪怕是这样，它也同样强大。有一些专家还指出，在一些特殊的问题上，尽量使用英文去提问，可能效果会更好，比如各种编程难题。

在GPT-4开发者视频的结尾，OpenAI联合创始人兼总裁Greg Brockman说了一句话： “它并不完美，但你也一样。 ”

东郭先生

说完GPT-4，另外一边让人注意的是国内的“文心一言”，也就是百度在今年2月7日对外官宣的人工智能聊天机器人。但是在前几天被网友传出取消了预约的直播发布会，具体原因未知。

明天是3月16日，很多人都想看看“文心一言”的表现。 GPT-4模型发布后，在各大平台的讨论中，会看到一些有趣的发言。

以及一张世界名画：

这个30秒看广告的确实很符合我对百度的印象，看看百度贴吧的个人主页就知道了，点开就是各种金融理财、贷款的广告，虽然不是弹出式或者嵌入式的，但是看着让人就以为是贷款APP。

我是真想不明白那些策划是怎么想的。于是就有一张图片专门调侃“文心一言”的：

或者说类似于下面的前车之鉴。

又或者是这样的，当然肯定是假的：

狼来了的故事讲多了，再讲也不会有人信的。