去年 ChatGPT 出圈以来,用户增长速度打破记录,而近期微软的巨额加持 100 亿美元进一步将热度推向高潮。
ChatGPT 是一个由 OpenAI 开发的自然语言处理模型。它是一个基于 transformer 架构的深度学习模型,可以实现聊天机器人、问答系统、文本生成等功能。ChatGPT 通过预训练在大量文本数据上,以实现对话生成和语言理解的能力。
ChatGPT 所采用的 transformer 架构是公开的研究,最早是由 Vaswani 等人在 2017 年提出的论文,全世界有很多团队在做这块的研究,但 OpenAI 采用的模型大小非常大的,其参数数量超过了数百亿。这使得它能够在大量文本数据上获得更高的准确度。量变往往会引发质变,ChatGPT具有更高的准确性、更好的语言理解能力。从用户使用的角度,像是“突破了进化的界限”一样,变得“更像人”,达到从量变到质变。
关注 AI 热点的有普通人、投资者、科技爱好者,面对新的事物,每个人表现的看法是不一样的。
从我和一些朋友的沟通, AI 研究者,普遍把 ChatGPT 当作一个值得深入研究和探索的语言模型,并且认为是一个巨大的突破。至少在国内已经有很多团队在做类似的事情了。
对于一些普通人和科技爱好者,往往容易把 ChatGPT 神话,比如人工智能是否具备意识,人工智能要替代人类工作等。这其中充满了很多误解。目前的人工智能模型是通过大量数据进行预训练,也就是说数据来源于网络和书本,然后通过标记、训练其建立数据之间的关系,最终得到反馈。下面是官方的数据来源占比。
也就是说这类程序本质上还是工具类型,基于历史数据分析产生的答案,并不是营销号所讲的可怕的自主意识。但目前人类对人脑思维活动研究也是黑盒阶段,程序上的神经网络模型和人脑是否有真正关联? 通用智能的实现是否能用这种方案?模型的数据量变大、及参数调整是不是会让程序进一步涌现出更多智能的表现?仍然是研究的方向,这也是很多人在警惕人类的研究需要关注伦理等问题。
另外一方面,也有一些人把这次的热点看成和过去区块链、元宇宙、web3 类似的投资炒作,并不相信能产生对普通人生产快速落地的实际应用。因为科技界的泡沫之多,这种担心是正常的。
但从我个人的体验,过去的几个热点出现时,我从来没有真正深入关注过,不认为能够在目前阶段能多大程度改变生活。相反我认为这次 ChatGPT 出现是 AI 重要的转折点,不仅对效率提升带来显著进步,背后技术能够应用也非常广,后面我会讲讲我的看法。
科技进化的方向实际上是无法进准预测的,我们不仅没法预测 50-100 年后的科技,连 10 年内的发展都没有办法预言。就像 2007 年 iphone 手机发布后,当时诺基亚 CEO说:“有谁会用一块手机屏幕打电话,并做各种各样的功能呢”。过去的半个世纪,我们出现过很多短暂且昙花一现的发明,但真正持续推进人类进步,且成为经典的少之又少,个人 PC 计算机、互联网的出现、搜索引擎的出现、电子商城的流行、移动互联网等这些是影响和改变人们生活的发明。
但这些发明并不是在最初阶段就能预测出来,有的人和组织甚至会抗拒可能会流行的新事物。所以,我倾向于科技进化是明显无方向的,科技的发展是十分复杂和多样的, 它能够成为经典的标准是:它的出现,能否满足时代内,人们的需求和欲望、能否提高生产效率。而人的需求和欲望是会随着时代而变化,所以科技和需求相互推进。
这也是在商业领域,大公司倾向投资任何有热点的技术,因为没有人能判断未来这项技术能否改变人类,过去的诺基亚手机倒下就是典型的案例。任何组织都害怕被时代抛弃,最好的办法就是在未倒下前,用资本不断切换到更多的新型事物中。
能够理解人类自然语言的 ChatGPT 确实惊讶到了我。过去我一直热衷于关注各种 AI 聊天程序,包括各种助手、小娜、小冰等。这些工具有的能画画,有的能唱歌,看上去“挺智能”,但深入下去,总是会有一种明显的“弱智”味道,对语言会话的理解力让人“哭笑不得”,除了看天气,还是只能看天气。
ChatGPT 则出现了“蜕变”,不管你怎么沟通,它总是能够理解你说的文字,虽然答案不一定准确。
其实,上面这个地理问题回答推理是错误的。东北升起,当然是直射北回归线,属于深圳的夏天,东非的冬天,动物迁徙往北。
但 ChatGPT 回答方式给人一种“貌似正确”的感觉,这某种程度是模拟人的方式。如果提问者只把它简单作为正确来源,也是危险的,说明 ChatGPT 对专业知识训练不足,这是其他细分领域的机会,或者未来巨大的提升空间。据说,OpenAI 的下一代已经开始准备用更庞大的参数对其进行训练,所以 ChatGPT 类的应用场景将非常之多。
最典型的就是搜索引擎强化。雅虎的成功是在网页上尝试建立一种目录,来解决用户互联网信息的导航问题。但这种导航的信息非常粗糙,而 goole 解决的海量网页下,如何为用户提供“关键字”内更准确更高效的网页,这是基于网页权重排名和 rang 算法,让更有价值的信息达到用户前面。互联网网页的数据已经经过了几十年的积累,海量的数据已经超乎人们想象,我们不仅有网页、评论、还包括了海量的电子书、视频、图片等。然而一个问题的解决,不仅仅涉及某个关键字,更涉及多个关键字之间的组合、极其关联。比如“如何编写一段 HTML 展示一个红色的圆球落地的过程”。如果直接用这一段语句进行检索,传统的 rang 算法,只会匹配关键字,最终导致根本没有任何结果。
我们需要人为的拆解,html 编写、红色小球落两个不同的含义,然后分别进行搜索,最后用局部的知识,组合起来形成一段红色小球落地的代码。另外一种方式,我们可以求助网络的提问平台,比如 stackoverflow,等待真人回答,然而这是一个漫长的过程,等下次遇到类似的问题,我们需要重新提问。
基于自然语言理解的模型下,AI 可以理解我们的语义,然后拆解关键字,编写 HTML,并且实现红色小球落地的动画。并且对结果进行解释。
从过去的关键字检索,变成自然语言检索,中间节省了人为的把自然语言拆解成关键字,再分别组合的成本。这对海量信息时代无疑是一次变革,就如同过去雅虎人工录入网页信息,变成 google 的算法自动排名,再到如今 AI 自动感知和推理,并给出内容。
目前的 ChatGPT 也许还比较粗糙,比如没有给出信息来源,具体的相关信息推理过程等。但搜索只是具体应用落地的场景之一,必应已经发布的新的版本,Google 也认为面对“生死存亡”,加紧研发 Bard AI 之中。基于模型的搜索,是面向海量信息下的再一次跃迁。
除了信息获取的生产效率提升,在其他场景也非常可观比如:
AI 生成内容。从我的体验上看,ChatGPT 目前的版本其生成的内容,比大部分某度营销号发布的垃圾内容要强很多,大家可以去体验。这些内容不限于文案、策划、营销、公文等模板化内容。除此以外,AI 也能提供故事片段,用于激发创作者的灵感。
AI 情感领域。过去的虚拟账户在机器人聊天上,基本是无法有效的让人建立真正的互动关系,而类 ChatGPT 可以产生人难以区分的文字,未来,可以把模型专门用户训练情感聊天,并定制各种风格的 AI,在各种情感类需求上会有极大市场。
游戏 NPC。目前戏戏的 NPC 都是预设的内容,基于模型的游戏 NPC ,可以训练成不同性格的人物,游戏体验会极大提升。
类 ChatGPT+视觉+其他。能够理解自然语言是介入人类生活重要的起点,自然语言识别搭配音视频等识别等可以想象的东西非常多,比如一个多媒体交互的 AI,比如一个携带摄像头的实体机器人等。这些技术的前提是能够感知自然语言的含义,类 ChatGPT 的出现,让这些成为更加现实的应用。
和传统的互联网一样,我们不得不面对虚假、暴力等信息。而基于模型的 AI ,会被人各种“训练”,导致暴力倾向,我们人类无法保证信息的真实性,而 AI 也不可能,所以,信息辨别、暴力等传统下面对的问题,在基于 AI 的技术下,仍然需要面对。
科技进步的同时,在一定时间内也会引发大量社会问题,比如技能需求变化导致的失业。作为个体,我们应该如何适应变化呢。接下来是 chatgpt 给出的答案,我认为有借鉴意义。
问:chatgpt 会取代程序员吗:
不,ChatGPT 不会取代程序员。ChatGPT 是一种人工智能技术,可以帮助程序员完成某些任务,但它不能完全替代程序员。程序员仍然需要设计,开发和调试软件程序,并且需要独特的技能,例如沟通能力,团队合作能力和创造力。因此,ChatGPT 可以作为一个工具,但不能完全取代程序员。
问:chatgpt 会替代大量人类工作吗
是的,人工智能,包括 ChatGPT,可以替代一些重复性的和高度依赖于信息的工作。但是,它也不能完全取代所有的人类工作。人工智能仍然需要人类编程和监督,并且在许多领域,例如客户服务,医疗保健和教育等,人类仍然是不可替代的。此外,人工智能也不能完全取代人类的创造力,判断力和情感。因此,未来的劳动力市场将是人工智能和人类工作的结合,而不是完全取代人类工作。
问:普通人应该如何面对
随着人工智能技术的发展,普通人面临着一些挑战。但是,也有一些可以采取的步骤来应对这些挑战:
1.学习新技能:技能的更新是一个必要的步骤,以适应不断变化的劳动力市场。技能培训和教育计划是可以考虑的选项。
2.了解人工智能技术:了解人工智能技术的发展趋势,并学习如何使用它们,可以帮助您保持竞争力。
3.发展非技术技能:人工智能技术难以替代的是人类的创造力,情感和判断力。因此,发展非技术技能,例如沟通,团队合作和领导力等,是重要的。
4.接受改变:随着技术的发展,工作机会和职业生涯路径也将不断变化。接受改变,并对新机会敞开心扉,是应对技术变革的重要步骤。
总体而言,适应动态变化的劳动力市场,需要灵活性和不断学习的精神。
————分割线————
备注:本文有大量 chatgpt 协作生成的内容