上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 ChatGPT简述
用户与对话机器人之间的交互感知智能与否,主要涉及对“听得懂、答得好”这两部分的评估。前面所提到的Siri、小度、小爱等对话机器人虽然在“答得好”部分已经做得非常不错,但并不理解用户说的话,尤其在多轮对话和复杂对话中。ChatGPT的惊艳表现主要来自“听得懂”。它凭借大语言模型强大的功能很好地理解用户意图,在用户交互感知智能方面有了突飞猛进的进展。
“听得懂”是漫长的技术迭代及成功工程化、产品化的结果。AI三要素——数据、算法和算力是AI飞速发展的基石,如图1.11所示。
数据是AI能力的源泉,AI模型只有在高质量的结构化数据基础之上训练才能得到高水平智能。结构化数据是经过人工大量的清洗和标注所得到的符合模型训练要求的数据。模型对结构化数据的学习即有监督学习(Supervised Learning)。
以ChatGPT为代表的大语言模型主要通过无监督学习(Unsupervised Learning)进行训练,即不需要人工标注直接学习原始数据,从而使学习的数据量和效率大大提升。
只有用算法对数据进行训练,才可能得到可用的模型。图1.11中间的算法图片横轴是数据量,纵轴是模型的参数量(参数可控制模型的行为,由模型自动学习得到),可以看出,随着AI模型可应用的数据量越来越大,对应模型参数越来越多。当模型参数规模达到数十亿甚至上百亿的级别时,就会出现模型能力大幅度提升、智能涌现的情况,也就产生了如今类似ChatGPT的大语言模型的惊艳表现。当然,大语言模型处理大数据的基础是算力,即GPU等AI模型训练用的硬件设备所具备的性能,如图1.11右图所示。
图1.11 AI三要素:数据、算法、算力
只有在数据、算法、算力三方面达到相对协调的高水平,才能产生“听得懂、答得好”的ChatGPT。