![大模型时代的基础架构:大模型算力中心建设指南](https://wfqqreader-1252317822.image.myqcloud.com/cover/214/51090214/b_51090214.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3 一元线性回归算法剖析
一元线性回归算法,指的是根据平面上有限个离散的点,找出与这些点距离之和最小的直线。
有初中以上数学水平的读者可以很容易地回忆起来,在平面直角坐标系上,表示一条直线的方程是一次函数:
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_23_1.jpg?sign=1739225720-QrExOAD2WedyhXcyHD3w9RazjaHMHPlw-0-3c002e495a7a8b48c2177b3199b64f0d)
一次函数在平面直角坐标系上的图像如图1-2所示。
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_23_2.jpg?sign=1739225720-0eo7du0qvuPapiCxaVRL3nw4TPDbQmNu-0-6af064e7d0278ee684ffdd2c6e0e2fff)
图1-2
可以看出,一次函数在平面直角坐标系上的图像为一条直线。如果在平面直角坐标系上有若干离散的点,那么我们也可以找出这些点所在的直线并得到对应的方程,或得到与这些点距离之和最小的直线对应的方程,如图1-3所示。
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_1.jpg?sign=1739225720-ZlAz4wf0RbqVfWellQZ9CEbXhqEhETx0-0-59ab01d489c337205c81a4857a3bc549)
图1-3
在图1-3中展示的直线,就是在平面直角坐标系中,与各离散点的距离之和最小的直线。
一元线性回归算法使用的核心算法为最小二乘法(Least Squares Method),下面对最小二乘法进行详细解释。
在平面直角坐标系上,假设有n个点,分别为
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_2.jpg?sign=1739225720-hi6Ihi43wc5WR2fHpKSvfMPLDKzbvy3v-0-690aa12129725d4d84e4029b651795f6)
令
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_3.jpg?sign=1739225720-C0SHsxvrYribLBEtWN3LkJA7o4rZlf0o-0-1e474c3dc8bbba1348c6bfece0a14b0c)
可以解得
![](https://epubservercos.yuewen.com/4B3087/30122173303507506/epubprivate/OEBPS/Images/48123_24_4.jpg?sign=1739225720-tnbDmVZ7UqWgp8HNci84hQhOdRMNqiy5-0-46b42fb84b7e36bd37a59761f3daa9a4)
我们用机器学习算法相关术语来描述这一算法。
• 训练样本:平面直角坐标系上的n个点。
• 模型:描述平面直角坐标系上直线的一次方程。
• 模型的权重参数:一次方程中的参数a和b。
• 训练:根据样本计算出权重参数的过程。
• 基于模型和权重的推理:得到公式(1)中参数a和b的值后,根据x计算出y的值的过程。
如果我们将一元线性回归算法推广到多元非线性函数,那么实际上就是用线性多项式函数无限逼近无理函数(非整数次幂函数)和超越函数(指数/对数函数、三角/反三角函数和双曲/反双曲函数)。而基于深度学习算法计算出的结果,就是多项式中各项的系数,也就是模型的权重参数。