2. 線性回歸方程
中
,
的意義是:以
為基數(shù),
每增加1個(gè)單位,
相應(yīng)地平均增加
個(gè)單位;
1. 線性回歸模型
與確定性函數(shù)
相比,它表示
與
之間是統(tǒng)計(jì)相關(guān)關(guān)系(非確定性關(guān)系)其中的隨機(jī)誤差
提供了選擇模型的準(zhǔn)則以及在模型合理的情況下探求最佳估計(jì)值
,
的工具;
2.練習(xí):
練習(xí)第
題.
1.例題:
例1.下表給出了我國(guó)從
年至
年人口數(shù)據(jù)資料,試根據(jù)表中數(shù)據(jù)估計(jì)我國(guó)
年的人口數(shù).
|
年份 |
|
|
|
|
|
|
|
|
|
|
|
|
人口數(shù)/百萬(wàn) |
|
|
|
|
|
|
|
|
|
|
|
解:為了簡(jiǎn)化數(shù)據(jù),先將年份減去
,并將所得值用
表示,對(duì)應(yīng)人口數(shù)用
表示,得到下面的數(shù)據(jù)表:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
作出
個(gè)點(diǎn)
構(gòu)成的散點(diǎn)圖,
由圖可知,這些點(diǎn)在一條直線附近,可以用線性回歸模型
來(lái)表示它們之間的關(guān)系.
根據(jù)公式(1)可得
![]()
這里的
分別為
的估
計(jì)值,因此線性回歸方程
為![]()
由于
年對(duì)應(yīng)的
,代入線性回歸方程
可得
(百萬(wàn)),即
年的人口總數(shù)估計(jì)為13.23億.
例2. 某地區(qū)對(duì)本地的企業(yè)進(jìn)行了一次抽樣調(diào)查,下表是這次抽查中所得到的各企業(yè)的人均資本
(萬(wàn)元)與人均產(chǎn)出
(萬(wàn)元)的數(shù)據(jù):
|
人均 資本 |
|
|
|
|
|
|
|
|
|
|
|
人均 產(chǎn)出 |
|
|
|
|
|
|
|
|
|
|
(1)設(shè)
與
之間具有近似關(guān)系
(
為常數(shù)),試根據(jù)表中數(shù)據(jù)估計(jì)
和
的值;
(2)估計(jì)企業(yè)人均資本為
萬(wàn)元時(shí)的人均產(chǎn)出(精確到
).
分析:根據(jù)
,
所具有的關(guān)系可知,此問(wèn)題不是線性回歸問(wèn)題,不能直接用線性回歸方程處理.但由對(duì)數(shù)運(yùn)算的性質(zhì)可知,只要對(duì)
的兩邊取對(duì)數(shù),就能將其轉(zhuǎn)化為線性關(guān)系.
解(1)在
的兩邊取常用對(duì)數(shù),可得
,設(shè)
,
,
,則
.相關(guān)數(shù)據(jù)計(jì)算如圖
所示.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
人均資本 |
3 |
4 |
5.5 |
6.5 |
7 |
8 |
9 |
10.5 |
11.5 |
14 |
|
2 |
人均產(chǎn)出 |
4.12 |
4.67 |
8.68 |
11.01 |
13.04 |
14.43 |
17.5 |
25.46 |
26.66 |
45.2 |
|
3 |
|
0.47712 |
0.60 |
0.74036 |
0.81291 |
0. |
0.90309 |
0.95424 |
1.02119 |
1.0607 |
1.14613 |
|
4 |
|
0.6149 |
0.66932 |
0.93852 |
1.04179 |
1.11528 |
1.15927 |
1.24304 |
1.40586 |
1.42586 |
1.65514 |
仿照問(wèn)題情境可得
,
的估計(jì)值
,
分
別為
由
可得
,即
,
的估計(jì)值分別為
和
.
(2)由(1)知
.樣本數(shù)據(jù)及回歸曲線的圖形如圖
(見(jiàn)書(shū)本
頁(yè))
當(dāng)
時(shí),
(萬(wàn)元),故當(dāng)企業(yè)人均資本為
萬(wàn)元時(shí),人均產(chǎn)值約為
萬(wàn)元.
4. 化歸思想(轉(zhuǎn)化思想)
在實(shí)際問(wèn)題中,有時(shí)兩個(gè)變量之間的關(guān)系并不是線性關(guān)系,這就需要我們根據(jù)專業(yè)知識(shí)或散點(diǎn)圖,對(duì)某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)化為線性回歸方程,
從而確定未知參數(shù).下面列舉出一些常見(jiàn)的曲線方程,并給出相應(yīng)的化為線性回歸方程的換元公式.
(1)
,令
,
,則有
.
(2)
,令
,
,
,則有
.
(3)
,令
,![]()
,
,則有
.
(4)
,令
,
,
,則有
.
(5)
,令
,
,則有
.
3. 線性回歸方程
中
,
的意義是:以
為基數(shù),
每增加1個(gè)單位,
相應(yīng)地平均增加
個(gè)單位;
2.探求線性回歸系數(shù)的最佳估計(jì)值:
對(duì)于問(wèn)題②,設(shè)有
對(duì)觀測(cè)數(shù)據(jù)![]()
,根據(jù)線性回歸模型,對(duì)于每一個(gè)
,對(duì)應(yīng)的隨機(jī)誤差項(xiàng)
,我們希望總誤差越小越好,即要使
越小越好.所以,只要求出使
取得最小值時(shí)的
,
值作為
,
的估計(jì)值,記為
,
.
注:這里的
就是擬合直線上的點(diǎn)
到點(diǎn)
的距離.
用什么方法求
,
?
回憶《數(shù)學(xué)3(必修)》“2.4線性回歸方程”P(pán)71“
熱茶問(wèn)題”中求
,
的方法:最小二乘法.
利用最小二乘法可以得到![]()
,
的計(jì)算公式為
,
其中
,![]()
由此得到的直線
就稱為這
對(duì)數(shù)據(jù)的回歸直線,此直
線方程即為線性回歸方程.其中
,
分別為
,
的估計(jì)值,
稱為回歸截距,
稱為回歸系數(shù),
稱為回歸值.
在前面質(zhì)點(diǎn)運(yùn)動(dòng)的線性回歸方程
中,
,
.
1.線性回歸模型的定義:
我們將用于估計(jì)
值的線性函數(shù)
作為確定性函數(shù);
的實(shí)
際值與估計(jì)值之間的誤差記為
,稱之為隨機(jī)誤差;
將
稱為線性回歸模型.
說(shuō)明:(1)產(chǎn)生隨機(jī)誤差的主要原因有:
①所用的確定性函數(shù)不恰當(dāng)引起的誤差;
②忽略了某些因素的影響;
③存在觀測(cè)誤差.
(2)對(duì)于線性回歸模型,我們應(yīng)該考慮下面兩個(gè)問(wèn)題:
、倌P褪欠窈侠(這個(gè)問(wèn)題在下一節(jié)課解決);
②在模型合理的情況下,如何估計(jì)
,
?
思考,討論:這些點(diǎn)并不都在同一條直線上,上述直線并不能精確地反映
與
之間的關(guān)系,
的值不能由
完全確定,它們之間是統(tǒng)計(jì)相關(guān)關(guān)系,
的實(shí)際值與估計(jì)值之間存在著誤差.
2.問(wèn)題:在時(shí)刻
時(shí),質(zhì)點(diǎn)的運(yùn)動(dòng)位置一定是
嗎?
國(guó)際學(xué)校優(yōu)選 - 練習(xí)冊(cè)列表 - 試題列表
湖北省互聯(lián)網(wǎng)違法和不良信息舉報(bào)平臺(tái) | 網(wǎng)上有害信息舉報(bào)專區(qū) | 電信詐騙舉報(bào)專區(qū) | 涉歷史虛無(wú)主義有害信息舉報(bào)專區(qū) | 涉企侵權(quán)舉報(bào)專區(qū)
違法和不良信息舉報(bào)電話:027-86699610 舉報(bào)郵箱:58377363@163.com