統計學思考題答案 - 下載本文

4.1一組數據的分布特征可以從哪幾個方面進行測度?

數據分布特征可以從三個方面進行測度和描述:一是分布的集中趨勢,反映各數據向其中心值靠攏或集中的程度;二是分布的離散程度,反映各數據遠離其中心值的趨勢;三是分布的形狀,反映數據分布的偏態和峰態。

2. 4.5簡述眾數、中位數和平均數的特點和應用場合。

眾數是一組數據分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數只有在數據量較多時才有意義,數據量較少時不宜使用。主要適合作為分類數據的集中趨勢測度值。

中位數是一組數據中間位置上的代表值,不受極端值的影響。當數據的分布偏斜較大時,使用中位數也許不錯。主要適合作為順序數據的集中趨勢測度值。

平均數對數值型數據計算的,而且利用了全部數據信息,在實際應用中最廣泛。當數據呈對稱分布或近似對稱分布時,三個代表值相等或相近,此時應選擇平均數。但平均數易受極端值的影響,對于偏態分布的數據,平均數的代表性較差,此時應考慮中位數或眾數。 4.7標準分數有哪些用途?

標準分數給出了一組數據中各數值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標準化處理。它還可以用來判斷一組數據是否有離群數據。 7.3怎樣理解置信區間?

置信區間:由樣本統計量所構造的總體參數的估計區間 7.4解釋95%的置信區間。

95%的置信區間指用某種方法構造的所有區間中有95%的區間包含總體參數的真值。

7.5 Za/2的含義是什么 含義:Za/2是標準正態分布上側面積為a/2的z值,公式是統計總體均值時的邊際誤差。

7.6 解釋獨立樣本和匹配樣本的含義。

獨立樣本:如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。

匹配樣本:一個樣本中的數據與另一個樣本中的數據相對應。 7.8簡述樣本量與置信水平、總體方差、邊際誤差的關系。 樣本量越大置信水平越高,總體方差和邊際誤差越小 10.1什么是方差分析?它研究的是什么?

答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。它所研究的是非類型自變量對數值型因變量的影響。 10.4方差分析中有哪些基本假定? 答:方差分析中有三個基本假定: (1) 每個總體都應服從正態分布 (2) 各個總體的方差σ2必須相同 (3) 觀測值是獨立的

說明誤差分解的基本原理

是通過計算來比較因某一特定因素帶來的樣本值的差異與隨機偶然因素對樣本值的差異的大小,從而判斷該因素對總體是否有統計意義。 解釋主效應和交互效應

在多因素實驗研究中,主效應就是在考察一個變量是否會對因變量的變化發生影響的時候,不考慮其他研究變量的變化,或者說將其他變量的變化效應平均掉。換句話說,就是其他研究變量都不變化的情況下,單獨考察一個自變量對因變量的變化效應。

交互效應,則是反映兩個或兩個以上自變量相互依賴、相互制約,共同對因變量的變化發生影響。換句話說,如果一個自變量對因變量的影響效應會因另一個自變量的水平不同而有所不同,則我們說這兩個變量之間具有交互效應。

10.15簡述完全隨機化設計、隨機化區組設計、因子設計的含義和區別。

(4) 答:完全隨機化設計是將k種“處理”隨機地指派給試驗單元的設計。

隨機化區組設計是先按一定規則將試驗單元劃分為若干同質組,稱為“區組”,然后再將各種處理隨機地指派給各個區組。因子設計指考慮兩個因素(可推廣到多個因素)的搭配試驗設計。

區間估計的基本原理是什么?

參數估計一般是指根據樣本信息,對總體分布中的未知參數θ進行估計,而我們通常都是對均值或方差進行估計。區間估計是參數估計的一種,它是指對于給定的置信度1-α,總體參數θ的取值在某一區間內的概率是1-α,而這一置信區間正是我們需要求解的。

用公式表示就是:P{θ1<θ<θ2}=1-α,其中θ1、θ2是兩個統計量。(θ1,θ2)就是置信區間,顯然因為是來自于樣本,而抽樣帶有隨機性,所以它是一個隨機區間。

置信區間代表的意義就是:樣本容量固定為n,假如對總體進行N=1000次抽樣,

就得到了1000個置信區間,這些區間有的包含θ的真實值,有的不包含。但假設當置信度1-α=95%時,這一千個區間就大約有1000*95%=950個包含了θ的真實值。

簡述評價估計量的標準

1、無偏性:無偏性不是要求估計量與總體參數不得有偏差,因為這是不可能的,既然是抽樣,必然存在抽樣誤差,不可能與總體完全相同。無偏性指的是如果對這同一個總體反復多次抽樣,則要求各個樣本所得出的估計量(統計量)的平均值等于總體參數。符合這種要求的估計量被稱為無偏估計量。

2、有效性:估計量與總體之間必然存在著一定的誤差,衡量這個誤差大小的一個指標就是方差,方差越小,估計量對總體的估計也就越準確,這個估計量也就越有效。

3、一致性:一致性指的是當樣本量逐漸增加時,樣本的估計量(統計量)能夠逐漸逼近總體參數。

解釋置信水平的含義

置信水平是指總體參數值落在樣本統計值某一區內的概率;而置信區間是指在某一置信水平下,樣本統計值與總體參數值間誤差范圍。置信區間越大,置信水平越高。

什么是P值?利用P值進行檢驗和利用統計量進行檢驗有什么不同

犯第I類錯誤的真實概率就是P值。用統計術語來說,如果原假設Ho是正確的,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率成為P值,也稱為觀察到的顯著性水平。

1.P值決策優先于統計量決策。與傳統的統計量相比,P值決策提供了更多的信息。 2.根據統計量決策,如果拒絕原假設,也僅僅是知道犯錯誤的可能性是?那么大,但究竟是多少卻不知道。而P值則是算出的犯第I類錯誤的實際概率。

在假設檢驗中,為什么采取 不拒絕原假設 而不采取 接受原假設

1. “接受”的說法有時會產生誤導

2. 采用“不拒絕”的表述方法更合理一些,因為這種表述意味著樣本提供的證據不夠

強大,因而沒有足夠的理由拒絕,這不等于已經證明原假設正確

為什么說假設檢驗不能證明原假設正確

1. 假設檢驗的目的主要是收集證據拒絕原假設,而支持你所傾向的備擇假設

2. 假設檢驗只提供不利于原假設的證據。因此,當拒絕原假設時,表明樣本提供的證

據證明它是錯誤的,當沒有拒絕原假設時,我們也沒法證明它是正確的,因為假設檢驗的程序沒有提供它正確的證據

樣本量的大小與顯著性有怎樣的關系

通常在做某種統計推斷時,顯著性水平要求越高,要達到該顯著性水平的樣本量越大。 樣本量越大,檢驗統計量的值夜就越大,P值就越小,就越有可能拒絕原假設。反之則相反。

解釋原假設和備擇假設

原假設:研究者想收集證據予以反對的假設。 備擇假設:研究者想收集證據予以支持的假設。

什么是標準化檢驗統計量?為什么要對統計量進行標準化?

標準化檢驗統計量是根據樣本觀測結果計算出對原假設和備擇假設作出決策的檢驗統計量,對樣本估計量標準化的結果,它反映了點估計量與假設的總體參數相比相差多少個標準差的距離。 標準化檢驗統計量?點估計量—假設值點估計量的抽樣標準差

沒標準化的統計量不能直接作為判斷的依據,只有將其標準化后,才能用于度量它與原假設的參數值之間的差異程度。

怎樣理解顯著性水平

通常以α表示,是一個臨界概率值。它表示在“統計假設檢驗”中,用樣本資料推斷總體時,犯拒絕“假設”錯誤的可能性大小。α越小,犯拒絕“假設”的錯誤可能性越小。

6第I類錯誤和第II類錯誤分別是指什么?它們發生的概率大小之間存在怎樣的關系?

第Ⅰ類錯誤原假設為正確時拒絕原假設所犯的錯誤,第Ⅰ類錯誤的概率記為?,被稱為顯著性水平。

原假設是錯誤的卻沒拒絕原假設,這時所犯的錯誤稱為第II類錯誤,犯第Ⅱ類錯誤的概率記為??,因此也成為?錯誤。

假設檢驗中犯的第I類錯誤的概率也稱為顯著性水平,記為?,它是人們事先指定的犯第I類錯誤概率的最大允許值。顯著性水平?越小,犯第I類錯誤的可能性自然越小,但犯第II類錯誤的可能性則隨之增大。反之相反。

怎樣理解統計上是顯著地?

當拒絕原假設時,我們稱樣本結果是統計上顯著的,這樣的(樣本)結果不是偶然得到的,或者說,不是靠機遇能夠得到的同樣,結果是不顯著的,則表明這樣的樣本結果很可能是偶然得到的。

怎樣理解統計顯著性與實際顯著性

在假設檢驗中,拒絕原假設稱樣本結果在“統計上是顯著的”;不拒絕原假設則稱結果是“統計上不顯著的”。“顯著的”在這里的意義是指“非偶然的”,它表示這樣的樣本結果不是偶然得到的,同樣,結果是不顯著的,則表明這樣的樣本結果很可能是偶然得到的。

在進行決策時,我們只能說P值越小,拒絕原假設的證據就越強,檢驗的結果也就越顯著。當P值很小而拒絕原假設時,并不一定意味著檢驗的結果就有實際意義,因為假設檢驗中所說的“顯著”僅僅是“統計意義上的顯著”。也就是說,一個在統計上顯著的結論在實際中卻不見得就很重要,也不以為著就有實際意義。

簡述判定系數的含義和作用

1. 回歸平方和占總離差平方和的比例 2. 反映回歸直線的擬合程度

在回歸分析中,F檢驗和t檢驗各有什么作用

在線性關系檢驗中,應用F檢驗來分析二者之間的差別是否顯著

T檢驗:::在回歸系數檢驗中,檢驗 x 與 y 之間是否具有線性關系,或者說,檢驗自變量 x 對因變量 y 的影響是否顯著

小樣本估計時對總體有什么假定





天津时时彩开奖号码表 内蒙古体彩十一选五开奖结果查 四川金7乐数据软件 北京28开奖结果走势图 哈尔滨站街女大全 甘肃十一选五新遗漏表 明天股票大盘走势 宝妈在家手机兼职 极速快3计划全天在线-稳赚倍投 好运快3开奖号码 天涯配资 11选五5开奖结果,吉林 东方6加1大奖排行 广西棋牌友好十三张 丫丫湖南麻将微信版 快乐10分 乐牛配资