述統計與推斷統計-心理學統計與測量經典習題1_跨考網
描述統計與推斷統計-心理學統計與測量經典習題1
? 第一章 描述統計
名詞解釋
1.
描述統計(吉林大學2002研)
答:描述統計主要研究如何整理心理與教育科學實驗或調查得來的大量數據,描述一組數據的全貌,表達一件事物的性質。具體內容有:數據如何分組,如何使用各種統計表與統計圖的方法去描述一組數據的分組及分布情況,如何通過一組數據計算一些特征數,減縮數據,進一步顯示與描述一組數據的全貌。
2.相關系數(吉林大學2002研)
答:相關系數是兩列變量間相關程度的數字表現形式,或者說是表示相關程度的指標。作為樣本的統計量用r表示,作為總體參數一般用ρ表示。相關系數不是等距的度量值,因此在比較相關程度時,只能說絕對值大者比絕對值小者相關更密切一些,而不能進行加減乘除。
3.差異系數(浙大2003研)
答:差異系數,又稱變異系數、相對標準差等,它是一種相對差異量,為標準差對平均數的百分比。其公式如下:
常用于:①同一團體不同觀測值離散程度的比較;②對于水平相差較大,但進行的是同一種觀測的各種團體,進行觀測值離散程度的比較。
4.二列相關(中科院2004研)
答:如果兩列變量均屬于正態(tài)分布,其中一列變量為等距或等比的測量數據,另一列變量雖然也是正態(tài)分布,但被人為地劃分為兩類。求這樣兩列變量的相關用二列相關。
5.集中量數與差異量數(浙大2000研,蘇州大學2002研)
答:集中趨勢和離中趨勢是次數分布的兩個基本特征。數據的集中趨勢就是指數據分布中大量數據向某方向集中的程度,離中趨勢是指數據分布中數據彼此分散的程度。用來描述一組數據這兩種特點的統計量分別稱為集中量數和差異量數。
6.中位數(南開大學2004研)
答:中位數,又稱中點數,中數,是指位于一組數據中較大一半和較小一半中間位置的那個數,用Md或Mdn來表示。
7.品質相關(華東師大2002研)
答:品質相關是指R×C表的兩個因素之間的關聯程度。兩個因素只被劃為了不同的品質類別,其數據一般都是計數的數據,而非測量的數據。品質相關可依二因素的性質及分類項目的不同,而有不同的名稱和計算方法,較常見的有四分相關和Ф相關。
8.標準分數(華南師大2004研)
答:標準分數,又稱基分數或Z分數,是以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數。
其計算公式為:
簡答題
1.簡述使用積差相關系數的條件。(首師大2004研)
答:一般來說,用于計算積差相關系數的數據資料,需要滿足下面幾個條件:
①要求成對的數據,即若干個體中每個個體都有兩種不同的觀測值。
②兩列變量各自總體的分布都是正態(tài),即正態(tài)雙變量,至少兩個變量服從的分布應是接近正態(tài)的單峰分布。
③兩個相關的變量是連續(xù)變量,也即兩列數據都是測量數據。
④兩列變量之間的關系應是直線性的,如果是非直線性的雙列變量,不能計算線性相關。
2.簡述算術平均數的使用特點。(浙大2003研,蘇州大學2002研)
答:算術平均數的優(yōu)點有反應靈敏;計算嚴密;計算簡單;簡明易解;適合于進一步用代數方法演算;較少受抽樣變動的影響。缺點有易受極端數據的影響;如果出現模糊不清的數據時,無法計算平均數,因為平均數的計算需要每個數據的加入。從算術平均數的這些特點可以看出,如果一組數據是比較準確,可靠又同質,而且需要每一個數據都加入計算,同時還要作進一步代數運算時,用算術平均數表示其集中趨勢最佳。
3.如果你不知道兩個變量概念之間的關系,只知道兩個變量的相關系數很高,請問你可能做出什么樣的解釋?(武漢大學2004研)
答:相關系數是兩列變量間相關程度的數字表現形式,或者說是表示相關程度的指標。兩個變量的相關系數很高,只能說明兩變量間具有較高的共變關系,即一個變量的變化會引起另一個變量朝相同或相反方向發(fā)生變化。至于二者有無因果關系,或誰是因誰是果則無法確定。所以在解釋時只能說兩變量間存在較高的相關關系。
4.一組大學生的智力水平和性別之間求相關,設男為1,女為2。如果兩變量的相關為負,請問說明了什么情況?請舉例說明。(武漢大學2004研)
答:根據題意,如果兩變量的相關為負,則說明大學生的智力水平與性別存在負相關,即男生智力水平低,女生智力水平高。
舉例提示:本題所求的相關是點二列相關,一列變量為等距變量(智力水平),另一列變量為名義變量(性別)。根據點列相關的數據特點,列出兩組數據,運用相應公式計算即可。要注意的是,男生的智力水平平均分數應小于女生的。
5.某省進行了一次小學五年級的數學統考。已知不同小學教學水平相差較大,但同一個小學的五年級的不同班級教學水平很相近。以學生的考試成績?yōu)樵紨祿?,問?/p>
①如何處理這些原始數據,使得數據處理的結果能夠比較不同小學學生的數學學習潛能?
答:提示:使用標準分數。由于要考察的是不同學生的數學學習潛能,而非已有的數學水平,所以應該以每個學校的五年級學生為總體,求每個學生的標準分數,然后比較不同學校學生間的標準分數。
②如何處理這些原始數據,使得數據處理的結果能夠反映一個學校的教學水平?(南開大學2004研)
答:提示:一個學校的教學水平主要體現在學生的學習成績上,而學生成績的好壞有兩個標準:一是平均水平的高低,二是整體水平的差異。一般來說,平均水平越高,同時整體水平差異越小,表明該學校的教學水平高,反之則低。而同時反映了這兩個指標的只有差異系數(CV)。其公式為:
6.舉例說明相關程度很高的兩個變量之間并不存在因果關系。(北師大2001研)
答:變量之間的因果關系必須符合以下幾個條件:①二者之間必須有可解釋的相關關系;②二者必須有一定的時間先后順序,也就是說“因”的變化在前,“果”的變化在后,二者順序不能變;③二者不能是虛假關系(即一種關系被另一種關系被另一種關系取代后,原來的關系被證明不成立);④因果決定的方向不能改變。
而變量之間的相關關系是一種共變關系,即一種變量發(fā)生變化,另一種變量也相應地朝相同或相反方向發(fā)生變化。但有高相關的兩個變量之間并不一定存在因果關系,如一般情況下,數學成績好的學生,物理成績也會比較好,即兩者存在很高的正相關。但是,數學成績和物理成績之間沒有一定的時間先后順序,而且無法確定二者誰決定了誰,即不能滿足因果關系的②④兩個條件,所以不是因果關系。
7.度量離中趨勢的差異量數有哪些?為什么要度量差異量數?(西北師大2002研)
答:對于數據變異性即離中趨勢進行度量的一組統計量,稱作差異量數。這些差異量數有標準差或方差,全距,平均差,四分差及各種百分差等。
一組數據集中量數的代表性如何,可由表示差異情況的量數來說明。差異量數越小,則集中量數的代表性越大;若差異量數越大,則集中量數的代表性越小。如差異量數為零,則說明該組數據彼此相等,其值都與集中量數相同。集中量數是指量尺上的一點,是點值,而差異量數是量尺上的一段距離,只有將二者很好地結合,才能對一組數據的全貌進行清晰的描述。所以需要度量差異量數。
8.用算術平均數度量集中趨勢存在哪些缺點?試舉例說明。(重大2004研)
答:其缺點有:易受極端數據的影響;如果出現模糊不清的數據時,無法計算平均數,因為平均數的計算需要每個數據的加入。
如:有兩組物理成績:
第一組:25,37,32,60,100,99,96
第二組:63,72,60,68,63,62,61
盡管兩組成績的平均分相等都約為64,但由于極端數據的存在,64不能很好地代表第一組數據的平均水平,卻較好地代表了第二組數據。
計算題
1.五位教師對甲乙丙三篇作文分別排定名次如下表;
???????????????????????????????????? 名次
教師序號????????????? 甲?????????? 乙??????????? 丙
??????? 1????????????????? 3??????????? 1???????????? 2
??????? 2????????????????? 3??????????? 2???????????? 1
??????? 3????????????????? 3??????????? 1???????????? 2
??????? 4????????????????? 1??????????? 3???????????? 2
??????? 5????????????????? 1??????????? 3???????????? 2
請對上述數據進行相應的統計分析。(華東師大2003研)
答題提示:題目目的是讓考生對5位教師的一致性做出評價。該題是讓5個被試(教師)對3篇作文進行等級評定,每個被試都根據自己的標準對三篇作文排出了一個等級順序。所以應該計算肯德爾W系數。將題中原始數據代入公式即可。
2.計算未分組數據:18,18,20,21,19,25,24,27,22,25,26的平均數、中數和標準差。(首師大2003研)
答題提示:平均數與標準差的計算直接將原始數據代入相應公式即可。中位數的計算稍復雜一些。將數據從小到大進行排序,可知數組中雖有重復數據,但位于中間的數非重復數據,加之數據數為偶數,所以取第N/2和第N/2+1兩個數的平均數作為中數即可。
3.4名教師各自評閱相同的5篇作文,表2為每位教師給每篇作文的等級,試計算肯德爾W系數。(首師大2003研)
??????????????????? 表2? 教師對學生作文的評分
?
作? 文
????????????????????????? 評分者
?
1
?2
?3
?4
?
一
? 二
? 三
? 四
五
?3
5
2
4
1
?3
5
2
4
1
?3
4
1
5
2
?3
5
1
4
2
?
答題提示:將數據代入肯德爾W系數即可。
4.把下列分數轉換成標準分數。
11.0,11.3,10.0,9.0,11.5,12.2,13.1,9.7,10.5(華南師大2003研)
答題提示:先根據相應公式計算平均數和標準差,然后根據標準分數公式依次計算每個分數的標準分數。
5.假定學生的成績呈正態(tài)分布,某班五名學生的數學和物理成績如下,求相關系數。(重大2004研)
?????? 學生
????? 數學(X)
????? 物理(Y)
?
???????? 1
???????? 2
???????? 3
???????? 4
???????? 5
??????? 80
?????? 77
?????? 73
?????? 70
?????? 67
??????? 85
?????? 82
?????? 80
74
70
?
答題提示:兩列數據均為測量數據,而且呈正態(tài)分布,因此應該求積差相關。將數據代入積差相關公式即可。
第二章? 推斷統計
單選題
1.什么情況下樣本均值分布是正態(tài)分布?
A 總體分布是正態(tài)分布
B 樣本容量在30以上
C A和B同時滿足
D A或B之中任意一個條件滿足
(北京大學2000)
參考答案 D
2.以下關于假設檢驗的命題,哪一個是正確的?
A如果H0在 =.05的單側檢驗中被接受,那么H0在 =.05的雙側檢驗中一定會被接受
B如果t的觀測值大于t的臨界值,一定可以拒絕H0
C如果H0在 =.05的水平上被拒絕,那么H0在 =.01的水平上一定會被拒絕
D在某一次實驗中,如果實驗者甲用 =.05的標準,實驗者乙用 =.01的標準。實驗者甲犯II類錯誤的概率一定會大于實驗者乙。
(北京大學2000)
參考答案 D
3.讓64位大學生品嘗A B兩種品牌的可樂并選擇一種自己比較喜歡的。如果這兩種品牌的可樂味道實際沒有任何區(qū)別,有39人或39人以上選擇品牌B的概率是(不查表):
A 2.28%?? B 4.01%?? C 5.21%?? D 39.06%??????????? (北京大學2000)
參考答案 C
4.在多元回歸的方法中,除哪種方法外,各預測源進入回歸方程的次序是單純由統計數據決定的:
A逐步回歸???????????? B層次回歸?????????? C向前法???????? D后退法???????
(北京大學2000)
參考答案 B
5.以下關于假設檢驗的命題哪一個是正確的
A、實驗者甲用 =0.05的標準,實驗者乙用 =0.01的標準,甲犯II類錯誤的概率一定會大于乙:
B、統計效力總不會比 水平小?
C、擴大樣本容量犯II類錯誤的概率增加
D、兩個總體間差異小,正確拒絕虛無假設的機會增加。
(北京大學2002)
參考答案? D
6.已知X和Y的相關系數r1是0.38,在0.05的水平上顯著,A與B的相關系數r2是0.18,在0.05的水平上不顯著
A、r1與r2在0.05水平上差異顯著
B、r1與r2在統計上肯定有顯著差異
C、無法推知r1與r2在統計上差異是否顯著
D、r1與r2在統計上不存在顯著差異
(北京大學2002)
參考答案 C
7.在回歸方程中,假設其他因素保持不變,當X與Y相關趨近于0時,估計的標準誤是怎樣變化?
A、不變 B、提高 C、降低 D、也趨近于0
(北京大學2002)
參考答案? C
簡答題
1.非參數檢驗方法的特點有哪些?(浙江大學2005)
參考答案:
①一般不需要有嚴格的前提假設
②非參數檢驗特別適用于順序資料(等級變量)
③很適用于小樣本,且方法簡單
④最大的不足是未能充分利用資料的全部信息;⑤非參數方法目前還不能處理“交互作用”。
2.在被試取樣時,應該根據哪些因素確定樣本的大小?(華南師大2005)
參考答案
① 當進行平均數的估計時,當 確定后,總體標準差 和最大允許誤差d是決定樣本容量的兩個因子
② 當進行平均數假設檢驗時,需要同時考慮顯著性水平 、統計檢驗力 、總體標準差 以及所假設的總體差異 四個因子
3.能否用兩總體平均數差異z檢驗或t檢驗逐對檢驗多個總體平均數的差異顯著性問題?為什么?(華南師大2005)
參考答案:
不能,因為同時比較的平均數越多,其中差異較大的一對所得的t值超過原定臨界值t 的概率就越大,這時 錯誤的概率將明顯增大,或者說原本達不到顯著性水平的差異很容易被視為是顯著的。
4.試述分層抽樣的原則和方法?(華南師大2005)
參考答案:
分層抽樣是按照總體上已有的某些特征,將總體分成幾個不同部分,在分別在每一部分中隨機抽樣。分層的總的原則是:各層內的變異要小,而層與層之間的變異越大越好。在具體操作中,沒有一成不變的標準,研究人員可根據研究需要依照多個分層標準,視具體情況而定。
5.有人說:“t檢驗適用于樣本容量小于30的情況。Z檢驗適用于大樣本檢驗”,談談你對此的看法
(北京師范大學2004)
參考答案:
選擇t檢驗還是Z檢驗的主要標準不是樣本容量大小,而是欲檢驗的總體是否為正態(tài)分布以及總體方差是否已知。如果總體為正態(tài)而方差又已知,使用Z檢驗就可以了;而如果總體為正態(tài)而總體方差未知,就需要用無偏估計量來代替總體方差,這時應進行t檢驗;如果總體并非正態(tài)而總體方差也是未知的,在樣本容量大于30時,可以用Z檢驗但不能用t檢驗。如果總體非正態(tài)而樣本容量又小于30,既不能用Z檢驗也不能用t檢驗,需要使用非參數檢驗。
6.學業(yè)考試成績?yōu)閤,智力測驗分數為y,已知這兩者的rxy=0.5,IQ=100+15z,某學校根據學業(yè)考試成績錄取學生,錄取率為15%,若一個智商為115的學生問你他被錄取的可能性為多少,你如何回答他?(北京師范大學2004)
答案提示:很難給出一個確定的比率來回答該生可被錄取的可能性。就智商而言,該生在總體中的z值為1,百分比為84.26%,但并不能以此來推斷該生一定可被錄取,因為智商與考試成績之間的相關僅為0.5。
7.如果兩總體中的所有個體都進行了智力測驗,這兩個總體智商的平均數差異是否還需要統計檢驗?為什么?(北京師范大學2004)
參考答案:需要。還需要排除測驗中誤差的干擾,才能夠判斷出兩總體智商是否存在差異。
8.選擇統計檢驗程序的方法時要考慮哪些條件,才能正確應用統計檢驗方法分析問題?(北京師范大學2004)
參考答案:
① 總體分布特征
② 樣本容量
③ 總體方差是否已知
④ 對什么統計量進行檢驗?
⑤ 在進行方差分析時還要考察方差是否齊性、組間變異是否獨立
9.標準正態(tài)分布的曲線有哪些特點?(華東師范大學 1997)
參考答案:
正態(tài)分布具有以下特征:①正態(tài)分布的形式是對稱的(但對稱的不一定是正態(tài)的),它的對稱軸是經過平均數點的垂線,正態(tài)分布中,平均數、中數、眾數三者相等,此點y值最大(0.3989),左右不同間距的丁值不同,各相當間距的面積相等,值也相等;②正態(tài)分布的中央點(即平均數點)最高,然后逐漸向兩側下降,曲線的形式是先向內彎,然后向外彎,拐點位于正負1個標準差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交;③正態(tài)曲線下的面積為1,由于它在平均數處左右相對稱,故過平均數點的垂線將正態(tài)曲線下的面積劃分為相等的兩部分,各為0.5
10.方差分析的邏輯是什么?(華東師范大學 1997、2000)
參考答案:依據方差的可加性原理,將組內變異與組間變異區(qū)分開來,在運用F檢驗原理,判斷實驗處理效應與誤差效應是否存在顯著差異,依次確定實驗處理效應的大小。
11.完全隨機設計和方差分析和隨機區(qū)組設計的方差分析有什么區(qū)別?(華東師范大學 2001)
參考答案:一個重要的區(qū)別就是將區(qū)組方差從組內方差中分離出來,使方差分析結果更為精確可靠。
12.什么是非參數檢驗?它有什么特點?(華東師范大學 2001)
參考答案:
參數檢驗對欲檢驗的數據有較高的要求,如正態(tài)分布等,而非參數檢驗對數據的要求較低,適用于不適合參數檢驗數據的檢驗。
特點:
①一般不需要有嚴格的前提假設;②非參數檢驗特別適用于順序資料(等級變量);③很適用于小樣本,且方法簡單;④最大的不足是未能充分利用資料的全部信息;⑤非參數方法目前還不能處理“交互作用”。
13.為了建立最好的多元線性回歸方程,一般采用什么方式選擇自變量?(華東師范大學 2001)
參考答案:自變量對因變量變異的解釋能力
14.什么是二元線性標準回歸方程(2003 華東師范大學)
參考答案:兩個自變量、數據標準化后的方程
15.為什么抽樣調查得到的樣本統計可以推論總體參數.(2006北京師范大學)
參考答案:因為總體分布存在一定的理論模型,比如正態(tài)分布、二項分布等,樣本參數與總體分布之間的差異可以用推論的方式估計出來。
16.平均數的顯著性檢驗和平均數差異的顯著性檢驗的區(qū)別聯系(2005北師)
參考答案:前者檢驗的是樣本平均數與總體平均數之間的差異,后者檢驗的是兩樣本代表的不同總體之間的差異是否顯著。
17.正態(tài)分布的標準差有何統計意義,在統計檢驗中為什么會用到標準差?(北師大2003)
參考答案:正態(tài)分布的標準差仍然是數據離散程度的一個度量指標,在統計檢驗中,標準差成為度量樣本平均數與總體平均數之間差異的重要度量指標。
18. 正態(tài)分布的特征是什么,統計檢驗中為什么經常要將正態(tài)分布轉化成標準正態(tài)分布?(北師大2003)
參考答案:正態(tài)分布具有以下特征:①正態(tài)分布的形式是對稱的(但對稱的不一定是正態(tài)的),它的對稱軸是經過平均數點的垂線,正態(tài)分布中,平均數、中數、眾數三者相等,此點y值最大(0.3989),左右不同間距的Z值不同,各相當間距的面積相等,值也相等;②正態(tài)分布的中央點(即平均數點)最高,然后逐漸向兩側下降,曲線的形式是先向內彎,然后向外彎,拐點位于正負1個標準差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交;③正態(tài)曲線下的面積為1,由于它在平均數處左右相對稱,故過平均數點的垂線將正態(tài)曲線下的面積劃分為相等的兩部分,各為0.5
標準正態(tài)分布具有固定的標準誤與平均數值,能夠排除不同樣本數據度量單位不同造成的混亂,更易于推斷分析。
19.在進行差異的顯著性檢驗時,若將相關樣本誤作獨立樣本處理,對差異的顯著性有何影響,為什么?(北師大2003)
參考答案:可能會使本來存在顯著差異的兩組數據變得沒有差異,因為如果將相關樣本誤作為獨立樣本處理,會減小計算臨界Z值時選用的標準誤值,從而使本來得到的正確Z值變小,從而增加了不顯著的概率值。
20.為什么要做區(qū)間估計?怎樣對平均數作區(qū)間估計?(北師大2003)
參考答案:原因是想通過樣本統計量來預測總體參數的可能區(qū)間。
根據樣本平均數的分布仍然為正態(tài)分布這一原理,利用推論統計原理計算出平均數分布的標準誤,就可以推論出在一定置信度之上的總體參數置信區(qū)間。
21.抽樣調查要想得到比較準確的結果,需要控制哪些技術環(huán)節(jié)?(北師大2003)
參考答案:
① 界定好總體
② 選擇適當的抽樣方式,最好遵循隨機化原則
③ 標準化施測,盡量排除無關變量的干擾
④ 統計控制,選擇適當的統計處理方法
22.為什么假設檢驗中待檢驗假設為無差異假設?(2001年北師大)
參考答案:
假設檢驗的基本思想是概率性質的反證法,為了檢驗虛無假設,首先假定虛無假設為真,在這樣的前提下,如果導致違反邏輯或違背人們常識和經驗的不合理現象出現,則表明“虛無假設為真”的假定是不正確的,也就不能接受虛無假設。若沒有導致不合理現象出現,那就認為“虛無假設為真”的假定是正確的,也就是說要接受虛無假設。
這也就是假設檢驗中的“反證法”思想,但是它不同于純數學中的反證法。后者是在假設某一條件下導致邏輯上的矛盾,從而否定原來的假設條件。而假設檢驗中的不合理現象”是指小概率事件在一次試驗中發(fā)生了,它是給予人們在實踐中廣泛采用的小概率事件原理,該原理認為“小概率事件在一次試驗中幾乎是不可能發(fā)生的”。
23.為什么方差分析能夠分析出幾個平均數的差異?(2001年北師大)
參考答案:方差分析的基礎是方差的可分解性,它可以將來自于多個途徑的變異從總變異中分解出來,而后通過檢驗來判斷某種處理產生的變異量的大小。
24.指出t=5.53,p小于0.05的含義(2001年北師大)
參考答案:拒絕虛無假設所犯的概率小于0.05
25.非參數檢驗的方法有哪一些?其各自使用的條件是什么?(北京師范大學1999)
參考答案:
秩和檢驗法:適用于獨立樣本均值差異的非參數檢驗
中位數檢驗:適用于兩獨立樣本均平均數差異的非參數檢驗
符號檢驗法:適用于檢驗兩個配對樣本分布的差異
符號等級檢驗法:同符號檢驗法,但精度更高
26.t檢驗要滿足那些條件才能保證統計分析的有效性? (北師大1998)
①總體正態(tài)分布
②總體方差未知
③兩組比較,多組比較時最好用方差分析
27.方差分析之后,平均數進一步檢驗的步驟(北師大1998)
參考答案:N—K檢驗法的步驟
?(1)把要比較的各個平均數從小到大作等級排列;
?(2)根據比較等級和自由度在附表中查相應的q值。被比較的兩個平均數各自在上面的等級排列中所處等級之差再加上1,就是這兩個平均數的比較等級,自由度就是方差分析中的誤差項自由度;
?(3)利用公式計算樣本平均數的標準誤:
???? N相等時,標準誤計算公式為:SE =
??? 公式中MSE,是組內均方,n是每組容量。
N不等時,標準誤計算公式為:SE =
其中,n ,n 分別為兩個樣本的容量。
(4)計算q的臨界值(q SE );
(5)統計決斷。
28.寫出二項分布平均數及標準差的計算公式,并指出在心理實驗研究中的用處。(北京師范大學1997 )
參考答案:
二項分布在心理與教育研究中,主要用于解決含有機遇性質的問題。所謂機遇問題,即指在試驗或調查中,試驗結果可能是由于猜測而造成的。比如,選擇題目的回答,選對選錯,可能完全由猜測造成的。凡此類問題,欲區(qū)分由猜測而造成的結果與真實的結果之間的界限,就要應用二項分布來解決。
29.有人給你兩組數據,讓你幫助進行差異顯著性檢驗,寫出你對解決上述問題的思考程序。(北京師范大學1997 )
參考答案:
檢查總體是否正態(tài)
檢查總體方差是否已知
在總體非正態(tài)條件下看樣本容量大小
決定選用什么公式進行差異顯著性檢驗
進行檢驗并得出檢驗結論
30. 試說明參數區(qū)間估計的原理??。ū睅煷?996)
參考答案:
區(qū)間估計的原理與標準誤:樣本分布理論是區(qū)間估計的原理。在計算區(qū)間估計值,解釋估計的正確概率時,依據的是該樣本統計量的分布規(guī)律及樣本分布的標準誤(SE)。只有知道了樣本統計量的分布規(guī)律和樣本統計量分布的標準誤,才能計算總體參數可能落入的區(qū)間長度,并對區(qū)間估計的概率進行解釋。樣本分布可提供概率解釋,而標準誤的大小決定區(qū)間估計的長度。標準誤越小,置信區(qū)間的長度越短,而估計成功的概率仍能保持較高。一般地,加大樣本容量可使標準誤變小。在對總體參數實際進行估計中,人們當然希望估計值的范圍盡可能小些,而估計準確的概率大些。但在樣本容量一定的情況下,二者不可兼得。
31. 什么是方差分析?須滿足哪些條件?(北師大1996)
參考答案
方差分析又稱變異分析,功能在于分析實驗數據中不同來源的變異對總變異的貢獻大小,從而確定實驗中的自變量是否對因變量有重要影響,即用于置信度不變情況下的多組平均數之間的差異檢驗
進行方差分析時,數據必須滿足以下條件,否則結論會產生錯誤:
(1)總體正態(tài)分布
(2)變異的相互獨立性
(3)各實驗處理內的方差要一致
計算題
答案提示:
1.一位研究者用心理量表測量大學生的內外控傾向。隨機抽取了一個有8位男生,8位女生的樣本。男生組樣本均值X=11.4,SS=26;女生組樣本均值X=13.9,SS=30。試問兩組被試在此人格維度上是否存在顯著差異。
(北京大學2000)
答案提示:作兩總體都是正態(tài)分布且兩總體方差均未知的兩獨立樣本平均數差異顯著性檢驗。
先計算標準誤,公式為:
SE =
再計算臨界值,公式為:???
Z=
比較現有Z值與臨界值的大小,如果現有值大于臨界值,則差異顯著。
2.社會學家發(fā)現兒童早期被虐待可能導致青年期的犯罪行為。選取了25個罪犯和25個大學生,詢問其早期被虐待經歷,結果的次數分布如下。罪犯是否比大學生有更多的早期被虐待經歷?(用a=.05的標準作假設檢驗)
無早期被虐待經歷? 有早期被虐待經歷
罪犯???????? 9?????????????? 16
大學生?????? 19?????????????? 6
(北京大學2000)
答案提示:作獨立樣本四格表 檢驗。代入公式 =N(AD-BC) /[(A+B)(C+D)(A+C)(D+B)]求出 值,查自由度為1時的 值,與求出的 值作比較,如果實際值大于臨界值,則差異顯著,說明罪犯比大學生有更多早期被虐經歷。
3、學生輔導中心辦了一系列學習方法的講座,為評估整個系列講座的效果,隨機抽取了25個參加講座的學生,調查了他們在系列講座開始前那個學期的GPA和系列講座結束后那個學期的GPA,從差異均值分布看,這25個參加講座的學生提高了D1=0.72,和方SS=24,用數據來對系列講座提高GPA的效應進行點估計和90%的區(qū)間估計。? (北京大學2002)
答案提示:
區(qū)間估計: -Z < < +Z?? 將 值設為0.10即可
4、一位研究者發(fā)現大白鼠在T型迷津實驗中有右轉彎的偏好,在20次系列實驗中,一只大白鼠右轉17次,左轉3次,用適當的假設檢驗驗證大白鼠在T型迷津中右轉彎好偏好是否在統計上顯著? (北京大學2002)
答案提示:作配合度檢驗,理論次數均為10,代入公式 = 求出 ,查 分布表算出臨界值與當前 值比較,如果當前 值大于臨界值,則差異顯著。
5、通過隨機抽樣,抽取了A、B兩組被試,施以不同的教學方法,期末考試成績如下:
A組:119,110,132,106,121,120;
B組:133,128,130,134,129,136,133
為檢驗教學方法的效果有無顯著差異,請計算必要的檢驗統計量。(華東師范大學 2001)
答案提示:作兩獨立樣本t檢驗。先代入公式? SE =? 求出標準誤SE ,然后求出Z= ,查正態(tài)分布表得出臨界Z值,比較臨界值與當前Z值的大小,即可判斷是否存在顯著差異
6、134位學生參加寒假長跑訓練,開學后發(fā)現長跑成績顯著進步(由不及格變成及格)的有38人,顯著退步(由及格變成不及格)的有19人,問長跑訓練有無顯著效果?(華東師范大學 2001)
答案提示:作相關樣本四格表 檢驗,代入公式 = 求出 值,查df=1時的 值,比較兩者大小,如果實際 值大于臨界值,則差異顯著。
7、有5名女生,物理測驗成績分別是68,69,70,71,72;另有7名男生,成績分別是40,50,60,70,80,90,100。現需要知道男女生成績是否方差齊性,請計算相應的檢驗統計量(華東師范大學2002 )
答案提示:先分別求出兩組數據的方差,代入公式F= ,求出F值,查F分布表,比較當前F 值與臨界值的差異即可。
8、某小學根據各方面條件基本相同的原則將32名學生配成16對,然后把每對學生隨機分入實驗組和對照組,實驗組的16名學生參加課外科研活動,對照組的16名學生不參加此活動,一學期后,統一進行理解能力測驗。結果發(fā)現,有9對學生的理解能力測驗成績明顯拉開了距離,其中8對是實驗組學生得到“及格”,對照組學生得到“不及格”;1對是對照組學生得到“及格”,實驗組學生得到“不及格”。問:參加課外科研活動對理解能力測驗有無顯著影響?(華東師范大學2002)
答案提示:先作成四格表,而后做獨立性檢驗。代入公式 =N(AD-BC) /[(A+B)(C+D)(A+C)(D+B)]求出 值,比較當前 值與臨界值的差異,如果當前值大于臨界值,則差異顯著,否則不顯著。
9、有一團體的人數為300人,施測某一心理測驗的結果平均數為100,標準差為8,有被測者A的得分是113,問該團體中測驗得分高于A的被測者有多少人?回答這一問題尚須作哪些假設?(北師大1998)
答案提示:
??? 求出被試A在團體中的Z分數值,Z=(113-100)/8=1.625,查正態(tài)分布表確定其百分位95%。其前提假設是總體分布正態(tài)。
10、請選用參數與非參數的方法各一種,對下述結果進行差異檢驗,分析A、B、C三種實驗處理是否存在顯著差異?
A? 85? 90? 92??? 91?? 88
B? 90? 93? 95?? 100? 110
C? 110 115? 117? 116? 114
(北師大1998)
答案提示:
1) 參數檢驗:選用完全隨機實驗設計方差分析法
分別計算:
總平方和SS =
組間平方和SS = -
??? 組內平方和SS = -
然后計算自由度:
組間自由度dfb=K-1
組內自由度dfm=N-K
?而后計算均方:
MS =SS /(K-1); MS =SS /(N-K)
??? 再計算F值:F= MS / MS
??? 查表求理論F值:進行統計推斷——查表尋找相應的臨界值比較F與F ,從
而確定該樣本的戶是否為小概率,即是否P<0.05。
2)非參數檢驗:克—瓦氏單向方差分析法
11、請選恰當的參數與非參數方法分析下述兩組平均數是否存在顯著差異?
n1:3.6 4.2 4.0 5.0 3.7 3.8 4.1
n2:4.1 4.2 4.0 4.8 5.0 5.3 5.2 5.5
(北師大1998)
答案提示:
1)參數方法:獨立樣本t檢驗
? 求出每組數據方差后計算標準誤SE =
??? 計算臨界值,公式為:???
Z=
查正態(tài)分布表比較臨界值與當前Z值的大小,大于臨界值則說明差異顯著。
2)非參數檢驗:秩和檢驗法
原理:將兩個容量均小于10且第一個樣本小于第二個樣本的獨立樣本的數據合并在一起,按大小順序排列并賦予等級秩次。若無顯著差異,則兩個樣本各自秩次之和應該相等或接近相等。
??? 檢驗步驟:
??? ①虛無假設
??? ②編排秩次
??? ③求秩和:計算樣本容量較小一組的秩次和
??? ④查表求臨界值并進行統計決斷:根據兩個組的容量查表
12、有研究者欲考察某一高考試題的得分情況是否存在性別差異,統計結果如下:
??? 及格 不及格
男? 290??? 160
女? 100??? 350
該統計結果說明什么問題?
(北京師范大學1997 )
答案提示:作四格表獨立性檢驗,看男女生在及格率上的比率是否存在顯著差異。
依公式 =N(AD-BC) /[(A+B)(C+D)(A+C)(D+B)]求出 值(式中A,B,C,D分別為四格表內各格的實際數,(A+B),(C+D), (A+C),(D+B)為各邊緣次數,自由度df=1)。之后查 表比較臨界值與當前的 值大小即可,如果當前值落入了小概率事件內,則說明差異顯著。
?
13、有一區(qū)組設計的實驗數據,請用參數及非參數兩種方法檢驗其差異顯著性。
?? A1 A2 A3 A4
甲 2? 3? 4? 5
乙3? 5? 5? 6
丙3? 4? 6? 7
丁4? 6? 7? 8
(北京師范大學1997 )
答案提示:
參數檢驗過程:采用隨機區(qū)組設計的方差分析過程
總方差的構成:SS =SS +SS = SS +SS +SS
組內方差的構成:SS = SS +SS? (SS 為殘差; SS 為區(qū)組平方和)?
組內自由度:df =n-1; df =df -df - df =(N-1)-(K-1)-(n-1)=N-K-n+1
總平方和SS =
組間平方和SS = -
SSr= -
?SSE= + - -
然后計算自由度:
組間自由度dfb=K-1
組內自由度dfr=n-1
dfE=(k-1)(n-1)
?而后計算均方:
MS =SS /(K-1); MSr=SSr/(N-K)
??? 再計算F值:F= MS / MSe
??? 查表求理論F值:進行統計推斷——查表尋找相應的臨界值比較F與F ,從
而確定該樣本的戶是否為小概率,即是否P<0.05。
非參數檢驗過程:選用弗里德曼雙向等級方差分析過程
步驟:
1 將每一區(qū)組的K個數據(K為實驗處理數)從小到大排列出等級
2 每種實驗處理n歌數據(n為區(qū)組數)等級和,依Ri表示
3 代入公式
所得出的 弗里德曼雙向等級方差分析 表中的臨界值做比較,若當前的 值大于臨界值,則差異顯著。
?
14、有一區(qū)組設計的實驗結果,請用參數與非參數方法檢驗其三種不同條件下之結果有無顯著差異 。
被試a1???? a2???? a3
1?? 6.1??? 4.7???? 2.2?????
2?? 5.8??? 3.9???? 2.3???
3?? 7.1??? 5.8???? 3.1??
4?? 8.0??? 6.2???? 3.8?????
5?? 6.5??? 4.4???? 2.9???????
(北師大1996)
答案提示:
參數檢驗過程:采用隨機區(qū)組設計的方差分析過程
總方差的構成:SS =SS +SS = SS +SS +SS
組內方差的構成:SS = SS +SS? (SS 為殘差; SS 為區(qū)組平方和)?
組內自由度:df =n-1; df =df -df - df =(N-1)-(K-1)-(n-1)=N-K-n+1
總平方和SS =
組間平方和SS = -
SSr= -
?SSE= + - -
然后計算自由度:
組間自由度dfb=K-1
組內自由度dfr=n-1
dfE=(k-1)(n-1)
?而后計算均方:
MS =SS /(K-1); MSr=SSr/(N-K)
??? 再計算F值:F= MS / MSe
??? 查表求理論F值:進行統計推斷——查表尋找相應的臨界值比較F與F ,從
而確定該樣本的戶是否為小概率,即是否P<0.05。
非參數檢驗過程:選用弗里德曼雙向等級方差分析過程
步驟:
1 將每一區(qū)組的K個數據(K為實驗處理數)從小到大排列出等級
2 每種實驗處理n歌數據(n為區(qū)組數)等級和,依Ri表示
3 代入公式
所得出的 弗里德曼雙向等級方差分析 表中的臨界值做比較,若當前的 值大于臨界值,則差異顯著。
2022考研初復試已經接近尾聲,考研學子全面進入2023屆備考,跨考為23考研的考生準備了10大課包全程準備、全年復習備考計劃、目標院校專業(yè)輔導、全真復試模擬練習和全程針對性指導;2023考研的小伙伴針也已經開始擇校和復習了,跨考考研暢學5.0版本全新升級,無論你在校在家都可以更自如的完成你的考研復習,暑假集訓營帶來了院校專業(yè)初步選擇,明確方向;考研備考全年規(guī)劃,核心知識點入門;個性化制定備考方案,助你贏在起跑線,早出發(fā)一點離成功就更近一點!
考研院校專業(yè)選擇和考研復習計劃 | |||
2023備考學習 | 2023線上線下隨時學習 | 34所自劃線院??佳袕驮嚪謹稻€匯總 | |
2022考研復試最全信息整理 | 全國各招生院??佳袕驮嚪謹稻€匯總 | ||
2023全日制封閉訓練 | 全國各招生院校考研調劑信息匯總 | ||
2023考研先知 | 考研考試科目有哪些? | 如何正確看待考研分數線? | |
不同院校相同專業(yè)如何選擇更適合自己的 | 從就業(yè)說考研如何擇專業(yè)? | ||
手把手教你如何選專業(yè)? | 高校研究生教育各學科門類排行榜 |
相關推薦
跨考考研課程
班型 | 定向班型 | 開班時間 | 高定班 | 標準班 | 課程介紹 | 咨詢 |
秋季集訓 | 沖刺班 | 9.10-12.20 | 168000 | 24800起 | 小班面授+專業(yè)課1對1+專業(yè)課定向輔導+協議加強課程(高定班)+專屬規(guī)劃答疑(高定班)+精細化答疑+復試資源(高定班)+復試課包(高定班)+復試指導(高定班)+復試班主任1v1服務(高定班)+復試面授密訓(高定班)+復試1v1(高定班) | |
2023集訓暢學 | 非定向(政英班/數政英班) | 每月20日 | 22800起(協議班) | 13800起 | 先行階在線課程+基礎階在線課程+強化階在線課程+真題階在線課程+沖刺階在線課程+專業(yè)課針對性一對一課程+班主任全程督學服務+全程規(guī)劃體系+全程測試體系+全程精細化答疑+擇校擇專業(yè)能力定位體系+全年關鍵環(huán)節(jié)指導體系+初試加強課+初試專屬服務+復試全科標準班服務 |