抽樣分佈有何特徵,三大抽樣分佈有什麼用

2021-03-03 21:08:22 字數 6384 閱讀 2942

1樓:江西泰豪學校

樣本來自總體,因此樣本中包含了有關總體的豐富的,但是這些是零散的,為了把這些零散的集中起來反映總體的特徵,我們取得樣本之後,並不是直接利用樣本進行推斷,而需要對樣本進行一番「加工」和「提煉」,把樣本中所包含的有關儘可能地集中起來,種有效的辦法就是針對不同的問題,構造出樣本的某種函式,這就是統計量。不同的函式可以反映總體的不同的特徵。

統計量的分佈叫抽樣分佈。統計量的性質以及使用某一統計量作推斷的優良性,取決於其分佈。所以抽樣分佈的研究是數理統計中的重要課題。

尋找統計量的精確的抽樣分佈,屬於所謂的小樣本理論的範圍,但是隻在總體分佈為正態時取得比較系統的結果。對一維正態總體,有三個重要的抽樣分佈,即ⅹ2分佈、t分佈和f分佈。

三大抽樣分佈有什麼用

2樓:demon陌

數理統計中的統計估計與推斷需要我們進行抽樣估計,樣本是統計估計和推斷的依據,然而,在處理具體的理論與應用問題時,卻很少直接利用樣本,而利用他們經過適當處理匯出來的量,這個量即統計量,統計量的分佈稱為抽樣分佈,三大分佈都是在正態分佈產生的,他們是正態總體統計估計和校驗的基礎。

由標準正態總體樣本的適當組合構成的統計量形成數理統計中的其他三大基礎分佈。所以,數理統計中總是以正態總體作為研究物件。在數理統計中,"總體"、"抽樣"、"樣本"是三個基本概念,分位點是"小概率事件"發生的臨界點,置信區間是引數估計和假設檢驗的核心計算問題。

樣本分佈和抽樣分佈的區別是什麼

3樓:是你找到了我

1、定義

樣本分佈是用來估計總體分佈的。樣本分佈有區別於總體分佈,樣本分佈是從總體中按一定的分組標誌選出來的部分樣本容量。

抽樣分佈也稱統計量分佈、隨機變數函式分佈,是指樣本估計量的分佈。

2、性質

樣本分佈函式的性質

(1)f(x)大於等於0,小於等於1;

(2)是非減函式;

(3)在每個觀測值處左連續,且在跳躍間斷點處的躍度等於頻率。

抽樣分佈的性質:

(1)從總體中隨機抽取容量為n的一切可能個樣本的平均數之平均數,等於總體的平均數;

(2)從正態總體中,隨機抽取的容量為n的一切可能樣本平均數的分佈也呈正態分佈。

(3)雖然總體不是正態分佈,如果樣本容量較大,反映總體μ和σ的樣本平均數的抽樣分佈,也接近於正態分佈。

3、範圍

樣本分佈是在樣本中x的取值範圍及其概率。樣本分佈也稱為經驗分佈,隨著樣本容量n的逐漸增大,樣本分佈逐漸接近總體分佈。

抽樣分佈是指樣本統計量的概率分佈。採用同樣的抽樣方法和同等的樣本量,從同一個總體中可以抽取出許許多多不同的樣本,每個樣本計算出的樣本統計量的值也是不同的。樣本統計量也是隨機變數,抽樣分佈則是樣本統計量的取值範圍及其概率。

4樓:人逐夢

總體是指考察的物件的全體, 個體是總體中的每一個考察的物件, 樣本是總體中所抽取的一部分個體, 而樣本容量則是指樣本中個體的數目。樣本分佈是用來估計總體分佈的。樣本分佈有區別於總體分佈,它是從總體中按一定的分組標誌選出來的部分樣本容量。

抽樣分佈:從已知的總體中以一定的樣本容量進行隨機抽樣,由樣本的統計數所對應的概率分佈稱為抽樣分佈。抽樣分佈是統計推斷的理論基礎。

5樓:在此間仍是少年

高數叔講概率統計18:樣本與抽樣分佈 **於:高數叔

簡述三大抽樣分佈與引數檢驗之間的關係 50

6樓:組編天下

1.總體:總體(population)是根據研究目的確定的同質的觀察單位的全體,更確切的說,是同質的所有觀察單位某種觀察值(變數值)的集合。

總體可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。

樣本:從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。

2.隨機抽樣:隨機抽樣(random sampling)是指按照隨機化的原則(總體中每一個觀察單位都有同等的機會被選入到樣本中),從總體中抽取部分觀察單位的過程。

隨機抽樣是樣本具有代表性的保證。

3.變異:在自然狀態下,個體間測量結果的差異稱為變異(variation)。

變異是生物醫學研究領域普遍存在的現象。嚴格的說,在自然狀態下,任何兩個患者或研究群體間都存在差異,其表現為各種生理測量值的參差不齊。

4.計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。

計量資料亦稱定量資料、測量資料。.其變數值是定量的,表現為數值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(1012/l)、脈搏(次/分)、血壓(kpa)等

計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料(count data)。計數資料亦稱定性資料或分類資料。

其觀察值是定性的,表現為互不相容的類別或屬性。如調查某地某時的男、女性人口數;**一批患者,其**效果為有效、無效的人數;調查一批少數民族居民的a、b、ab、o 四種血型的人數等。

等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數,稱為等級資料(ordinal data)。等級資料又稱有序變數。

如患者的**結果可分為**、好轉、有效、無效或死亡,各種結果既是分類結果,又有順序和等級差別,但這種差別卻不能準確測量;一批腎病患者尿蛋白含量的測定結果分為 +、++、+++等。

等級資料與計數資料不同:屬性分組有程度差別,各組按大小順序排列。

等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。

5.概率:概率(probability)又稱機率,是度量某一隨機事件a發生可能性大小的一個數值,記為p(a),p(a)越大,說明a事件發生的可能性越大。0﹤p(a)﹤1。

頻率:在相同的條件下,獨立重複做n 次試驗,事件a 出現了m 次,則比值m/n 稱為隨機事件a 在n 次試驗中出現的頻率(freqency)。當試驗重複很多次時p(a)= m/n。

6. 隨機誤差:隨機誤差(random error)又稱偶然誤差,是指排除了系統誤差後尚存的差。

它受多種因素的影響,使觀察值不按方向性和系統性而隨機的變化。誤差變數一般服從正態分佈。隨機誤差可以通過統計處理來估計。

抽樣誤差(sampling error )是指樣本統計量與總體引數的差別。在總體確定的情況下,總體引數是固定的常數,統計量是在總體引數附近波動的隨機變數。

7.系統誤差:系統誤差(systematic error)是指由於儀器未校正、測量者感官的某種偏差、醫生掌握療效標準偏高或偏低等原因,使觀察值不是分散在真值的兩側,而是有方向性、系統性或週期性地偏離真值。系統誤差可以通過實驗設計和完善技術措施來消除或使之減少。

8.隨機變數:隨機變數(random variable)是指取指不能事先確定的觀察結果。隨機量的具體內容雖然是各式各樣的,但共同的特點是不能用一個常數來表示,而且,理論上講,每個變數的取值服從特定的概率分佈。

9.引數:引數(paramater)是指總體的統計指標,如總體均數、總體率等。總體引數是固定的常數。

多數情況下,總體引數是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統計量估計未知的總體引數。

10.統計量:統計量(statistic)是指樣本的統計指標,如樣本均數、樣本率等。樣本統計量可用來估計總體引數。總體引數是固定的常數,統計量是在總體引數附近波動的隨機變數。

11.頻數表(frequency table)用來表示一批資料各觀察值或在不同取值區間的出現的頻繁程度(頻數)。對於離散資料,每一個觀察值即對應一個頻數,如某醫院某年度一日內死亡0,1,2…個病人的天數。

對於散佈區間很大的離散資料和連續型資料,資料散佈區間由若干組段組成,每個組段對應一個頻數。

12.算術均數(arithmetic mean)描述一組資料在數量上的平均水平。總體均數用μ表示,樣本均數用x 表示。

13.幾何均數(geometric mean)用以描述對數正態分佈或資料呈倍數變化資料的水平。記為g。

14.中位數(median)md將一組觀察值由小到大排列,n 為奇數時取位次居中的變數值;為偶數時,取位次居中的兩個變數的平均值。反映一批觀察值在位次上的平均水平。

15.極差(range)亦稱全距,即最大值與最小值之差,用於資料的粗略分析,其計算簡便但穩定性較差。

16.百分位數(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉化為百分位。百分位數的另一個重要用途是確定醫學參考值範圍。

17.四分位數間距(inter-quartile range)是由第3 四分位數和第1 四分位數相減計算而得,常與中位數一起使用,描述偏態分佈資料的分佈特徵,較極差穩定。

18.方差(variance):方差表示一組資料的平均離散情況,由離均差的平方和除以樣本個數得到。

19.標準差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用於近似正態分佈的資料,大樣本、小樣本均可,最為常用。

20.變異係數(coefficient of variation)用於觀察指標單位不同或均數相差較大時兩組資料變異程度的比較。用cv 表示。計算:標準差/均數*100%

21.統計推斷:通過樣本指標來說明總體特徵,這種從樣本獲取有關總體資訊的過程稱為統計推斷(statistical inference)。

22.抽樣誤差:由個體變異產生的,抽樣造成的樣本統計量與總體引數的差異,稱為抽樣誤差(sampling error)。

23.標準誤及x s :通常將樣本統計量的標準差稱為標準誤。

許多樣本均數的標準差x s稱為均數的標準誤(standard error of mean,sem ),它反映了樣本均數間的離散程度,也反映了樣本均數與總體均數的差異,說明均數抽樣誤差的大小。

24.可信區間:按預先給定的概率確定的包含未知總體引數的可能範圍。

該範圍稱為總體引數的可信區間(confidence interval,ci)。它的確切含義是:可信區間包含總體引數的可能性是1- α ,而不是總體引數落在該範圍的可能性為1-α 。

25.引數估計:指用樣本指標值(統計量)估計總體指標值(引數)。引數估計有兩種方法:點估計和區間估計。

26.假設檢驗中p 的含義:指從h0 規定的總體隨機抽得等於及大於(或等於及小於)現有樣本獲得的檢驗統計量值的概率。

27.i 型和ii 型錯誤:i 型錯誤(type i error ),指拒絕了實際上成立的h0,這類「棄真」的錯誤稱為i 型錯誤,其概率大小用α表示;ii 型錯誤(type ii error),指接受了實際上不成立的h0,這類「存偽」的誤稱為ii 型錯誤,其概率大小用β表示。

28.檢驗效能:1- β稱為檢驗效能(power of test),它是指當兩總體確有差別,按規定的檢驗水準a 所能發現該差異的能力。

29.檢驗水準:是預先規定的,當假設檢驗結果拒絕h0,接受h1,下「有差別」的結論時犯錯誤的概率稱為檢驗水準(level of a test),記為α 。

30..率(rate)又稱頻率指標,說明一定時期內某現象發生的頻率或強度。計算公式為:

發生某現象的觀察單位數/可能發生某現象的觀察單位總數*100%,表示方式有:百分率(%)、千分率(‰)等。

31.構成比(proportion)又稱構成指標,說明某一事物內部各組成部分所佔的比重或分佈。計算公式為:

某一組成部分的觀察單位數/同一事物各組成部分的觀察單位總數*100%,表示方式有:百分數等。

32.比(ratio)又稱相對比,是a、b 兩個有關指標之比,說明a 是b 的若干倍或百分之幾。計算公式為:a/b ,表示方式有:倍數或分數等。

33.非引數統計:針對某些資料的總體分佈難以用某種函式式來表達,或者資料的總體分佈的函式式是未知的,只知道總體分佈是連續型的或離散型的,用於解決這類問題的一種不依賴總體分佈的具體形式的統計分析方法。

由於這類方法不受總體引數的限制,故稱非引數統計法(non-parametric statistics),或稱為不拘分佈(distribution-free statistics)的統計分析方法,又稱為無分佈型式假定(assumption free statistics)的統計分析方法。

34.引數統計:通常要求樣本來自總體分佈型是已知的(如正態分佈),在這種假設的基礎上,對總體引數(如總體均數)進行估計和檢驗,稱為引數統計(parametric statistics)

35.秩次:變數值按照從小到大順序所編的秩序號稱為秩次(rank)。

36.秩和:各組秩次的合計稱為秩和(rank sum),是非引數檢驗的基本統計量。

37.直線迴歸(linear regression)建立一個描述應變數依自變數變化而變化的直線方程,並要求各點與該直線縱向距離的平方和為最小。直線迴歸是迴歸分析中最基本、最簡單的一種,故又稱簡單迴歸(****** regression)。

38.迴歸係數(regression coefficient )即直線的斜率(slope),在直線迴歸方程中用b 表示,b 的統計意義為x每增(減)一個單位時,y平均改變b 個單位。

39.相關係數r:用以描述兩個隨機變數之間線性相關關係的密切程度與相關方向的統計指標。

三大抽樣分佈的介紹,簡述三大抽樣分佈與引數檢驗之間的關係

三大抽樣分佈一般是指卡方分佈 2分佈 t分佈和f分佈。簡述三大抽樣分佈與引數檢驗之間的關係 50 1.總體 總體 population 是根據研究目的確定的同質的觀察單位的全體,更確切的說,是同質的所有觀察單位某種觀察值 變數值 的集合。總體可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有...

抽樣分佈總體分佈樣本分佈,有什麼聯絡

樣本分佈就來是樣本中所有源個體關於某bai個變數 標誌 的取值所形du成的分佈,反zhi映樣本分特徵的dao指標叫樣本統計量,通常用來表示。抽樣分佈就是樣本統計量的概率分佈,它由樣本統計量的所有可能取值和與之對應的概率所組成。總體分佈就是總體中所有個體關於某個變數 標誌 的取值所形成的分佈。抽取一組...

常用的抽樣調查方法有哪些?各有何優缺點

1 隨機抽樣 優點 操作起來非常簡便。缺點 只適用於總體單位數量有限的情況,否則編號工作繁重 對於複雜的總體,樣本的代表性難以保證,不能利用總體的已知資訊等。在市場調研範圍有限。或調查物件情況不明 難以分類或總體單位之間特性差異程度小時採用此法效果較好。2 分層抽樣 優點 可以降低總的抽樣誤差,在全...