黄色日韩视频_国产一级片在线_黄色网址站_japanhdfree日本妞_久草热播_亚洲色欲色欲77777小说_国精产品一区一区三区视频_裸体 videos hd视频_亚洲激情四射_欧美黑人精品一区二区_在线视频精品一_在线观看亚洲国产_人妻丰满被色诱中文字幕_国产各种高潮合集在线观看_www.涩涩涩_35pao在线观看_99热最新地址获取_www.youjizz在线_成熟YIN荡美妞A片视频麻豆_日韩色区_国产三级网站_在线看片国产精品_日韩久久精品一区二区三区官网_伊人99在线_极品美女扒开粉嫩小泬_国产高清在线精品一区_桃色av网站_董小宛 果冻传媒 麻豆_96533影视剧免费观看大全_日日夜夜噜

統(tǒng)計基礎

首頁 > > 統(tǒng)計基礎
  • 第3章 顯著性檢驗

    來源:默認管理員點擊數(shù):577發(fā)布時間:2012-12-18

      本章主要內(nèi)容:

      l認識統(tǒng)計顯著性的實質(zhì)

      l理解假設建立的概念及如何檢驗假設

      l 理解第一類誤差和第二類誤差的區(qū)別

      l 描述幾種常見的統(tǒng)計檢驗方法

      l方差分析

      3.1 評估差分和變化

      測量方法是否有區(qū)別是營銷管理人員關心的眾多問題的核心。下面是幾個具體例子:

      l 我們對認知度所做的事后測試的結(jié)果高于事先測試的記錄。是認知度真的提高了,還是另有別的解釋?我們是該終止與代理商的關系還是繼續(xù)委托它?

      l 我們的整體顧客滿意度得分從3個月前的92%上升到今天的93.5%,顧客滿意度真的提高了嗎?我們是否應該慶祝一番?

      l 采用10點制量表,達拉斯顧客對我們的有線電視系統(tǒng)提供的客戶滿意程度比辛辛那提的平均要高1.2。達拉斯的顧客顧客真的更為滿意么?辛辛那提的顧客服務負責人員是否該被撤換?達拉斯的負責人是否該受到獎勵?

      l 在最近的一次產(chǎn)品創(chuàng)意調(diào)查中,19.8%的被調(diào)查者說他們非??赡苜徺I他們評估的新產(chǎn)品。這是否是好事?是否比我們?nèi)ツ陮︻愃飘a(chǎn)品所做的調(diào)查結(jié)果要好?這種結(jié)果對我們是否推出新產(chǎn)品的決策有何意義?

      l 在一項市場細分調(diào)查中,我們發(fā)現(xiàn)年收入30000美圓以上的人去快餐店的次數(shù)平均每月為6.2次,而年收入為30000美元或以下的人去的次數(shù)為6.7次,這種差別是否真實?是否有意義?

      l 在一項認知度調(diào)查中,28.3%的被調(diào)查者在無提示的情況下說知道我們的產(chǎn)品。這是一個好的結(jié)果么?

      以上這些是在營銷調(diào)研中永遠存在的問題。盡管被一些人認為枯燥,但它們卻正是統(tǒng)計假設檢驗為什么重要的原因。假設檢驗有助于更接近這些問題的最終答案。我們說接近,是因為在市場調(diào)研中很少能完全確定地回答這些問題。

      3.2 統(tǒng)計顯著性

      統(tǒng)計推斷最根本的目的是從抽樣調(diào)查的結(jié)果中歸納出總體的特征。統(tǒng)計推斷的基本信條是,在數(shù)學意義上不同的數(shù)字在統(tǒng)計學意義上可能并沒有顯著的不同。例如,調(diào)查人員要求喝可樂的人蒙上眼睛品嘗兩種不同的可樂并說出自己更喜歡哪一種。結(jié)果表明,51%的人傾向于被試驗的一種,49%的人傾向于另一種。這里有一個數(shù)學上的差別,但這種差別極小且并不重要。它可能在我們準確判斷自己口味偏好能力的誤差范圍之內(nèi),這種差別在統(tǒng)計意義上可能并不顯著。關于差分有三個不同的概念:

      l 數(shù)學差分 根據(jù)定義,如果幾個數(shù)字不完全相同,它們就有差分。然而,這并不能說明差分的重要性及在統(tǒng)計上的顯著性。

      l 統(tǒng)計顯著性 如果一個特殊的差分大到不可能是由于偶然因素或抽樣誤差引起的地步,那么這個差分在統(tǒng)計意義上是顯著的

      l 管理意義上的重要差分 如如果或數(shù)字的差異程度從管理角度看是有意義的,那么我們可以說這個差分是重要的。例如,在顧客對兩種不同包裝的反應的調(diào)查中,其差分在統(tǒng)計上也許很顯著,但可能小到?jīng)]有實際及管理上的重要性。

      在本章,我們將介紹幾種檢驗結(jié)果是否具有統(tǒng)計顯著性的方法。

      3.3 假設檢驗

      假設可以定義為一個管理者或管理者對被調(diào)查者總體特征所做的一種假定或猜想。營銷人員常常要面臨這樣的問題,即調(diào)查結(jié)果是否與標準有很大的差別,以便決定公司營銷策略的某些方面是否需要改變。讓我們看看下面幾種情形:

      l 一項跟蹤調(diào)查的結(jié)果表明,顧客對產(chǎn)品的了解程度比6個月前所做的類似調(diào)查中顯示的要低。結(jié)果是否明顯降低?是否低到需要改變廣告策略的程度?

      l 一位經(jīng)理認為其產(chǎn)品購買者平均年齡為35歲。為檢驗其假設,他進行了一項調(diào)查,調(diào)查表明購買者平均年齡為36.5歲。調(diào)查結(jié)果與其觀點的差別是否足以說明此經(jīng)理的觀點是不正確的?

      l 一家快餐店的營銷部長認為她的顧客中60%為女性,40%為男性。為此她進行了一項調(diào)查,通過調(diào)查她發(fā)現(xiàn)顧客55%為女性,45%為男性。調(diào)查結(jié)果與她原來假設的差別是否足以讓她得出“她原來的假設是錯誤的”這一結(jié)論?

      所有這些問題都可以通過一定的統(tǒng)計檢驗來評估。在假設檢驗中,調(diào)查者測定一個關于總體特征的假設是否有根據(jù)。如果假設確實正確,統(tǒng)計假設檢驗便可以讓我們計算出一個特殊結(jié)果的概率。

      對于一項具體調(diào)查結(jié)果與假設值之間的差分有兩種主要的解釋:假設是正確的,差分很可能是因為抽樣的錯誤造成的;或者假設很可能是錯誤的,真正的數(shù)值是另外的值。

      假設檢驗的步驟

      檢驗一個假設主要有五個步驟。首先必須被明確。其次,選擇適當?shù)慕y(tǒng)計方法來檢驗假設。第三,判斷標準必須明確,并作為決定是否拒絕或不能拒絕(FTR)原假設H0的基礎。請注意,我們不說“拒絕H0或接受H0”,盡管這看似很細微的區(qū)別,但卻很重要。對這一區(qū)別我們在后文中進一步論述。第四,計算檢驗統(tǒng)計值并進行檢驗。第五,從初始問題或調(diào)查問題的角度陳述結(jié)論。

      1 陳述假設

      假設主要用兩種形式:原假設H0與備擇假設H1,原假設H0與備擇假設H1在檢驗時是相對的。例如:調(diào)研部經(jīng)理認為他的操作程序?qū)⑹诡櫩驮谄囐徫锎扒暗牡却龝r間為2分鐘,1000個樣本的平均時間為2.4分鐘,這時,原假設與備擇假設將表示如下:

      原假設H0:標準等待時間=2分鐘

      備擇假設H1:標準等待時間¹2分鐘

      2 選擇適當?shù)臋z驗統(tǒng)計量

      本章將介紹幾種檢驗方法,分析人員必須根據(jù)調(diào)查情況選擇合適的統(tǒng)計檢驗方法。

      3 確定判定規(guī)則

      從前面關于樣本均值的討論中可以發(fā)現(xiàn),抽樣結(jié)果與總體參數(shù)完全相等的情況幾乎是不可能發(fā)生的。關鍵的問題是,如果統(tǒng)計假設是正確的,實際樣本平均數(shù)和假設平均數(shù)間的差分是否會在一個可以接受的范圍。因此,需要一個判斷規(guī)則或標準,來決定是否拒絕或不拒絕原假設。統(tǒng)計上用顯著水平來說明判定規(guī)則。

      顯著水平(a)在選擇原假設和備擇假設的過程中是很關鍵的。顯著水平是判定原假設的可接受性時的一種認為很低的概率,如0.10,0.05或0.01。

      如果我們決定一項顯著水平為0.05的假設,這表示如果由于巧合或抽樣誤差,檢驗表明觀察結(jié)果發(fā)生的概率為5%,那么我們將拒絕原假設。對原假設的拒絕相等于認同備擇假設。

      4 計算統(tǒng)計檢驗值

      在這一步驟中,要求:

      l 運用適當?shù)墓接嬎憬y(tǒng)計檢驗值

      l 比較計算值與根據(jù)判定規(guī)則所得的嚴格的統(tǒng)計值(從適當?shù)慕y(tǒng)計表格中查得)

      l通過比較,得出是否拒絕原假設H0的結(jié)論

      5 表述結(jié)果

      從初始研究問題的角度表述你的結(jié)論,以總結(jié)檢驗結(jié)果。

      3.4 假設檢驗中的兩類錯誤

      假設檢驗中容易犯兩種錯誤類型,一般稱之為第一類錯誤和第二類錯誤。第一類錯誤發(fā)生在如下情形:調(diào)查者拒絕了原假設,而實際上它是正確的。調(diào)查得出的這種不正確的結(jié)論也許是由于樣本與總體值的差分是由于抽樣誤差造成的。調(diào)查者必須決定在多大程度上認同第一類錯誤。認同第一類錯誤的可能性被認為是a水平。相反地,如果在它事實上正確的時候,我們沒有拒絕它,那么1-a將是得出正確結(jié)論的概率。

      第二類錯誤發(fā)生在如下情形:原假設錯誤,而調(diào)查者沒有拒絕它。第二類錯誤被認為是b錯誤,1-b的值,反映了在原假設錯誤的時候,作出正確決定拒絕它的概率。這些不同的概率總結(jié)于表3.1中

      表3.1 第一類錯誤和第二類錯誤

      然而,對b的估計更為復雜,且已超出我們討論的范圍。并且,第一類錯誤與第二類錯誤并不是互補的,即

      對于任何假設檢驗,我們都希望能控制n(樣本容量)、a(第一類錯誤)及b(第二類錯誤)。遺憾的是,這三個量中我們只能控制兩個。對于一個規(guī)定了樣本量的問題,n是固定的,因此,a與b只能控制一個。

      3.5 假設檢驗方法

      本章將介紹最常用的檢驗和t檢驗

      3.5.1 t檢驗

      (1) t分布的背景

      從均數(shù)為m、標準差為s的正態(tài)分布總體中,隨機抽取一個含量為n的樣本,樣本均數(shù)為,

      理論證明:服從均數(shù)為、標準差為的正態(tài)分布,對其進行標準化,表達式的正態(tài)分布,對其進行標準化服從標準正態(tài)分布,由于s未知,用樣本標準差S代替,表達式,表達式所服從的分布即為t分布。

      (2) t分布的特點

      t分布類似于標準正態(tài)分布,以0為中心,左右兩側(cè)對稱,中間面積大,兩側(cè)面積小,象一個‘鐘型’曲線,曲線下的面積為1,理論證明,當樣本含量趨向無窮時,t分布即為標準正態(tài)分布。

      對任意給定的概率a,總對應一個點,在這個點的左側(cè)的面積為a/2,這個點,在統(tǒng)計學上稱為界點,常用表示,即從,包含了總體1-a的個體,a常取值0.05、0.01。

      (3) t檢驗的基本思想

      有一個服從正態(tài)分布的總體,研究者想知道總體均數(shù)是否為m0,于是從中隨機抽取一個樣本,若總體均數(shù)為m0,不妨取a=0.05,則服從t分布,t值應位于,否則,有理由懷疑總體均數(shù)為。

      (4) t檢驗的基本步驟

      第一步 建立假設并確定檢驗水準

      假設有兩種:1)檢驗假設H0(hypothesis to be tested)

     

      2)備擇假設H1(alternative hypothesis)

      常取a=0.05或a=0.01

      第二步 選定統(tǒng)計方法,計算統(tǒng)計量

      第三步 確定P值和作出推斷結(jié)論

      如,則

      ,認為H0不成立,否則,不拒絕H0。

      (5)實例

      某媒體報道:2000年廣州居民家庭平均總收入為3.6萬元,報道是否正確?某調(diào)查公司隨機調(diào)查了20個家庭,數(shù)據(jù)如下(單位:萬元):2.3、3.8、4.5、3.3、3.5、5.6、4.3、6.2、2.8、5.2、3.2、3.8、4.8、3.2、3.9、4.6、4.5、5.2、3.8、5.5

      經(jīng)計算: ,S=1.02,n=20

      查t界值表t0.05(20-1)=2.093,t>t0.05(20-1),P<0.05,可以認為,廣州市居民的年平均總收入不是3.6萬元。

      (6) t檢驗的基本類型

      t檢驗常用于以下3種情況

      (a) 樣本均數(shù)與總體均數(shù)比較的t檢驗

      (b) 兩樣本均數(shù)比較的t檢驗

      檢驗假設,備擇假設

      統(tǒng)計量為:

      自由度n=n1+n2-2

      其中,

      (c) 配對設計的t檢驗

      3.5.2檢驗

      基本思想

      舉例說明,調(diào)研部經(jīng)理對廣州、北京兩城市居民進行了電話訪問,樣本量分別為110、105。廣州100名被訪者中,60名使用該公司洗頭水,40名使用其他廠家產(chǎn)品;北京100被訪者總52名使用公司洗發(fā)水,48名使用其他廠家產(chǎn)品,調(diào)研部經(jīng)理需要判斷,該公司在兩城市的洗發(fā)水市場的占有率是否相同?,F(xiàn)將資料整理成如下形式:

      表3.2 甲、乙兩地某品牌洗發(fā)水使用情況

      表中,A11、A12、A21、A22這四個格子的數(shù)據(jù)是整個表的基本數(shù)據(jù),其余數(shù)據(jù)都是從這四個基本數(shù)據(jù)推算而來,因而,稱該表為四格表。我們想了解,廣州、北京該公司的占有率是否相同?經(jīng)計算,廣州樣本率為P1=59.1%;北京為P2=46.7%,廣州、北京兩地的樣本率不同,這個不同是由兩地總體率不同造成的?還是僅由抽樣誤差造成的?下面進行假設檢驗

      檢驗步驟為:

    ,即兩地該公司占有率相同

    ,即兩地占有率不相同

      顯著水平a取0.05,由相應表格查得,界值為3.84

            統(tǒng)計方法,選用檢驗,公式為:

      其中Aij為實際數(shù),Tij為理論數(shù),計算公式為

      本例計算如下:T11=121x110/215=61.9,同理可計算T12=110-61.5=48.1,T21=59.1,T22=45.9,代入公式,可得:

      由相應表格查得,a=0.05時

      界值為3.84,由此可得出P<0.05

      結(jié)論:P1與P2的差分按0.05的顯著水平屬于抽樣誤差,不拒絕H0,認為該公司在廣州、北京的占有率相同。

      3.6 方差分析

      方差分析(Analysis of Variance,簡稱ANOVA)是一種對多個樣本均數(shù)進行分析比較的統(tǒng)計方法,其基本原理是:指標的總變異又類別間的變異與隨機變異組成,通過分析總變異的構(gòu)成,推斷各類別總體均數(shù)是否相同。

      若需要檢驗兩個或兩個以上獨立樣本平均數(shù)的差異,方差分析(ANOVA)是一種合適的統(tǒng)計工具。雖然它可以用來檢驗兩個平均數(shù)的差異,但是它更主要地是用于對3個或3個以上獨立群體的平均數(shù)差異的假設檢驗??梢杂梅讲罘治龃_定樣本之間平均數(shù)的差異是否由抽樣誤差而引致的。上面論及的t檢驗可用于只涉及兩個樣本平均數(shù)時的檢驗假設,當有3個或3個以上樣本時,利用這兩種方法缺乏效率。例如,如有5個樣本及相應的平均,那么就需10次t檢驗來檢測每一對平均數(shù)。值得注意的是,當有3個或更多個平均數(shù)出現(xiàn)時,使用Z檢驗或t檢驗,也增加了出現(xiàn)每類錯誤的可能性。每兩個不同平均數(shù)的組合都必須被檢驗。檢驗的次數(shù)越多,夸大一對(或更多對)平均數(shù)真正由于抽樣誤差引起顯著差異的機會就越大。若顯著性水平為0.05,平均在20次檢驗中就會出現(xiàn)一次。

      單向方差分析經(jīng)常被用來分析實驗結(jié)果。例如,一家汽車配件連鎖店的市場總經(jīng)理正在考慮采用三種可能的服務來促銷:車輪校正、換油、調(diào)試。她想知道這三種方法帶來的潛在銷售量是存在顯著差異。

      在3個城市中共隨機出60家連鎖店(每個城市選 20家),每個城市分別增加一項服務,實驗期間的價格和廣告等保持一致。實驗共進行30天,其間的銷售情況將逐一記錄。

      表15-6快步示了每家店的平均銷售額。問題是,引起這些差異的主要原因是促銷方式還是純屬偶然?

      3.6.1 基本統(tǒng)計指標

      (1) 總變異

      統(tǒng)計量是總的離均差平方和,用SS總表示,假定共有k個類別,每類分別有ni(i=1,2,…,k)個個體,公式為:

      其中,,自由度

      (2) 組間變異

      組間變異為:

      組間均方變異為:

     

     

      其中,(i=1,2,…,k) ,自由度

      (3) 組內(nèi)變異

      組內(nèi)變異為:

      組間均方變異為:

      其中,自由度

      方差分析的基本思想是:當各類別總體均數(shù)相同時,間的差異

      由隨機誤差造成,

      的比值應接近1,當其比值大于1、并超出一定的范圍時,可以認為各類別間的總體均數(shù)不全相等、存在差異。

      3.6.2 統(tǒng)計量

      (1)整體均數(shù)比較

      對各類別均數(shù)整體方面的檢驗,統(tǒng)計量為:

        由分子自由度為、分母、顯著水平a,查方差分析專用F界值表,得界值,統(tǒng)計量F與界值

      比較,若,P<0.05,可以認為不同類別的總體均數(shù)不全相同,需進一步對兩兩間的情況進行檢驗,否則,P>0.05,認為各類總體均數(shù)相同。

      (2) 兩兩比較

      市場研究中,多個樣本均數(shù)間的兩兩比較(稱為多重比較,multiple comparison),常采用q檢驗(Newman-Keuls method,SPSS中用S-N-K法),統(tǒng)計量為:

    q界值除與顯著水平a有關外,還與分子、分母自由度有關,分子自由度等于A類與B類間的類別數(shù)a與分母自由度為誤差自由度。分子自由度a的計算方法是,將每類樣本均數(shù)按從小到大的順序排列,a=A類的序號-B類的序號+1。

      3.6.3 實例

      為評估某行業(yè)職工收入情況,調(diào)查三地該行業(yè)職工各6人,結(jié)果見下表。

      表1 三地某行業(yè)18名職工年收入表(萬元)

      (1) 統(tǒng)計描述

      

    (2) F檢驗

     

     界值F0.05(2,15)=3.68,P<0.05,可以認為三地平均工資有差異。

      (3) q檢驗

      

            按均數(shù)大小排列,(1)類別3,(2)類別1,(3)類別2,所以,a(1,2)=2,a(1,3)=2,a(2,3)=3

      顯著水平取0.05,查q界值表, q0.05(2,15)=3.01, q0.05(3,15)=3.67,經(jīng)比較,可以認為甲、丙地區(qū)間無差別,乙與甲、乙與丙間有差異。

    上一篇下一篇
? 当阳市| 洛川县| 开封县| 和龙市| 双峰县| 乡宁县| 固镇县| 宜宾县| 司法| 桦甸市| 资溪县| 云林县| 和平县| 泾源县| 南宫市| 新巴尔虎左旗| 尼勒克县| 乐亭县| 库伦旗| 阿拉善盟| 陇西县| 峨边| 温宿县| 视频| 涟源市| 文成县| 兴化市| 池州市| 双鸭山市| 衡水市| 长顺县| 乐业县| 乐昌市| 临江市| 庄浪县| 桂林市| 昌宁县| 巢湖市| 南开区| 胶州市| 通州区|