常見名詞

假設:

  • 虛無假設(Null hypothesis):是我們想要檢定的假設。(通常用在我們推論它存在的敘述)
  • 對立假設(Alternative hypothesis):則是與虛無假設相反的敘述。

檢定的目的是確認虛無假設是否成立。如果虛無假設不成立,只表示虛無假設的陳述並不為真,但是並不表示接受對立假設。
p值代表「檢定統計值」為真的機率,或者說是拒絕虛無假設(出現相反結果)的機率有多少。p值檢定前先確定是連續變數(平均數有意義)還是類別變數(平均數無意義),而且樣本數需大於30,中央極限定理才成立
一般而言,為了確定從樣本(sample)統計結果推論至總體時犯錯的機率,我們會利用統計學家所開發的一些統計方法,進行統計檢定。
透過上述的檢定,我們把所得到的「統計檢定值」,跟統計學家們所建立了一些「隨機變量的概率分佈(probability distribution)」來進行比較,可以讓我們知道在多少百分比(%)的機會下,會得到目前的結果。
倘若經比較後發現,出現這結果的百分比非常少,亦即是說,是在機率很少、極為罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設null hypothesis,Ho的機率非常低)。
相反,若比較後發現,出現的機率很高,並不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒能確定。 
F值和T值

  • F值和T值就是這些統計檢定值,與它們相對應的概率分佈,就是F分佈和t分佈。
  • 到底F值和T值要多少才具參考價值,需找合適的文獻來舉證,而不是自己說了算。

P值統計顯著性(sig)就是出現目前樣本這結果的機率。 P值代表結果的可信程度,P越大,就越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。
型1錯誤vs型2錯誤

  • 「型1錯誤(Type Ⅰ error)」:把事實上樣本與母群是相同的,我們卻誤為樣本與母群不同,但被錯誤接受了虛無假設。—不顯著就拒絕可避免犯此錯誤,
  • 「型2錯誤(Type Ⅱ error)」:把事實上樣本與母群是有差異,我們卻誤為樣本與母群相同,但被錯誤拒絕了虛無假設。—不顯著就接受可避免犯此錯誤,

發佈留言