關於研究所 之 如何進行分析

MUMU
7 min readJun 16, 2019

--

在研究上,我們常聽到T檢定、卡方檢定、ANOVA單因子變異數分析等等,但這些又是甚麼呢? 這篇文章將主要放在檢定的介紹,在研究上能快速簡單的了解自己在進行分析的時候應該用甚麼方式。

在開始解說前,我們需要知道研究上面有哪些變項?

類別變項

類別變項是屬於彼此不相干的,就像是便條紙一樣,一張一張不能排順序的,像是國籍沒有先後順序,性別也是。

連續變項

連續變項就像是身高、體重、年齡這些都可以算是連續變項,或是血壓、水深等等可以分割成無限小數的數值,只能夠透過測量計量的方式來取得的,但特別注意,如果將連續變項進行區分,像是我們常常會把受測者的年齡做成區段,就會變成10~20歲這樣一個區間的時候就會變成類別變項。

(更正:月份單獨存在的時候不屬於連續變項)

開始分析

在我們進行分析的時候要先知道 aX+b=Y, X是自變項,也就是研究者所操弄的變數,a是你的實驗操作,Y會是所謂的依變項,Y會因為我們前面對他的態度、作法而受到影響。既然X跟Y都是變項,那他們就可能會是類別變項或是連續變項。

參考來源:https://www.yongxi-stat.com/scale-stat/

由上表可以知道每一種情況下有最合適的統計分析方法:

1. 假如你的自變項是連續變項,依變項也是連續變項,透過體重來當作自變項,檢測病人的心跳當作依變項,我們可以透過相關分析或是回歸分析來查看兩個數據是否具有相關性,可能得到一個結論就是當體重越重的時候心跳越快。

2. 假如自變項是類別變項,而依變項是連續變項,透過運動類型(籃球、游泳、相撲)來當作自變項,而運動員的身高是依變項,因為是兩組以上,而且只有一個自變項,所以要採用單因子變異數分析(One-way ANOVA)來進行分析。如果今天是性別對於數學成績的影響,因為性別是男、女兩組,因此使用獨立樣本T檢定來檢測兩組間是否有差異。(並且要注意這邊的自變項是不能相互影響的、或是出現跨組的情況)

3. 如果今天的自變項是類別變項,依變項也是類別變項,像是公司裡面男女的是否結婚,因為是同一樣本,檢定兩個變項的關聯性,這就是要使用卡方檢定來分析兩類別變數之間的關係。

SPSS進行資料分析

這次我們依樣使用Cola Test 可樂實驗的數據(這部分的數據是偽造的)我們要先將類別變項進行編碼,以便之後知道1代表男生、2代表女生之類的分類。

因為有三種可樂,1代表白色罐裝、2是黑色罐裝、3是正常紅色包裝。

並且我們也可以先將後面的量表進行值的解釋,之後跑統計也會比較方便。

1. 男生女生(類別變項)會不會影響到最喜歡的種類(類別變項)?

這時候我們可以使用卡方檢定來比較兩個類別變項,分析>敘述統計>交叉表。先將性別(其中一個類別變項)拉到列,喜歡的種類(另一個類別變項)拉到欄,在統計量的部分勾選卡方。

閱讀數據:

這時候我們可以看到報表的部分,性別與最喜歡的可樂會出現一個交叉對照表,可以看到不論男女最多人選擇的都是R(正常的紅色口樂)。

看到卡方檢定,可以看到Pearson卡方檢定的顯著性,是0.225,並沒有小於0.05,這表示不管是哪個性別對於喜好的可樂是沒有關聯的,也就是他們並不會因為性別而造成選擇上的差異。

2. 性別(類別變項)會不會影響到對於甜度的判斷(連續變項)?

我們假設女生很喜歡吃甜食,所以對於甜度的容忍度很大,對於甜度的分數會不會低於男生?因此我們使用獨立樣本t檢定來作檢定。

獨立樣本t檢定並不是只看兩組(男女)平均的差距,而是要看是不是有顯著的差距,如果差距不明顯,但平均有差距,這還不算是顯著差異。

分析>比較平均數法>獨立樣本t檢定 並定義組別(誰是1組 誰是2組)

1.單一樣本t檢定:是屬於抽樣推論到母體的檢定方式。
2.獨立樣本t檢定:當兩組不會互相干擾的時候,就可以使用獨立樣本。
3.成對樣本t檢定:同一群樣本,前後兩個時間點的測量進行成對計算。

閱讀數據:

我們看到報表,可以看到統計量表男生與女生的平均數基本上都有差異,然而這差異不代表統計上就有顯著性。

F檢定的顯著性(0.639, 0.716, 0.124)我們可以看到都沒有小於0.05因此第一個假設:假設變異數相等是不顯著的,不顯著代表變異數相等,我們就要看到雙尾顯著性的上排,要p值小於0.05才代表具有顯著性。
如果F檢定是顯著的<0.05,就要看下排的變異數不相等,因為顯著代表變異數不相等。

如果F檢定的顯著性>0.05,看第一個假設變異數相等的雙尾顯著性
F檢定顯著性<0.05,變異數不相等,因此要看不相等的情況是否有顯著性。

因此可以看當男生與女生在黑色零卡可樂的甜度上具有顯著差異。
女生普遍對於B的甜度不甜不明顯。

下篇:如何使用單因子變異數分析與相關、迴歸分析

結束整個實驗吧~開始寫探討

參考文章:
1.類別和連續變項:
https://vaccine-bc-huang.blogspot.com/2016/09/Variables-Categorical-Continuous.html
2.哪種統計分析方式好: https://researcher20.com/2008/08/11/%E7%94%A8%E5%93%AA%E7%A8%AE%E7%B5%B1%E8%A8%88%E5%88%86%E6%9E%90%E6%96%B9%E5%BC%8F%E5%A5%BD%EF%BC%9F%E5%8D%A1%E6%96%B9anovat-test-or-regression/
3.以測量尺度找出適合的統計分析方法:
https://www.yongxi-stat.com/scale-stat/
4.卡方檢定:
https://www.yongxi-stat.com/chi-squared-test-of-independence/
5.獨立樣本t檢定:
https://www.youtube.com/watch?v=lKo0fTmDyQI
6.卡方檢定:
https://www.youtube.com/watch?v=VQDZ2mwYbYQ

--

--

MUMU
MUMU

Written by MUMU

Ins: pai_product. Financial Product Manager. SH

Responses (1)