Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Tiểu luận Thống kê ứng dụng, Cheat Sheet of Mathematics

mô tả số liệu về thống kê suy diễn, ước lượng bằng spss

Typology: Cheat Sheet

2023/2024

Uploaded on 01/03/2025

trang-nguyen-thi-thuy-7
trang-nguyen-thi-thuy-7 🇺🇸

1 document

1 / 13

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
Chương 5: THỐNG KÊ SUY DIỄN
- Thống kê suy diễn là phương pháp thống kê được dùng chủ yếu
trong điều tra chọn mẫu. Thông qua dữ liệu thu nhập được từ mẫu,
ta có thể vận dụng phương pháp thống kê suy diễn để đưa ra kết
luận toonge thể.
1. Ưóc lượng.
a. Tổng chi tiêu một tháng
Descriptives
Statistic Std. Error
Tổng chi tiêu một tháng của
bạn là bao nhiêu
Mean 6580111.7642 788561.13833
95% Confidence Interval for
Mean
Lower Bound 5019076.2306
Upper Bound 8141147.2978
5% Trimmed Mean 5253559.1689
Median 5000000.0000
Variance 7648492627211
1.360
Std. Deviation 8745566.09215
Minimum 1.00E+6
Maximum 8.00E+7
Range 79000000.00
Interquartile Range 3000000.00
Skewness 6.160 .218
Kurtosis 45.497 .433
-
Dưa vào ước lượng khoảng (Confidence Interval for Mean) có thể thấy
dữ liệu từ bảng chỉ ra:
-Khoảng tin cậy 95% cho trung bình đã được cung cấp trong
bảng. Khoảng tin cậy này cho phép ước tính khoảng mà giá trị
trung bình thực sự của tổng thể có thể nằm trong đó.
Giới hạn dưới (Lower Bound) = 5,019,076.23 đồng.
Giới hạn trên (Upper Bound) = 8,141,147.30 đồng.
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Partial preview of the text

Download Tiểu luận Thống kê ứng dụng and more Cheat Sheet Mathematics in PDF only on Docsity!

Chương 5: THỐNG KÊ SUY DIỄN

- Thống kê suy diễn là phương pháp thống kê được dùng chủ yếu

trong điều tra chọn mẫu. Thông qua dữ liệu thu nhập được từ mẫu,

ta có thể vận dụng phương pháp thống kê suy diễn để đưa ra kết

luận toonge thể.

1. Ưóc lượng.

a. Tổng chi tiêu một tháng

Descriptives Statistic Std. Error Tổng chi tiêu một tháng của bạn là bao nhiêu Mean 6580111.7642 788561. 95% Confidence Interval for Mean Lower Bound 5019076. Upper Bound 8141147. 5% Trimmed Mean 5253559. Median 5000000. Variance 7648492627211

Std. Deviation 8745566. Minimum 1.00E+ Maximum 8.00E+ Range 79000000. Interquartile Range 3000000. Skewness 6.160. Kurtosis 45.497.

Dưa vào ước lượng khoảng (Confidence Interval for Mean) có thể thấy

dữ liệu từ bảng chỉ ra:

- Khoảng tin cậy 95% cho trung bình đã được cung cấp trong

bảng. Khoảng tin cậy này cho phép ước tính khoảng mà giá trị

trung bình thực sự của tổng thể có thể nằm trong đó.

 Giới hạn dưới (Lower Bound) = 5,019,076.23 đồng.

 Giới hạn trên (Upper Bound) = 8,141,147.30 đồng.

 Điều này có nghĩa là, với độ tin cậy 95%, trung bình tổng chi

tiêu mỗi tháng của tất cả sinh viên trong dân số sẽ nằm trong

khoảng từ 5,02 triệu đồng đến 8,14 triệu đồng/ tháng.

Với khảo sát thực hiện trên 123 mẫu sinh viên (n=>30), nên có thể dùng

độ lệch chuẩn của mẫu để thay thế cho độ lệch chuẩn tổng thể.

 Trung bình mẫu (Mean) : 6,580,111.76 đồng.

 Độ lệch chuẩn mẫu (Standard Deviation) : 8,745,566.09 đồng.

 Độ lệch chuẩn đo lường mức độ phân tán của các giá trị dữ

liệu so với giá trị trung bình. Trong trường hợp này, độ lệch

chuẩn 8,745,566.09 đồng cho thấy mức độ biến động rất lớn

và phân tán đáng kể trong chi tiêu hàng tháng của sinh viên.

Điều này có nghĩa là các sinh viên trong mẫu có sự chênh

lệch rất lớn về tổng chi tiêu mỗi tháng, với một số sinh viên

chi tiêu rất ít và một số khác chi tiêu rất nhiều với Range

(khoảng dao động) là 79,000,000 đồng.

b. Thu nhập từ làm thêm

Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent Số tiền mỗi tháng từ công việc làm thêm 31 25.2% 92 74.8% 123 100.0% Descriptives Statistic Std. Error Số tiền mỗi tháng từ công việc làm thêm Mean 9004239.8710 2660047. 95% Confidence Interval for Mean Lower Bound 3571697. Upper Bound 14436782. 5% Trimmed Mean 6419764. Median 4000000. Variance 2193514761097

 Giá trị trung bình (Mean) là số liệu đại diện cho mức thu

nhập trung bình của nhóm sinh viên từ công việc làm thêm,

trong trường hợp này là 9,004,239.87 đồng.

 Độ lệch chuẩn (Standard Deviation) là thước đo sự phân tán

hay biến động của dữ liệu so với giá trị trung bình. Độ lệch

chuẩn cao (ở đây là 14,810,519.10 đồng ) cho thấy các giá trị

trong dữ liệu có sự phân tán rộng rãi, tức là chúng khác biệt khá

nhiều so với giá trị trung bình.

 Ta thấy độ lệch chuẩn > giá trị trung bình , điều này chỉ ra

rằng có một sự phân tán lớn trong dữ liệu. Tức là, không

phải tất cả các giá trị đều gần với giá trị trung bình

(9,004,239.87 đồng). Đặc biệt, một số giá trị cực đại (

triệu đồng) và cực tiểu (2 triệu đồng) được gọi là những

giá trị ngoại lai so với giá trị trung bình, có thể là nguyên

nhân chính làm tăng độ lệch chuẩn.

2. Kiểm định giả thuyết thống kê

a. Kiểm định một mẫu

“ Mức lương trung bình mỗi giờ làm thêm của sinh viên”

One-Sample Statistics

N Mean

Std.

Deviation

Std. Error

Mean

Mức lương trung bình

mỗi giờ làm thêm

One-Sample Test

Test Value = 50.

t df Sig. (2-

tailed)

Mean

Difference

95% Confidence Interval

of the Difference

Lower Upper

Mức lương trung bình

mỗi giờ làm thêm

Từ dữ liệu bảng trên ta thấy :

 N (Số lượng mẫu) : 31 (số lượng mẫu là 31 giá trị).

 Mean (Giá trị trung bình) : 27,854.71 (mức lương trung bình

mỗi giờ làm thêm).

 Std. Deviation (Độ lệch chuẩn mẫu) : 10,346.91.

 Std. Error Mean (Sai số chuẩn của trung bình) : 1,858.36.

  • Giả thuyết không (H0): Mức lương trung bình mỗi giờ của sinh

viên là 50.

H0:μ=50.

  • Giả thuyết đối kháng (H1): Mức lương trung bình mỗi giờ của

sinh viên không bằng 50.

H1:μ≠22.

 t: Giá trị t-statistic = 14.962 là chỉ số cho biết mức độ khác

biệt giữa trung bình mẫu và giá trị giả thuyết (50.000 đồng).

o Giá trị t so với giá trị giả thuyết cho thấy sự khác biệt rất

đáng kể.

 df - Số bậc tự do (N – 1) : 30

 Sig. (2-tailed): 0.000. là giá trị p cho biết xác suất quan sát

được sự khác biệt này .Trong trường hợp này, giá trị p = 0.000,

nhỏ hơn mức ý nghĩa α = 0.05, điều này có nghĩa là có đủ bằng

chứng để bác bỏ giả thuyết H0.

 Mean Difference (Sự khác biệt trung bình): 27,804.71. Đây

là sự khác biệt giữa mức lương trung bình mẫu và mức lương

giả thuyết (50.000 đồng).

Từ bảng dữ liệu trên ta phát biểu giả thuyết không và giả thuyết đối  Giả thuyết H0 : Mức thu nhập hàng tháng trung bình giữa nhóm sinh viên có làm thêm và nhóm không làm thêm là không có sự khác biệt (tức là trung bình thu nhập của hai nhóm là như nhau). H0: μCó=μKhông  Giả thuyết H1 : Mức thu nhập hàng tháng trung bình giữa nhóm sinh viên có làm thêm và nhóm không làm thêm là có sự khác biệt. H1: μCó=μKhông

  • Theo kiểm định Levene's Test (Kiểm định sự đồng đều phương sai):  Với F = 13.106Sig. (p) = 0.000 cho thấy p-value =0.  Vì P < 0.05 , chúng ta bác bỏ giả thuyết H0 của Levene’s Test, tức là các phương sai không đồng đều giữa hai nhóm (nói cách khác, sự phân tán thu nhập giữa hai nhóm có sự khác biệt). - Theo T-test cho sự khác biệt về trung bình :Kết quả t-test với giả định phương sai đồng đều : o t = 1.804 , df = 120 , Sig. (2-tailed) = 0.074 cho thấy p-value = 0. o Vì P > 0.05 , chúng ta không bác bỏ giả thuyết H0 ở mức độ ý nghĩa 5%. Điều này có nghĩa là không có đủ bằng chứng để khẳng định có sự khác biệt về mức thu nhập hàng tháng giữa hai nhóm sinh viên có và không làm thêm.  Kết quả t-test với giả định phương sai không đồng đều: o t = 1.021 , df = 29.001 , Sig. (2-tailed) = 0.316 cho thấy p-value =0. o Vì P > 0.05 , chúng ta cũng không bác bỏ giả thuyết H0 trong trường hợp phương sai không đồng đều. Điều này một lần nữa khẳng định rằng không có sự khác biệt có ý nghĩa giữa thu nhập của nhóm sinh viên có làm thêm và nhóm không làm thêm. KẾT LUẬNKết luận từ kiểm định Levene's Test cho thấy phương sai giữa hai nhóm không đồng đều.  Tuy nhiên, t-test không chỉ ra sự khác biệt có ý nghĩa giữa thu nhập trung bình hàng tháng của sinh viên có làm thêm và không làm thêm, với p > 0.05 trong cả hai trường hợp (phương sai đồng đều và không đồng đều).

Không có đủ bằng chứng để bác bỏ giả thuyết H 0 rằng thu nhập hàng tháng giữa hai nhóm là giống nhau. Vậy nên mức thu nhập hàng tháng trung bình giữa nhóm sinh viên có làm thêm và nhóm không làm thêm là có sự khác biệt.

CHƯƠNG 6: TƯƠNG QUAN VÀ HỒI QUY TUYẾN

TÍNH

1. Phân tích tương quan

Correlations Tổng chi tiêu một tháng của bạn là bao nhiêu Chi tiêu cho vấn đề mua sắm khoảng bao nhiêu một tháng Tổng thu nhập hàng tháng Tổng chi tiêu một tháng của bạn là bao nhiêu Pearson Correlation 1 .208^ -. Sig. (2-tailed) .021. N 123 123 122 Chi tiêu cho vấn đề mua sắm khoảng bao nhiêu một tháng Pearson Correlation .208^1 .418** Sig. (2-tailed) .021. N 123 123 122 Tổng thu nhập hàng tháng Pearson Correlation -.022 .418**^1 Sig. (2-tailed) .810. N 122 122 122 *. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).

  • Từ dữ liệu bảng trên ta có giả thuyết: H₀: Không có mối quan hệ tương quan giữa các biến (Tổng chi tiêu một tháng, Chi tiêu cho vấn đề mua sắm, và Tổng thu nhập hàng tháng). H₀: ρ= H₁: Có mối quan hệ tương quan giữa các biến (Tổng chi tiêu một tháng, Chi tiêu cho vấn đề mua sắm, và Tổng thu nhập hàng tháng). **H₁: ρ≠ (Điều này có nghĩa là ít nhất một trong các cặp biến có mối quan hệ tương quan.) - Dựa trên bảng kết quả tương quan:  Tổng chi tiêu một tháng và Chi tiêu cho vấn đề mua sắm :

Total 93244494630987

121 a. Dependent Variable: Tổng chi tiêu một tháng của bạn là bao nhiêu b. Predictors: (Constant), Tổng thu nhập hàng tháng Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. 95.0% Confidence Inte B Std. Error Beta Lower Bound Upp 1 (Constant) 6621995.421 802514.406 8.252 .000 5033072.748 8 Tổng thu nhập hàng tháng .000 .002 -.022 -.241 .810 -. a. Dependent Variable: Tổng chi tiêu một tháng của bạn là bao nhiêu Giả thuyết kiểm định  Giả thuyết không (H₀) : Hệ số hồi quy của Tổng thu nhập hàng tháng (B) bằng 0, tức là Tổng thu nhập hàng tháng không có ảnh hưởng đến Tổng chi tiêu một tháng. H0: B=  Giả thuyết thay thế (H₁) : Hệ số hồi quy của Tổng thu nhập hàng tháng (B) khác 0, tức là Tổng thu nhập hàng tháng có ảnh hưởng đến Tổng chi tiêu một tháng. H1: B≠  Từ bảng dữ liệu trên ta thấy:R = 0.022 : Đây là giá trị tương quan giữa tổng chi tiêu một tháng và tổng thu nhập hàng tháng. Giá trị này rất nhỏ, cho thấy một mối quan hệ rất yếu giữa hai biến.  R Square = 0.000 : Giá trị này cho thấy chỉ có 0% sự thay đổi trong tổng chi tiêu một tháng có thể được giải thích bởi tổng thu nhập hàng tháng. Điều này chỉ ra rằng tổng thu nhập hàng tháng không phải là yếu tố giải thích đáng kể cho tổng chi tiêu.  ANOVA :  F = 0.058 và p = 0.810 : F-test kiểm tra tính phù hợp của mô hình hồi quy. Khi p > 0.05 , ta không có đủ bằng chứng để bác bỏ giả thuyết Ho. Điều này cho thấy mô hình hồi quy không đáng tin cậy và không giải thích được sự thay đổi trong tổng chi tiêu một tháng. .  Các hệ số hồi quy :

Hệ số chặn (Constant): (B) là 6,621,995.42 đồng, nghĩa là ngay cả khi tổng thu nhập hàng tháng bằng 0, tổng chi tiêu một tháng cũng có thể dao động ở mức 6,621,995. đồng.  Giá trị t=8.252 (Hệ số của hằng số) với p(Sig.)=0.Hệ số của hằng số (constant) là giá trị dự đoán của Tổng chi tiêu một tháng khi Tổng thu nhập hàng tháng bằng 0.  Giá trị t=8.252 lớn, có nghĩa là hằng số này khác biệt đáng kể so với 0 , và có tác động đáng kể đến biến phụ thuộc.  Đây là hệ số của hằng số , không phải hệ số của Tổng thu nhập hàng tháng , nên không liên quan trực tiếp đến giả thuyết về sự ảnh hưởng của Tổng thu nhập hàng tháng lên Tổng chi tiêu một tháng.  Giá trị t= −0.241 (Hệ số của Tổng thu nhập hàng tháng) với p=0..  Giá trị t=−0.241 rất nhỏ, gần bằng 0, có nghĩa là Tổng thu nhập hàng tháng không có ảnh hưởng đáng kể lên Tổng chi tiêu một tháng.  p=0.810 > 0.05 , do đó không bác bỏ H₀. Điều này có nghĩa là Tổng thu nhập hàng tháng không có ảnh hưởng đáng kể đến Tổng chi tiêu một tháng. Dựa vào dữ liệu trong kết quả hồi quy,ta lập được phương trình hồi quy cho Tổng thu nhập hàng tháng (Dependent Variable) theo các yếu tố dự báo là:  Phương trình hồi quy tuyến tính: *y^ = b 0 +b 1 xTổng chi tiêu một tháng = 6,621,995.421+0.000×Tổng thu nhập hàng tháng Vì B 1 =0.000, phương trình hồi quy trở thành:  Tổng chi tiêu một tháng = 6,621,995.  Điều này có nghĩa là Tổng chi tiêu một tháng chủ yếu chỉ phụ thuộc vào hằng số (intercept) và không có sự ảnh hưởng đáng kể từ Tổng thu nhập hàng tháng (do hệ số B 1 =0.000).  Tổng thu nhập hàng tháng không có ảnh hưởng có ý nghĩa thống kê đến Tổng chi tiêu một tháng, dựa trên giá trị t=−0.241 và p=0.810. Với t=8.252 và p (Sig.) , đây là hệ số của hằng số , không liên quan đến giả thuyết kiểm định của bạn về ảnh hưởng của Tổng thu nhập hàng tháng. Tuy nhiên, hằng số có ý nghĩa thống kê mạnh mẽ, chứng tỏ rằng giá trị cơ sở (intercept) ảnh hưởng đến biến phụ thuộc.  Hơn nữa, -0.241 không nằm trong khoảng tin cậy 95% từ -0.004 đến 0.003 , điều này càng xác nhận rằng hệ số của Tổng thu nhập hàng tháng không có ảnh hưởng đáng kể đến Tổng chi tiêu một tháng trong mô hình hồi quy này.  Có mối quan hệ tương quan giữa các biến (Tổng chi tiêu một tháng, Chi tiêu cho vấn đề mua sắm, và Tổng thu nhập hàng tháng).