Giáo trình thống kê kinh doanh

      706

Chương 1 GIỚI THIỆU VỀ THỐNG KÊ

1. Một số khái niệm cơ bản 1.1. Đơn vị tổng thể (phần tử), tổng thể, mẫu Đơn vị tổng thể (phần tử) là một thực thể cấu thành hiện tượng nghiên cứusố lớn, trên đó các dữ liệu được thu thập làm cơ sở cho việc nghiên cứu thống kêvề hiện tượng.

Bạn đang xem: Giáo trình thống kê kinh doanh

Tuỳ mục đích nghiên cứu mà đơn vị tổng thể (phần tử) có thểkhác nhau trên cùng một hiện tượng. Ví dụ, khi nghiên cứu thống kê về các khiếm khuyết của một loại sảnphẩm, một đơn vị tổng thể (phần tử) là một sản phẩm. Khi nghiên cứu về đơn thưkhiếu nại của khách hàng về sản phẩm, một đơn thư khiếu nại là một đơn vị tổngthể (phần tử). Khi nghiên cứu thị hiếu của khách hàng về một loại sản phẩm, mộtkhách hàng là một đơn vị tổng thể (phần tử). Tổng thể là tập hợp tất cả các đơn vị tổng thể (phần tử) có chung các đặcđiểm xác định một hiện tượng nghiên cứu cụ thể. Có hiện tượng, các đơn vị tổngthể (phần tử) biểu hiện rõ ràng, đầy đủ. Tổng thể này gọi là tổng thể bộc lộ. Vídụ, tổng thể các sản phẩm trong một kho hàng. Có hiện tượng, ranh giới của tổngthể là không rõ ràng, không thể biết hết tất cả các đợn vị tổng thể (phần tử) màchỉ biết các đặc tính qui định tổng thể đó. Tổng thể này được gọi là tổng thể tiềmẩn. Ví dụ, tổng thể khách hàng có thể có của một loại sản phẩm. Mẫu là một tập con của tổng thể. Mẫu thường bao gồm một nhóm nhỏ cácđơn vị tổng thể (phần tử) được chọn đại diện cho tổng thể theo một phương phápngẫu nhiên nào đó. 1.2. Tiêu thức (biến), quan sát Tiêu thức (biến) là khái niệm chỉ một đặc tính nào đó trên đơn vị tổng thể(phần tử) được chọn làm cơ sở để thu thập dữ liệu và nhận thức hiện tượngnghiên cứu. Ví dụ, với tổng thể khách hàng có thể có của một loại sản phẩm, các tiêuthức (biến) có thể được chọn là: nghề nghiệp, sở thích, giới tính, độ tuổi, mức thunhập, mức độ ưa thích sản phẩm... Quan sát là khái niệm chỉ các giá trị (số đo) thu thập được trên các tiêuthức (biến) của một đơn vị tổng thể (phần tử). Tập hợp các các giá trị (số đo) thuthập được trên một đơn vị tổng thể (phần tử) được gọi là một quan sát. Tiêu thức (biến) thường được phân biệt thành hai loại là định tính (thuộctính) và định lượng (số lượng).

Tiêu thức (biến) định tính là tiêu thức (biến) mà các quan sát của nó là cácloại hình, các tính chất hoặc các con số định danh. Ví dụ, nghề nghiệp, sở thích,giới tính, số nhà...Tiêu thức (biến) định lượng là tiêu thức (biến) mà các quan sát của nó làcác con số định lượng (gọi là lượng biến). Ví dụ, độ tuổi, mức thu nhập... Có hailoại lượng biến là lượng biến rời rạc và lượng biến liên tục.

Lượng biến rời rạc là lượng biến chỉ nhận những giá trị nguyên. Ví dụ,số thành viên trong hộ, số xe máy sở hữu...Lượng biến liên tục là lượng biến có khả năng nhận mọi giá trị trên trụcsố. Ví dụ, mức thu nhập, tiền lương, chi phí sản xuất...1.2.3. Tham số tổng thể, thống kê mẫu*Một tham số tổng thể là một trị số tổng hợp của cả tổng thể nghiên cứu.Một thống kê mẫu là một trị số tổng hợp của một mẫu của tổng thể. Tham sốtổng thể và thống kê mẫu được gọi chung là chỉ tiêu thống kê.Ví dụ: Dữ liệu mẫu ở 1 thị trường năm 2014 cho biết: Tỉ lệ người có thunhập trên 5 triệu đồng là 40% là một thống kê mẫu; dữ liệu từ một điều tra toànbộ dân số của một nước cho biết: Thu nhập bình quân đầu người là 1,8 triệu làmột tham số tổng thể.1.3 Các loại thang đo trong thống kê*Tuỳ theo mức độ chặt chẽ của việc đo lường, người ta thường chia thang đotrong dữ liệu thống kê làm bốn loại sau:- Thang đo danh định: Dữ liệu trên thang đo này chỉ thể hiện danh tính,không làm được bất kỳ phép tính nào từ so sánh đến cộng, trừ, nhân, chia. Ví dụ,giới tính, số nhà, số xe...Thang đo này thường dùng với tiêu thức định tính.- Thang đo thứ bậc: Dữ liệu trên thang đo này thể hiện thứ bậc hơn, kém,cao, thấp nhưng với khoảng cách (đơn vị) không đều. Ví dụ, mức độ ưa thíchmột loại sản phẩm... Dữ liệu trên thang đo này chỉ làm được phép tính so sánh.Các phép toán khác không bảo đảm ý nghĩa. Thang đo này thường được dùngvới tiêu thức định tính.- Thang đo khoảng: Dữ liệu trên thang đo này thể hiện rõ độ lớn hơn kémvới khoảng cách (đơn vị) đều nhưng không có số không tuyệt đối. Ví dụ, điểm

Trong bảng trên, dữ liệu của một đơn vị tổng thể (phần tử) được thể hiện trênmột dòng đó chính là một quan sát.Ví dụ: Có dữ liệu mẫu về 18 đơn thư khiếu nại của khách hàng được chọnngẫu nhiên.

Số Tuổi Giới Gía Lần Thời Yêuthứ tính gian Loại cầucủa Nơi trị sản khiếutự của gặp sự sự củađơn khách khách mua phẩm nại cố cố kháchthư hàng hàng (tr.đ) thứ (ngày) hàng1 22 Nữ A 2,5 1 32 Kêu B.T2 26 Nam B 1,8 2 24 Bể Đổi3 25 Nam A 12,5 1 67 Rỉ Đổi4 27 Nữ B 4,5 3 33 Nứt B.T5 26 Nữ B 2,8 1 28 Cháy B.T6 26 Nữ D 6,4 2 64 Cháy B.T7 25 Nam F 10,2 1 45 Kêu Sửa8 27 Nữ A 3,5 2 21 Nứt Đổi9 26 Nam C 6,8 1 29 Nứt B.T10 48 Nữ C 5,5 3 21 Rỉ Đổi11 26 Nam A 4,7 2 12 Bể Sửa12 25 Nam A 8,2 1 48 Kêu Đổi13 26 Nam C 9,1 2 57 Rỉ Sửa14 25 Nữ B 7,4 2 42 Bể B.T15 60 Nam A 5,8 1 22 Cháy Sửa16 27 Nữ B 4,4 2 34 Nứt B.T17 26 Nữ B 9,7 1 68 Bể B.T18 27 Nam C 2,6 1 39 Kêu SửaKí hiệu: B.T: Bồi thường

Dữ liệu chuỗi thời gian: Là dữ liệu về một hiện tượng nghiên cứu đượcthu thập ở nhiều thời gian khác nhau.Ví dụ: Có dữ liệu về lợi nhuận của một doanh nghiệp như sau.

1.5. Các nguồn dữ liệu sử dụng trong thống kê Có hai nguồn dữ liệu được sử dụng trong thống kê là dữ liệu sơ cấp và dữliệu thứ cấp.

Dữ liệu sơ cấp: Là loại dữ liệu do đơn vị nghiên cứu tổ chức thu thập trựctiếp từ đối tượng nghiên cứu hoặc thuê một tổ chức chuyên nghiệp khác thu thập.Việc thu thập dữ liệu sơ cấp có thể được tiến hành thông qua điều tra (quansát) thống kê trên toàn bộ các đơn vị tổng thể của tổng thể gọi là điều tra toàn bộhoặc điều tra (quan sát) thống kê trên một mẫu của tổng thể gọi là điều tra mẫu.Việc thu thập dữ liệu sơ cấp cũng có thể được tiến hành thông qua nghiêncứu thực nghiệm. Trong một nghiên cứu thực nghiệm, một số biến quan tâmđược xác định trước. Sau đó một hoặc nhiều biến khác được xác định, điều chỉnhhoặc kiểm soát sao cho dữ liệu thu được phản ánh được ảnh hưởng của chúngđến biến quan tâm ban đầu như thế nào.Nguồn dữ liệu sơ cấp có độ chính xác cao, bảo đảm tính cập nhật nhưngtốn nhiều thời gian và chi phí.

Dữ liệu thứ cấp: Là loại dữ liệu được thu thập từ các nguồn tài liệu có sẵnbên trong hay bên ngoài doanh nghiệp như các chứng từ sổ sách của doanhnghiệp, các tập san, tạp chí chuyên đề, niên giám thống kê của tổng cục thống kê,các công trình nghiên cứu đã công bố, dữ liệu của IMF, dữ liệu của Wordbank,dữ liệu trên mạng internet, ...Ví dụ: Dữ liệu sẵn có từ các hồ sơ nội bộ các công ty

Nguồn Một số dữ liệu sẵn cóHồ sơ nhân viên Tên, địa chỉ, số an sinh xã hội

Hồ sơ sản xuất

Số bộ phận, số lượng sản xuất, chi phí nhân công trựctiếp, chi phí nguyên liệu

Hồ sơ tồn kho

Số bộ phận, số lượng tồn kho, mức đặt hàng lại, số lượngđơn hàngHồ sơ bán hàng Số sản phẩm, lượng hàng bán, lượng hàng bán theo vùngHồ sơ tín dụng Tên khách hàng, hạn mức tín dụng, khoản phải thuHồ sơ khách hàng Tuổi, giới tính, thu nhập, số người trong hộ

Nguồn dữ liệu thứ cấp ít tốn thời gian và chi phí thu thập nhưng thườngthiếu tính cập nhật, kém phù hợp, đôi khi không đầy đủ.

Chương 2 THỐNG KÊ MÔ TẢ

Dữ liệu chéo mới thu thập được thường rất nhiều và rối rắm. Chúng tathường bị nhiễu loạn và rất khó nhận thức được điều gì hữu ích về hiện tượngnghiên cứu trước một khối lượng lớn dữ liệu như vậy. Các phương pháp thốngkê mô tả dữ liệu chéo giúp tóm lược dữ liệu nhằm làm bộc lộ các đặc trưng cơbản nhất, đáng quan tâm nhất về hiện tượng nghiên cứu. Mục đích là cung cấpcái nhìn sâu hơn về dữ liệu mà chúng ta không thể thấy được ngay trên dữ liệuban đầu.

2.1. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (biến) định tính bằng bảngphân phối và biểu đồ2.1.1. Lập bảng phân phối

Trường hợp tiêu thức (biến) có ít biểu hiện kiểu loại khác nhau: Bảngphân phối tần số được lập với một kiểu loại thuộc tính khác nhau là một tổ(nhóm).Ví dụ: Xét dữ liệu chéo ở trang 3 về 18 đơn thư khiếu nại. Bảng phân phốitần số theo tiêu thức (biến) yêu cầu của khách hàng được lập như sau. Trong đó,tần số là số đếm các quan sát trong mỗi tổ (nhóm) yêu cầu của khách hàng.

Yêu cầu của Tần số khách hàng Sửa 5 Đổi 5Bồi thường 8

Bảng phân phối tần số trên cho thấy các yêu cầu của khách hàng khiếu nạixuất hiện khá đều trên cả ba loại yêu cầu, trong đó yêu cầu bồi thường có phầnnhiều hơn.Ngoài phân phối tần số như trên, bảng phân phối có thể được lập theo phân

phối tần suất hay tần suất phần trăm. Tần số (fi) của một tổ (nhóm) là số quan sát

trong tổ (nhóm) đó. Tần suất là tỉ trọng hay tỉ lệ (fi/n) giữa tần số (fi) so với tổngsố quan sát (n) của dữ liệu. Tần suất phần trăm bằng tần suất nhân với 100. Nócho biết mỗi tổ (nhóm) chiếm bao nhiêu phần trăm trên mẫu hay tổng thể. - Trường hợp tiêu thức (biến) có nhiều biểu hiện kiểu loại khác nhau:

Để tránh hiện tượng bảng phân phối được lập với quá nhiều kiểu loại có tầnsố rất thấp làm cho bảng quá dài và khó nhận thức, người ta thường ghép cácbiểu hiện kiểu loại gần giống nhau về tính chất thành một một số tổ (nhóm khôngchồng lẫn) sao cho thuận lợi trong việc nhận thức bản chất của hiện tượng. Cóthể thử một vài cách ghép khác nhau để từ đó chọn ra cách ghép cho nhận thứcrõ nhất về hiện tượng.

Xem thêm: Áo Sơ Mi Nam Giá Rẻ 100K Chính Hãng, Giá Sốc, Mua Ngay, Áo Sơ Mi Nam Dưới 100K Giá Tốt Tháng 10, 2021

Ví dụ , Xét dữ liệu chéo ở trang 3. Bảng phân phối tần số theo tiêu thức(biến) loại sự cố có thể được lập như sau.Tiêu thức (biến) loại sự cố ở đây thực sự có không quá nhiều loại sự cố khácnhau (6 loại). Bảng phân phối có thể được lập với 6 tổ (nhóm) là 6 loại sự cốkhác nhau: bể, nứt, rỉ, cháy, hỏng, kêu.Tuy nhiên, giả sử 6 loại sự cố được xem là khá nhiều so với 18 đơn thư khiếunại và không hữu ích lắm trong quản lý sự cố. Bảng phân phối cũng có thể đượclập bằng cách ghép 6 loại sự cố thành 2 tổ (nhóm): tổ (nhóm) thứ nhất với tên gọilà sự cố vật liệu bao gồm 3 loại sự cố bể, nứt, rỉ; tổ (nhóm) thứ hai với tên gọi làsự cố kỹ thuật bao gồm 3 loại sự cố cháy, hỏng, kêu.

Loại sự cố Tần sốSự cố vật liệu 10Sự cố kỹ thuật 8

Bảng phân phối tần số trên cho thấy hai loại sự cố vật liệu và kỹ thuật xuấthiện khá đều nhau, trong đó sự cố vật liệu có phần nhiều hơn.2.1.2. Trình bày bằng biểu đồPhân phối của tiêu thức (biến) định tính thường được mô tả (trình bày)bằng biểu đồ hình bánh (hình tròn) hay biểu đồ hình thanh. Trình bày dữ liệutrong bảng phân phối lên đồ thị thích hợp sẽ giúp ta mô tả tóm tắt các đặc trưngphân phối của hiện tượng nghiên cứu bằng hình ảnh.Ví dụ, Có bảng phân phối 900 người tiêu dùng theo các nhóm nghề nghiệp:

Nhóm nghề nghiệp Tần số (fi) Tần suất %

Chính khách và doanh nhân 30 3Giới lao động khoa học 100 11Công chức hành chính 250 28Công nhân viên lao động trực tiếp 400 45Người làm các công việc khác 120 13Tổng cộng 900 100

Tần số BIỂU ĐỒ HÌNH THANH (BAR CHARTS)25020015010050Mức độ0 ưa thíchKhong Thich it Kha Thich Rat sản phẩmthich thich thich

2.2. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (biến) định lượng bằng bảngphân phối và biểu đồ2.2.1. Lập bảng phân phối

Trường hợp tiêu thức (biến) là rời rạc và biến thiên ít: Bảng phân phốitần số được lập với mỗi giá trị rời rạc là một tổ (nhóm).Ví dụ: Xét dữ liệu về 18 đơn thư khiếu nại ở trang 3. Bảng phân phối theotiêu thức (biến) số lần khiếu nại của khách hàng được lập như sau.

Số lần khiếu nại Tần số 1 9 2 7 3 2

Bảng phân phối tần số trên cho thấy số lần khiếu nại của khách hàng khiếunại xuất hiện giảm dần theo số lần khiếu nại, trong đó tập trung nhiều nhất làkhiếu nại lần đầu, tiếp đến là khiếu nại lần thứ hai.

Trường hợp tiêu thức (biến) là liên tục hay rời rạc và biến thiên nhiều:Trước hết cần phân tổ (phân nhóm) dữ liệu thành một số tổ (nhóm). Thôngthường người ta chọn phân tổ đều với một số lượng tổ chọn trước. Mỗi tổ sẽ cóhai giới hạn:Giới hạn dưới: là lượng biến nhỏ nhất của tổ làm cho tổ đó hình thành.Giới hạn trên: là lượng biến lớn nhất của tổ. Vượt quá giới hạn này sẽsang tổ khác.Chênh lệch giữa hai giới hạn mỗi tổ gọi là Trị số khoảng cách tổ.

Công thức tính trị số khoảng cách tổ đều:

h = ( xmax - xmin ) / k

Trong đó: h : Trị số khoảng cách tổ xmax : Lượng biến lớn nhất xmin : Lượng biến nhỏ nhất k : Số tổ lựa chọn

Để đạt hiệu quả cao trong mô tả tóm tắt dữ liệu, người ta thường cân nhắcchọn k trong khoảng từ 5 đến 20. Nguyên tắc chung là số đơn vị tổng thể nhiềuthì chọn k lớn và ngược lại. Có thể thử một vài giá trị của k để tìm giá trị k saocho bức tranh phân phối rõ nhất, hữu ích nhất về hiện tượng.Một công thức thống kê kinh nghiệm có thể tham khảo để xác định k:

k = (2 x n)0,

Trong đó: k : Số tổ lựa chọn n : Số đơn vị tổng thể

Ví dụ : Có dữ liệu mẫu về thu nhập (triệu/người) của 60 người tiêu dùng tạithị trường X như sau:

0,52 1,05 1,50 1,60 2,80 4,0,64 1,05 1,50 1,60 2,80 4,0,70 1,05 1,50 1,80 2,90 5,0,70 1,20 1,50 1,80 3,00 5,0,80 1,20 1,50 1,80 3,00 5,0,80 1,20 1,50 2,00 3,00 6,0,80 1,30 1,60 2,00 3,10 6,0,90 1,30 1,60 2,00 3,20 6,0,90 1,30 1,60 2,00 3,20 6,0,90 1,30 1,60 2,50 3,50 7,

Chọn số tổ theo công thức k = (2 x n)0,333 = (2x60)0,333 = 5

Trị số khoảng cách tổ : h = ( xmax - xmin ) / k = (7,00 - 0,52) / 5 = 1,h được xác định cùng một độ chính xác với dữ liệu (cùng số chữ số sau dấuphẩy) nhưng theo nguyên tắc làm tròn lên trên. Trường hợp chia chẵn đến độchính xác này thì tăng thêm một đơn vị cho chữ số cuối cùng.

Chọn h =1,7 và chọn giới hạn dưới tổ đầu tiên là 3,Các giới hạn tổ sẽ là:Thu nhập (triệu đồng)3,15 – 4,4,85 – 6,6,55 – 8,8,25 – 9,b) Chọn các giới hạn tổ nguyên và không trùng nhau khi phân tổ với cáclượng biến (quan sát) rời rạc:Tiến hành tương tự trường hợp a. Sau đó, giới hạn dưới được làm tròn lên,giới hạn trên được làm tròn xuống. Cuối cùng, có thể dịch chuyển các giới hạn tổvề phía trái sao cho chúng cân xứng hơn với dữ liệu gốc.

Ví dụ 3: Phân tổ 40 công nhân trong một doanh nghiệp theo tuổi nghề với xmin= 12 và xmax = 33 thành 5 tổ. ( xmax - xmin ) / k = (33 – 12) / 5 = 4,Như trường hợp a, chọn h = 5 và chọn giới hạn dưới tổ đầu tiên là 11,5.Các giới hạn tổ được xác định qua các bước sau:

Tuổi nghề Tuổi nghề Tuổi nghề11,5 – 16,5 Làm 12–16 Dịch 10–16,5 – 21,5 tròn 17–21 sang 15–21,5 – 26,5 => 22–26 trái 20–26,5 – 31,5 27–31 => 25–31,5 – 36,5 32–36 30–

Ởví dụ trên, giới hạn trên cùng sau khi làm tròn bị tràn qua phải so với dữliệu gốc: 36-33=3 đơn vị. Do đó, có thể dịch các giới hạn tổ sau khi làm tròn quatrái 3/2 ≈ 2 đơn vị.Trong trường hợp các giới hạn tổ không trùng nhau, trị số khoảng cách tổcó thể được tính bằng hiệu của hai giới hạn dưới của hai tổ kế nhau: h=30-25=25-20=20-15=15-10=5.c) Phân tổ dựa trên sự khác nhau rõ rệt về tính chất giữa các tổ:Trong một số trường hợp, người ta có thể dựa vào các môn khoa học khác,dựa vào thực nghiệm, hoặc dựa vào kinh nghiệm để xác định các giới hạn tổ saocho các tổ có sự khác nhau rõ rệt về tính chất.

Ví dụ , một doanh nghiệp dựa vào thực nghiệm “nếm độ ngọt” để phân chiangười tiêu dùng ở một thị trường theo độ tuổi có đặc tính ưa thích độ ngọt khácnhau thành các tổ sau:

Dưới 16 tuổi 16- 26- 46-Trên 60 tuổi

2.2.2. Mô tả (trình bày) bằng biểu đồ Phân phối của tiêu thức (biến) định lượng thường được mô tả (trình bày)bằng các loại biểu đồ như biểu đồ điểm, biểu đồ phân phối, biểu đồ hình cunghay biểu đồ cành và lá. Trình bày dữ liệu trong bảng phân phối lên biểu đồ thíchhợp sẽ giúp ta mô tả tóm tắt các đặc trưng phân phối của hiện tượng nghiên cứubằng hình ảnh.Biểu đồ điểm hoặc biểu đồ phân phối thường được dùng cho dữ liệu địnhlượng không có khoảng cách tổ hoặc khoảng cách tổ đều.Ví dụ : Dữ liệu mẫu về thu nhập của 60 người tiêu dùng tại thị trường X đãđược lập bảng phân phối ở trên có thể được trình bày trên biểu đồ điểm hoặcbiểu đồ phân phối như sau:Biểu đồ điểm (Dot plot) :****

0,52 1,82 3,12 4,42 5,72 7,

Biểu đồ hình cung (ogive)

Tần suất tích lũy 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 Mức thu nhập 0,52 1,60 2,68 3,76 4,84 5,92 7,00 (triệu/người)

Biểu đồ mật độ phân phối: Dữ liệu trên bảng phân phối có khoảng cách tổkhông đều thường không được mô tả bằng biểu đồ phân phối tần số. Bởi vì, nókhông cho cảm nhận thị giác đúng về phân phối này. Do đó, trường hợp này,người ta thường vẽ biểu đồ phân phối theo mật độ phân phối là số quan sát tính

trên một đơn vị khoảng cách tổ: pi = fi / hi với h i là trị số khoảng cách tổ.. Ví dụ, Bảng phân phối tần số về thu nhập của 600 người tiêu dùng.

Thu nhập Tần số Tần suất Mật độ phân(triệu đồng) (fi) (%) phối (pi)Dưới 1 2 3 2,1 - 2 18 30 18,2 - 4 26 43 13,4 - 7 10 17 3,Trên 7 4 67 1,

Biểu đồ phân phối của bảng phân phối trên phải được vẽ dựa trên mật độphân phối như sau.

Mật độ phân phối 20 18 16 14 12 10 8 6 4 2 Thu 0 nhập0 1 2 4 7 10

Biểu đồ cành và lá (Stem and leaf diagram) Biểu đồ cành và lá là một cách trình bày tiêu thức (biến) định lượng mộtcách hình ảnh. Nó cho chúng ta sự nhận thức không những về sự biến thiên màcả sự phân phối của biến định lượng.Mỗi trị số của tiêu thức được chia làm hai phần cành và lá. Lá gồm một chữsố cuối cùng bên phải. Cành gồm các chữ số còn lại bên trái chữ số của lá (nếukhông có thì lấy bằng 0).Các trị số có cành giống nhau được sắp cùng một hàng (chung cành) nhưngphân biệt nhau bằng lá được sắp xếp theo thứ tự từ nhỏ đến lớn. Các cành đượcsắp xếp theo thứ tự từ nhỏ đến lớn (hoặc ngược lại). Mỗi cành cách nhau mộtđơn vị (hoặc hàng chục, hàng trăm...). Cành nào không có dữ liệu vẫn được ghinhưng ở phần lá của nó thì để trống. Giữa cành và lá tách nhau bằng một đườngthẳng đứng.Ví dụ: Có dữ liệu về độ tuổi của 30 khách hàng như sau.5 5 8 8 9 12 13 14 14 17 19 19 22 24 24 2731 35 38 41 48 49 62 65 68 82 85 89 95 106

Trị số thứ nhất 5 có lá là 5, cành là 0. Trị số 12 có lá là 2, cành là 1. Trị số106 có lá 6, cành 10. Không có trị số nào từ 50 đến 59 do đó cành 5 không có lánào. Các trị số 5, 8, 8, 9 có chung cành là 0...Để biểu đồ cành và lá đạt hiệu quả cao trong mô tả tóm tắt dữ liệu, sốcành thường được giới hạn trong khoảng từ 5 đến 20.

Một số kỹ thuật như tách cành hay ghép lá có thể được sử dụng để việc môtả được rõ rệt.

Tách cành : Nếu số lá mỗi cành quá nhiều mà số cành ít , ta có thể tách mỗicành làm 2 cành : cành thấp (lá từ 0 đến 4) và cành cao (lá từ 5 đến 9). Ngoài racũng có thể tách mỗi cành làm 5 cành nhỏ: cành thứ nhất (lá 0 và 1), cành thứ hai(lá 2 và 3), cành thứ ba (lá 4 và 5), cành thứ tư (lá 6 và 7), cành thứ năm (lá 8 và9).Ví dụ, có biểu đồ cành và lá:

2 22223344445588993 11113355888894 112222555566778

Ta có thể tách đôi cành như sau:

2 22223344442 5588993 1111333 55888894 1122224 555566778Ghép lá: Nếu số lá quá nhiều trên mỗi cành, ta có thể ghép 2 lá giốngnhau làm 1 lá đôi.Ví dụ: Biểu đồ ở trên nếu không tách cành có thể ghép lá như sau:

2 223445893 1135889&4 12255678&Lá: lá đôi, ký hiệu lá chiếc &

2.3. Mô tả (tóm tắt) dữ liệu cho hai tiêu thức (biến) bằng bảng chéo và biểuđồ 2.3.1. Lập bảng phân phối kết hợp (bảng chéo) (crosstables) Bảng chéo có dạng hình chữ nhật, trong đó các dòng trình bày các tổ(nhóm) của tiêu thức (biến) thứ nhất, các cột trình bày các tổ (nhóm) của tiêu

thức (biến) thứ hai. Giao của các dòng và các cột là tần số (số quan sát) kết hợpcủa cả hai tiêu thức (biến). Bảng chéo được dùng với 1 trong 3 trường hợp: Một tiêu thức (biến) làđịnh tính và một tiêu thức (biến) là định lượng, cả hai tiêu thức (biến) là địnhtính, hoặc cả hai tiêu thức (biến) là định lượng. Việc xác định các tổ (nhóm) chomỗi tiêu thức (biến) được tiến hành tương tự như đã trình bày trong mục 2.1.1 vàmục 2.2.1. Tuy nhiên số lượng tổ (nhóm) theo từng tiêu thức (biến) được chọnsao cho tích của chúng (số tổ kết hợp) không quá nhiều. Có thể xác định số tổ kết

hợp định hướng theo công thức gợi ý: k = (2*n)0,333. Ví dụ, có bảng phân phối chéo của hai tiêu thức mức độ ưa thích sản phẩmvà độ tuổi của 360 người tiêu dùng như sau:

Mức độ ưa

Độ tuổi TổngDưới Trênthích SP 16-25 26-45 46-60 cộng16 60Không thích 15 32 18 25 5 95Thích ít 5 8 20 38 8 79Khá thích 2 7 30 42 15 96Rất thích 1 5 10 50 24 90Tổng cộng 23 52 78 155 52 360

Dựa vào bảng phân phối này, ta thấy rõ đặc điểm phân phối người tiêudùng theo mức độ ưa thích ở từng độ tuổi và đặc điểm phân phối người tiêu dùngtheo độ tuổi ở từng mức độ ưa thích. Qua đó, ta thấy được giữa hai tiêu thức nàycó biểu hiện của mối liên hệ nào đó chi phối hay không, nếu có thì mối liên hệđó diễn ra theo chiều hướng nào.Từ bảng chéo, ta có thể dễ dàng lập bảng phân phối riêng cho từng tiêuthức (biến). Chẳng hạn từ bảng chéo trên ta có thể lập bảng phân phối riêng chotiêu thức (biến) mức độ ưa thích sản phẩm và tiêu thức (biến) độ tuổi. Ngoài ra,từ bảng chéo trên ta cũng có thể chuyển đổi dữ liệu trong bảng sang dạng tỉ lệphần trăm theo dòng hay theo cột.Việc làm này giúp ta hiểu sâu hơn về mối quanhệ giữa hai tiêu thức (biến).