Trang /
Tiêu chuẩn Quốc gia TCVN 9600:2013 ISO 24153:2009 Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên hóa
- Thuộc tính
- Nội dung
- Tiêu chuẩn liên quan
- Lược đồ
- Tải về
Lưu
Theo dõi văn bản
Đây là tiện ích dành cho thành viên đăng ký phần mềm.
Quý khách vui lòng Đăng nhập tài khoản LuatVietnam và đăng ký sử dụng Phần mềm tra cứu văn bản.
Báo lỗi
Đang tải dữ liệu...
Đang tải dữ liệu...
Tiêu chuẩn Việt Nam TCVN 9600:2013
Tiêu chuẩn Quốc gia TCVN 9600:2013 ISO 24153:2009 Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên hóa
Số hiệu: | TCVN 9600:2013 | Loại văn bản: | Tiêu chuẩn Việt Nam |
Cơ quan ban hành: | Bộ Khoa học và Công nghệ | Lĩnh vực: | Khoa học-Công nghệ |
Ngày ban hành: | 05/07/2013 | Hiệu lực: | |
Người ký: | Tình trạng hiệu lực: | Đã biết Vui lòng đăng nhập tài khoản gói Tiêu chuẩn hoặc Nâng cao để xem Tình trạng hiệu lực. Nếu chưa có tài khoản Quý khách đăng ký tại đây! | |
Tình trạng hiệu lực: Đã biết
Ghi chú: Thêm ghi chú cá nhân cho văn bản bạn đang xem.
Hiệu lực: Đã biết
Tình trạng: Đã biết
TIÊU CHUẨN QUỐC GIA
TCVN 9600 : 2013
ISO 24153 : 2009
LẤY MẪU NGẪU NHIÊN VÀ QUY TRÌNH NGẪU NHIÊN HÓA
Random sampling and randomization procedures
Lời nói đầu
TCVN 9600:2013 hoàn toàn tương đương với ISO 24153:2009;
TCVN 9600:2013 do Ban Kỹ thuật tiêu chuẩn quốc gia TCVN/TC 69 Ứng dụng các phương pháp thống kê biên soạn,Tổng Cục Tiêu chuẩn và Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
Lời giới thiệu
Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên là cơ sở để xác nhận giá trị của nhiều phương pháp thống kê sử dụng trong thử nghiệm, dù là cho mục đích kiểm soát chất lượng công nghiệp và cải tiến hay cho thiết kế thực nghiệm trong lĩnh vực y tế, sinh học, nông nghiệp hay lĩnh vực cụ thể khác. Nhiều tiêu chuẩn thống kê đề cập đến việc tiến hành thử nghiệm như vậy. Đặc biệt, tất cả các tiêu chuẩn lấy mẫu chấp nhận dưới đây đều được thiết kế trên tiền đề là lấy mẫu ngẫu nhiên được sử dụng để lựa chọn đơn vị lấy mẫu cần thiết ứng với bố trí lô:
TCVN 7790 (ISO 2859) (tất cả các phần), Qui trình lấy mẫu để kiểm tra định tính
TCVN 8243 (ISO 3951) (tất cả các phần), Qui trình lấy mẫu để kiểm tra định lượng
TCVN 9601 (ISO 8422), Phương án lấy mẫu liên tiếp để kiểm tra định tính
ISO 8423, Phương án lấy mẫu liên tiếp để kiểm tra định lượng phần trăm không phù hợp (đã biết độ lệch chuẩn)
ISO 13448 (tất cả các phần), Qui trình lấy mẫu chấp nhận dựa trên phân bổ nguyên tắc ưu tiên (APP)
ISO 14560, Qui trình lấy mẫu chấp nhận định tính – Mức chất lượng qui định về số cá thể không phù hợp trên một triệu
ISO 18414, Qui trình lấy mẫu chấp nhận định tính – Hệ thống lấy mẫu chấp nhận không dựa trên nguyên tắc tin cậy đối với kiểm soát chất lượng đầu ra
ISO 21247, Hệ thống lấy mẫu chấp nhận không kết hợp và qui trình kiểm soát quá trình để chấp nhận sản phẩm
Ngoài ra, TCVN 7790-3 (ISO 2859-3) và ISO 21247 bao gồm các qui định đối với lấy mẫu ngẫu nhiên được áp dụng để xác định xem lô có cần kiểm tra hoặc không áp dụng qui trình lấy mẫu lô cách quãng hay không, đồng thời để quyết định đơn vị nào cần kiểm tra từ một quá trình sản xuất trong phương án lấy mẫu liên tục, một cách tương ứng. Do đó, điều quan trọng là hiệu lực của tất cả các tiêu chuẩn trên để áp dụng lấy mẫu ngẫu nhiên hiệu quả.
Mặc dù các nguyên tắc của tiêu chuẩn này có thể áp dụng chung trong trường hợp yêu cầu lấy mẫu ngẫu nhiên và có thể xác định rõ đơn vị lấy mẫu, ưu tiên trên cơ sở cá thể riêng rẽ, nhưng có nhiều tình huống trong đó vật liệu quan tâm không được xác định là cá thể riêng rẽ, như trong trường hợp vật liệu dạng đống. Trong tình huống này, người sử dụng cần tham khảo tiêu chuẩn ISO sau đây để có hướng dẫn thích hợp:
ISO 11648 (tất cả các phần), Khía cạnh thống kê của mẫu lấy từ vật liệu dạng đống.
LẤY MẪU NGẪU NHIÊN VÀ QUY TRÌNH NGẪU NHIÊN HÓA
Random sampling and randomization procedures
1. Phạm vi áp dụng
Tiêu chuẩn này qui định các quy trình lấy mẫu ngẫu nhiên và ngẫu nhiên hóa. Nhiều phương pháp được đưa ra, bao gồm cả các phương pháp dựa trên thiết bị cơ khí, bảng số ngẫu nhiên và thuật toán trên máy tính xách tay.
Tiêu chuẩn này áp dụng trong trường hợp quy định, hợp đồng hay tiêu chuẩn khác yêu cầu sử dụng lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa. Các phương pháp áp dụng cho các trường hợp như
a) lấy mẫu chấp nhận các đơn vị riêng rẽ để kiểm tra theo lô,
b) lấy mẫu cho mục đích khảo sát,
c) đánh giá kết quả của hệ thống quản lý chất lượng, và
d) chọn đơn vị thử nghiệm, phân bổ cách xử lý chúng và xác định thứ tự đánh giá trong tiến hành các thiết kế thực nghiệm.
Ngoài ra, tiêu chuẩn còn có các thông tin để hỗ trợ việc đánh giá hay xem xét bên ngoài khác các kết quả lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa theo yêu cầu của nhân sự quản lý chất lượng hay cơ quan chế định.
Tiêu chuẩn này không cung cấp hướng dẫn như quy trình lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa thích hợp để sử dụng cho tình huống thực nghiệm cụ thể bất kỳ hoặc đưa ra hướng dẫn về việc lựa chọn chiến lược lấy mẫu hay xác định cỡ mẫu. Cần tham khảo các tiêu chuẩn khác (như liệt kê trong phần Lời giới thiệu) hoặc các tài liệu viện dẫn hợp lệ hướng dẫn về vấn đề này.
2. Tài liệu viện dẫn
Tài liệu viện dẫn dưới đây rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu ghi năm công bố thì áp dụng bản được nêu. Đối với các tài liệu không ghi năm công bố thì áp dụng bản mới nhất, bao gồm cả các sửa đổi.
TCVN 7870-2 (ISO 80000-2), Đại lượng và đơn vị - Phần 2: Dấu và ký hiệu toán học sử dụng trong khoa học tự nhiên và công nghệ
TCVN 8244-1 (ISO 3534-1), Thống kê học – Từ vựng và ký hiệu – Phần 1: Thuật ngữ chung và thống kê thuật ngữ dùng trong xác suất
TCVN 8244-2 (ISO 3534-2), Thống kê học – Từ vựng và ký hiệu – Phần 2: Thống kê ứng dụng
ISO 3534-3, Statistics – Vocabulary and symbols – Part 3: Design of experiments (Thống kê học – Từ vựng và ký hiệu – Phần 3: Thiết kế thực nghiệm)
3. Thuật ngữ, định nghĩa và ký hiệu
Tiêu chuẩn này áp dụng các thuật ngữ và định nghĩa trong TCVN 8244-1 (ISO 3534-1), TCVN 8244-2 (ISO 3534-2), ISO 3534-3 và các thuật ngữ, định nghĩa dưới đây.
3.1. Thuật ngữ và định nghĩa
3.1.1. Chùm (cluster)
Bộ phận của tổng thể (3.1.6) chia tách thành các nhóm đơn vị mẫu (3.1.13) tách biệt nhau theo một cách thức nhất định.
[TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.28]
3.1.2. Lấy mẫu chùm (cluster sampling)
Phép lấy mẫu (3.1.12) trong đó mẫu ngẫu nhiên (3.1.8) của các chùm (3.1.1) được chọn và tất cả các đơn vị mẫu (3.1.13) tạo thành chùm bao gồm trong mẫu (3.1.11).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.9]
3.1.3. Xáo trộn (derangement)
Hoán vị hoàn toàn (complete permutation)
Hoán vị các thành phần trong đó không một thành phần nào còn giữ nguyên vị trí ban đầu trong tập hợp (ví dụ {3, 1, 2} là hoán vị của {1, 2, 3}).
3.1.4. Lô (lot)
Bộ phận xác định của tổng thể (3.1.6) cấu thành trong các điều kiện về cơ bản giống với tổng thể xét về mục đích lấy mẫu (3.1.12).
CHÚ THÍCH: Ví dụ, mục đích lấy mẫu có thể để xác định khả năng chấp nhận lô hoặc để ước lượng giá trị trung bình của một đặc trưng cụ thể.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.4]
3.1.5. Lấy mẫu nhiều tầng (multistage sampling)
Phép lấy mẫu (3.1.12) trong đó mẫu (3.1.11) được chọn theo tầng, các đơn vị mẫu (3.1.13) tại mỗi tầng được lấy từ đơn vị mẫu lớn hơn được chọn ở tầng trước đó.
CHÚ THÍCH: Lấy mẫu nhiều tầng khác với lấy mẫu nhiều lần. Lấy mẫu nhiều lần là lấy mẫu theo nhiều tiêu chí đồng thời.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.10]
3.1.6. Tổng thể (population)
<tham chiếu> toàn bộ các cá thể được xem xét.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.1]
3.1.7. Lấy mẫu ngẫu nhiên giả độc lập (pseudo-independent random sampling)
Lấy mẫu (3.1.12) trong đó mẫu (3.1.11) gồm n đơn vị mẫu (3.1.13) được lấy từ tổng thể (3.1.6) theo bảng số ngẫu nhiên hoặc thuật toán trên máy tính được thiết kế sao cho mỗi tổ hợp có thể có của n đơn vị mẫu có một xác suất được lấy cụ thể (xem thêm 4.4).
3.1.8. Mẫu ngẫu nhiên (random sample)
Mẫu (3.1.11) chọn bằng phép lấy mẫu ngẫu nhiên (3.1.9).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.25]
3.1.9. Lấy mẫu ngẫu nhiên (random sampling)
Phép lấy mẫu (3.1.12) trong đó có một mẫu (3.1.11) gồm n đơn vị mẫu (3.1.13) được lấy từ một tổng thể (3.1.6) sao cho mỗi tổ hợp có thể có của n đơn vị mẫu có một xác suất được lấy cụ thể.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.5]
3.1.10. Ngẫu nhiên hóa (randomization)
Quá trình nhờ đó tập hợp các cá thể được đặt theo một trật tự ngẫu nhiên.
CHÚ THÍCH: Nếu từ một tổng thể (3.1.6) gồm các số tự nhiên từ 1 đến n, các số được lấy ngẫu nhiên (nghĩa là theo cách thức tất cả các số đều có cơ hội được lấy như nhau), từng số một, lần lượt, không hoàn lại, cho đến khi hết tổng thể, các số này được gọi là lấy “theo thứ tự ngẫu nhiên”.
Nếu n số này được liên kết trước với n đơn vị riêng biệt hay n xử lý riêng biệt mà sau đó được sắp xếp theo thứ tự các số được lấy thì thứ tự của các đơn vị hay xử lý đó được coi là được ngẫu nhiên hóa.
3.1.11. Mẫu (sample)
Tập hợp con của tổng thể (3.1.6) bao gồm một hoặc nhiều đơn vị mẫu (3.1.13).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.17]
3.1.12. Lấy mẫu (sampling)
Hoạt động lấy hoặc thành lập một mẫu (3.1.11).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.1]
3.1.13. Đơn vị mẫu (sampling unit)
Đơn vị (unit)
Một trong các thành phần riêng lẻ hợp thành tổng thể (3.1.6).
CHÚ THÍCH 1: Đơn vị mẫu có thể gồm một hoặc nhiều cá thể, ví dụ một bao diêm, nhưng sẽ bao hàm một liên kết quả thử.
CHÚ THÍCH 2: Đơn vị mẫu có thể gồm các cá thể rời rạc hoặc một lượng vật liệu dạng đống xác định.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.14]
3.1.14. Lấy mẫu có hoàn lại (sampling with replacement)
Lấy mẫu (3.1.12) trong đó mỗi đơn vị mẫu (3.1.13) được lấy ra, quan trắc, rồi được trả về tổng thể (3.1.6) trước khi lấy đơn vị mẫu tiếp theo.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.15]
3.1.15. Lấy mẫu không hoàn lại (sampling without replacement)
Lấy mẫu (3.1.12) trong đó mỗi đơn vị mẫu (3.1.13) chỉ được lấy ra từ tổng thể (3.1.6) một lần mà không được trả về tổng thể đó.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.16]
3.1.16. Giá trị xuất phát (seed)
Trị số hoặc tập hợp các giá trị để khởi đầu một thuật toán lấy mẫu ngẫu nhiên giả độc lập (3.1.7) hoặc để thiết lập điểm bắt đầu trong bảng số ngẫu nhiên.
3.1.17. Mẫu ngẫu nhiên đơn giản (simple random sample)
Mẫu (3.1.11) được chọn bằng cách lấy mẫu ngẫu nhiên đơn giản (3.1.18).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.24]
3.1.18. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling)
Phép lấy mẫu (3.1.12) trong đó có một mẫu(3.1.11) gồm n đơn vị mẫu (3.1.13) được lấy từ một tổng thể (3.1.6) sao cho tất cả các tổ hợp có thể có của n đơn vị mẫu có cùng xác suất được lấy ra.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.4]
3.1.19. Lấy mẫu phân lớp (stratified sampling)
Lấy mẫu (3.1.12) sao cho các phần mẫu (3.1.11) được lấy từ lớp (3.1.21) khác nhau và mỗi lớp được lấy ít nhất là một đơn vị mẫu (3.1.13).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.6]
3.1.20. Lấy mẫu ngẫu nhiên đơn giản phân lớp (stratified simple random sampling)
Lấy mẫu ngẫu nhiên đơn giản (3.1.18) từ mỗi lớp (3.1.21).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.7]
3.1.21. Lớp (stratum)
Tổng thể con tách biệt và đầy đủ được xem là đồng nhất hơn về các đặc trưng nghiên cứu so với toàn bộ tổng thể (3.1.6).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.29]
3.2. Ký hiệu
Tiêu chuẩn này áp dụng dấu và ký hiệu toán học trong TCVN 7870-2 (ISO 80000-2) và các ký hiệu sau:
di con số thứ i hoặc giá trị mặt của đồng xu hay xúc sắc
N cỡ lô
n cỡ mẫu
ni cỡ của mẫu thứ i
U biến thực ngẫu nhiên phân bố đều trên phạm vi mở (0, 1)
giá trị thứ i của biến
j! j giai thừa
é z ù hàm trần nguyên của z (trả về số nguyên nhỏ nhất lớn hơn hoặc bằng giá trị thực z)
ë z û hàm sàn nguyên của z (trả về phần nguyên của giá trị thực z)
4. Quy định chung
4.1. Lấy mẫu ngẫu nhiên là điều kiện tiên quyết để áp dụng đúng hầu hết các phương án lấy mẫu trong ứng dụng công nghiệp. Tương tự, ngẫu nhiên hóa, sử dụng các nguyên tắc lấy mẫu ngẫu nhiên, là không thể thiếu được khi thực hiện các thiết kế thực nghiệm, vì nó làm tăng hiệu lực nội tại của thực nghiệm, cho phép sử dụng các phương pháp thống kê trong giải thích các kết quả thực nghiệm. Mục tiêu của lấy mẫu ngẫu nhiên là cung cấp phương tiện áp dụng các kết quả của lý thuyết xác suất vào các vấn để thực tiễn, trong khi tránh được mọi dạng độ chệch bất kỳ. Mục tiêu này không đạt được khi sử dụng các loại lấy mẫu nhất định khác. Ví dụ, lấy mẫu dựa trên các khái niệm như trực giác hay đánh giá của cá nhân, tính lộn xộn, hoặc theo hạn ngạch đều có độ chệch vốn có và kết quả dẫn đến sai lỗi nghiêm trọng trong quá trình ra quyết định mà không có điều kiện đánh giá rủi ro. Lấy mẫu ngẫu nhiên đồng xác suất nhằm loại trừ độ chệch như vậy bằng cách đảm bảo rằng mỗi đơn vị trong lô có cùng một xác suất được chọn (lấy mẫu có hoàn lại) hay, nói cách khác, mọi mẫu có thể trong cỡ mẫu cho trước lấy từ một lô có cùng xác suất được chọn (lấy mẫu không hoàn lại).
4.2. Trong phương án lấy mẫu ngẫu nhiên đồng xác suất có hoàn lại, xác suất một đơn vị cụ thể trong lô gồm N đơn vị được chọn ở lần lấy cho trước bất kỳ luôn là 1/N. Có Nn ngẫu nhiên theo thứ tự có thể có của n đơn vị từ N đơn vị và, đầy đủ là, có (N + n – 1)! / [n! (N – 1)!] mẫu ngẫu nhiên không theo thứ tự khác nhau có thể gồm n đơn vị từ N đơn vị (xem chú thích bên dưới).
Theo phương án lấy mẫu ngẫu nhiên đơn giản không hoàn lại, xác suất một đơn vị trong lô được chọn ở lần lấy trước là 1/N đối với lần lấy đầu tiên, 1/(N – 1) đối với lần lấy thứ hai, 1/(N – 2) đối với lần thứ ba, và cứ tiếp tục như vậy. Nếu n đơn vị được chọn ngẫu nhiên từ lô gồm N đơn vị mà không hoàn lại, khi đó mỗi tổ hợp n đơn vị có cùng một xác suất lựa chọn với mọi tổ hợp N đơn vị khác lấy n đơn vị mỗi lần. Số lượng mẫu gồm n đơn vị ngẫu nhiên không theo thứ tự xác suất khác nhau từ lô gồm N đơn vị là N!/(N-1)!, tương đương với số lượng tổ hợp gồm N đơn vị lấy n đơn vị mỗi lần . Điều đáng lưu ý khác là số lượng mẫu ngẫu nhiên theo thứ tự gồm n đơn vị được lấy không hoàn lại từ lô gồm N đơn vị là N! (N – n)! tương đương với số hoán vị có thể có gồm N đơn vị lấy n đơn vị mỗi lần. Cần chú ý là việc lấy mẫu ngẫu nhiên không hoàn lại là phương án lấy mẫu phổ biến nhất được sử dụng trong các ứng dụng lấy mẫu chấp nhận.
CHÚ THÍCH: Trong lấy mẫu có hoàn lại trên cơ sở mẫu gồm 3 đơn vị trong 5 đơn vị, danh mục {1, 1, 2}, {1, 2, 1} và {2, 1, 1} sẽ khác khi xét về thứ tự (và về kỹ thuật gọi là đa tập hợp) nhưng giống nhau nếu không xét đến thứ tự.
4.3. Mục tiêu của lấy mẫu ngẫu nhiên chỉ có thể đạt được bằng việc gắn với các quy trình chặt chẽ được thiết kế kỹ càng để đạt được mục đích của định nghĩa. Nhiều phương pháp được trình bày trong tiêu chuẩn này để thực thi mục tiêu này. Cụ thể là các phương pháp dùng thiết bị cơ khí giả định rằng đồng xu và xúc sắc không có độ chệch, được thiết kế sao cho mỗi mặt có cùng một xác suất xuất hiện trong quá trình ném hay tung và cách thức tung hay ném được thực hiện để không gây ra độ chệch. Hơn nữa, do những khác biệt lớn trong việc áp dụng nội tại các phương pháp lấy mẫu ngẫu nhiên trong máy tính cũng như hệ điều hành máy tính, ngôn ngữ lập trình và phần mềm (xem tài liệu tham khảo [9], [10], [12] và [13] về thông tin thêm), nên tiêu chuẩn này lựa chọn phương pháp tạo mẫu ngẫu nhiên bằng máy tính cầm tay. Ngoài ra,cần lưu ý là tất cả các phương pháp dưới đây đòi hỏi rằng mỗi đơn vị riêng rẽ trong lô được kết hợp trước với một số nhất định từ 1 đến N, sao cho các đơn vị lấy mẫu xác định là kết quả của phương pháp lấy mẫu ngẫu nhiên có thể thu được một cách rõ ràng từ lô đó.
4.4. Cuối cùng, để giảm khó khăn trong việc trình bày, tính từ “giả độc lập” sẽ thường được bỏ bớt khi đề cập đến quy trình hay phương pháp lấy mẫu ngẫu nhiên như vậy (xem tài liệu tham khảo [8]). Hơn nữa, tính từ “ngẫu nhiên” sẽ được sử dụng thường xuyên với nghĩa là danh từ mà nó bổ nghĩa (thường là số hoặc phép hoán vị) là đầu ra của quá trình tạo ra ngẫu nhiên số hay phép hoán vị đó. Ngoài ra, khi có các ví dụ, cỡ mẫu liên quan được giữ ở con số nhỏ với mục tiêu minh họa một cách đơn giản những khái niệm liên quan.
5. Lấy mẫu ngẫu nhiên – Phương pháp dùng thiết bị cơ khí
5.1. Phương pháp bình
5.1.1. Đặt N vật giống hệt nhau nhưng được đánh số khác nhau (ví dụ: vé, đồng tiền hay quả bóng) vào một chiếc bình để thể hiện rõ ràng mỗi trong số N đơn vị trong lô đó rồi trộn kỹ các đồ vật đó.
5.1.2. Đối với lấy mẫu không hoàn lại, nhắm mắt chọn các đồ vật trong bình, từng vật một mà không trả lại vào bình rồi trộn lại các vật giữa các lần lấy liên tiếp, cho đến khi có được n đơn vị lấy mẫu mong muốn.
CHÚ THÍCH: Phương pháp này thường được sử dụng bởi các công ty xổ số.
5.1.3. Đối với lấy mẫu có hoàn lại, nhắm mắt chọn các đồ vật trong bình, từng vật một rồi trả lại bình sau mỗi lần lấy và trộn kỹ lại các vật giữa các lần lấy liên tiếp, cho đến khi có được n đơn vị lấy mẫu mong muốn. Sử dụng phương pháp này, cùng một đơn vị có thể xuất hiện trong mẫu nhiều hơn một lần.
5.2. Phương pháp đồng xu hay xúc sắc
5.2.1. Xác định số m đồng xu hay xúc sắc (hoặc lượt thả đồng xu hay xúc sắc) yêu cầu, trong đó N là cỡ lô và k là số mặt của vật được sử dụng, theo công thức sau:
= élogeN/logekù
5.2.2. Khi sử dụng đồng xu hoặc xúc sắc, gắn kết rõ từng đồng xu hay xúc sắc với một vị trí cụ thể trong thứ tự giải thích các số di. Trường hợp sử dụng một đồng xu hay một xúc sắc, ấn định kết quả của lần tung hay thả đầu tiên với số có ý nghĩa nhất dm, lần tung hay thả thứ hai với số có nghĩa tiếp theo dm-1, và tiếp tục như vậy.
5.2.3. Thả đồng xu hay tung xúc sắc rồi ghi lại m kết quả theo thứ tự di. Chuyển kết qủa sang số nguyên thập phân theo công thức sau:
5.2.4. Lặp lại bước 5.2.3, loại tất cả các giá trị vượt quá N và, trong trường hợp lấy mẫu không hoàn lại, tất cả các giá trị đã được chọn, cho đến khi đạt được n đơn vị mẫu mong muốn.
VÍ DỤ 1: Kiểm tra viên mong muốn có được mẫu ngẫu nhiên gồm 4 đơn vị từ lô có 20 đơn vị và có sẵn một đồng xu. Từ bước 5.2.1, xác định được rằng cần m = 5 lần tung đồng xu để có được mỗi số ngẫu nhiên. Ấn định trước rằng giá trị mặt sấp là 1 và giá trị mặt ngửa là 2. Thứ tự những lần tung đầu tiên có được đa tập hợp {1, 2, 1, 2, 2}, thông qua bước 5.2.3 bằng 1 + (0)24 + (1)23 + (0)22 + (1)21 + (1)20 = 12. Ba lượt tung tiếp theo cho các tập hợp {1, 2, 2, 2, 1}, {1, 1, 2, 2, 1} và {2, 2, 1, 2, 2} tương ứng bằng 15, 7 và 28. Vì giá trị 28 vượt quá cỡ lô nên cần loại bỏ và các lượt tung tiếp theo cần được thực hiện cho đến khi thu được một số hợp lệ nữa để hoàn thành việc lấy mẫu ngẫu nhiên.
VÍ DỤ 2: Cần mẫu ngẫu nhiên gồm 4 đơn vị từ một lô gồm 50 đơn vị và kiểm tra viên có nhiều xúc sắc sáu mặt có màu sắc khác nhau. Từ bước 5.2.1, xác định được cần m = 3 con xúc sắc để thu được từng số ngẫu nhiên. Kiểm tra viên chọn xúc sắc màu xanh da trời, xanh lá cây và đỏ rồi xếp chúng theo cùng thứ tự ý nghĩa nhất đến ít ý nghĩa nhất. Tuy nhiên, kiểm tra công thức ở 5.2.3 cho thấy bằng chứng là các số nằm trong phạm vi hợp lệ từ 1 đến 50 sẽ chỉ có được khi mặt xúc sắc đầu tiên là 1 hoặc 2. Kết quả là, hiệu quả nhất định có thể đạt được bằng cách đặt các giá trị mặt cao hơn của xúc sắc màu xanh da trời là 1 hoặc 2 mà không làm méo xác suất kết quả. Kiểm tra viên quyết định trước đối với giá trị mặt lẻ trên xúc sắc xanh da trời coi là 1 và mặt giá trị chẵn coi là 2. Vòng đầu tiên cho tập hợp {3, 3, 4}, thông qua bước 5.2.3 bằng 1 + (2)62 + (2)61 + (3)60 = 88, giá trị này quá lớn nhưng khi chuyển thành {1, 3, 4} bằng 16. Ba vòng tiếp theo cho {6, 1, 3} (chuyển thành {2,1 ,3}), {5, 6, 6} (chuyển thành {1, 6, 6,}) và {2, 5, 5}, tương ứng bằng 39, 36 và 65. Vì giá trị 65 vượt quá cỡ lô nên cần loại bỏ và cần thực hiện những lần bổ sung cho đến khi thu được một giá trị hợp lệ nữa để hoàn thành lấy mẫu ngẫu nhiên.
VÍ DỤ 3: Tình huống tương tự như trong Ví dụ 2 nhưng lần này kiểm tra viên thấy rằng ba xúc sắc sẽ tạo ra các số trong phạm vi từ 1 đến 63 = 216 mà cỡ lô chỉ là 50. Kiểm tra viên quyết định trước sẽ ánh xạ tất cả các kết quả từ 1 đến 200 lên dải tần từ 1 đến 50 và loại bỏ mọi kết quả lớn hơn 200 nhằm tránh bóp méo xác suất đầu ra. Bốn lượt tung tương tự như ở ví dụ trước được đánh giá theo phương án ánh xạ này. Các đa tập hợp {3, 3, 4}, {6, 1, 3}, {5, 6, 6} và {2, 5, 5} bằng 88, 183, 180 và 65. Các số này được trừ đi cho bội số của 50 cho đến khi chúng nằm trong phạm vi từ dãy 1 đến 50 (nếu thu được giá trị 0 thì giải thích như N), có được các giá trị mẫu tương ứng là 38, 33, 30 và 15. Cỡ mẫu là 4 đơn vị đã thu được nên không cần tiếp tục tung xúc sắc nữa. Chú ý là, về mặt toán học, quá trình ánh xạ này tương đương với việc áp dụng công thức v2 = 1 + (v1 – 1) mô đun N, trong đó v1 là giá trị ban đầu còn v2 là giá trị được ánh xạ vào dải mong muốn.
6. Lấy mẫu ngẫu nhiên giả độc lập – Phương pháp bảng số
6.1. Bảng số ngẫu nhiên
Hai bảng số ngẫu nhiên được cung cấp trong Phụ lục A. Mỗi bảng số gồm 3 600 số ngẫu nhiên từ 0 đến 9, sắp xếp thành 60 hàng và 60 cột. Việc sử dụng được mô tả tóm tắt dưới đây và nêu chi tiết hơn trong Phụ lục A.
CHÚ THÍCH: Các con số trong bảng tương tự trực tiếp với các giá trị mặt của xúc sắc 10 mặt tung lặp lại và ghi được. Số chữ số m cần thiết cho ứng dụng lấy mẫu tương ứng với số lần tung xúc sắc.
6.2. Phương pháp cơ bản
6.2.1. Xác định số chữ số m cần thiết để thể hiện cỡ lô N. Trường hợp cỡ lô có lũy thừa 10, bỏ qua con số đầu trong cỡ lô đó và giải thích rằng các con số “không” còn lại bằng giá trị cỡ lô (ví dụ nếu N = 1 000, giải thích giá trị 000 là 1 000).
6.2.2. Chọn ngẫu nhiên một điểm bắt đầu (nghĩa là giá trị hàng và cột) trong bảng sử dụng phương pháp mô tả ở A.2.2.
6.2.3. Đọc con số kết quả cùng với các số m – 1 ở bên phải như một số và ghi lại giá trị đó. Trường hợp các con số bên phải vượt quá hàng thứ 60 thì coi các cột 1, 2, … tương ứng là cột 61, 62, …
6.2.4. Tăng giá trị của hàng thêm một, lặp lại bước 6.2.3 rồi ghi lại giá trị đó. Trường hợp giá trị của hàng vượt quá hàng thứ 60 thì coi hàng 1 là hàng thứ 61 và tăng giá trị cột đó lên m chữ số.
6.2.5. Lặp lại bước 6.2.4, bỏ qua tất cả các giá trị vượt quá N và, trong trường hợp lấy mẫu không hoàn lại, tất cả các giá trị đã được chọn, cho đến khi thu được số đơn vị lấy mẫu n mong muốn.
VÍ DỤ: Người đánh giá mong muốn chọn một mẫu ngẫu nhiên gồm 5 đơn vị từ một lô 200 đơn vị. Điểm bắt đầu ngẫu nhiên được xác định bằng các lần tung đồng xu là hàng 57 và cột 59, quyết định sử dụng Bảng A.1. Vì N nhỏ so với giá trị lớn nhất có thể thể hiện bằng 3 chữ số (nghĩa là 1 000) nên người đánh giá quyết định ánh xạ kết quả của dải từ 1 đến 1 000 lên dải từ 1 đến 200. Kết quả là năm số sau: 848, 670, 902, 034 và 518. Giá trị mẫu chuyển đổi trở thành 48, 70, 102, 34 và 118.
7. Lấy mẫu ngẫu nhiên giả độc lập – Phương pháp máy tính
7.1. Tổng quan
7.1.1. Tiêu chuẩn này sử dụng hệ thống thuật toán cụ thể đề cập trong các tài liệu tham khảo [1], [7] và [13]. Các thuật toán này được thiết kế có các tính chất hóa học và thống kê cần thiết cho lấy mẫu ngẫu nhiên cũng như có thể linh hoạt áp dụng trong các ngôn ngữ lập trình khác nhau trên các nền tảng máy tính khác nhau đồng thời tạo thuận lợi cho việc kiểm tra và đánh giá các giá trị mẫu được chọn cần thiết cho mục đích quy định. Ví dụ thực thi các phần chương trình chính được cho trong Phụ lục B sử dụng ngôn ngữ lập trình C.
7.1.2. Hệ thống các thuật toán liên quan gồm hai hệ con chính:
a) thuật toán khởi tạo tùy chọn tự động đưa ra số nguyên ban đầu giả ngẫu nhiên dựa trên thời gian trôi qua kể từ ngày tháng chuẩn; và
b) bộ tạo số ngẫu nhiên.
7.1.3. Đối với mục đích kiểm tra hay đánh giá, thuật toán khởi tạo tùy chọn đề cập ở điểm a) của 7.1.2 và mô tả 7.2 có thể bỏ qua với một giá trị xuất phát nhập bằng tay. Giá trị này cần nằm trong dãy số nguyên tử từ 1 đến và bao gồm cả 2 147 483 398. Bản sao giá trị đầu vào này được giữ lại để lưu hồ sơ khi cần. Tuy nhiên, trong sử dụng chung cho các ứng dụng kiểm soát chất lượng và thiết kế thực nghiệm không nên thường xuyên bỏ qua tùy chọn tạo giá trị xuất phát ngẫu nhiên tự động mà nên là tùy chọn mặc định trong thực tế.
CHÚ THÍCH: Trình bày về các bước của các thuật toán trong điều này được để ở định dạng toán học hơn nhằm hỗ trợ cho việc lập trình. Mã lập trình có các tham chiếu điều được nêu trong Phụ lục B để bổ trợ cho việc áp dụng điều này.
7.2. Thuật toán khởi tạo
7.2.1. Thuật toán khởi tạo bao gồm:
a) thuật toán tính thời gian trôi qua, tham chiếu đến ngày tháng và thời gian quá khứ cố định, và
b) thuật toán tạo số ngẫu nhiên dựa trên phân bố đều, gọi là số ngẫu nhiên của thời gian dựa trên đầu ra của mục a) ở trên, để thu được giá trị xuất phát ngẫu nhiên dựa trên đầu vào theo thời gian.
7.2.2. Thuật toán dưới đây xác định số giây trôi qua tính từ 00:00:00 01-01-2000 đến ngày tháng và thời gian hiện tại.
a) Tìm ngày tháng và thời gian của hệ thống máy tính theo biến dạng chuỗi, lưu bản sao biến này vào hồ sơ và sau đó phân tích chuỗi thành các thành phần thời gian (nghĩa là giây, phút, giờ, ngày, tháng và năm).
b) Tính số ngày tròn trôi qua de từ điểm thời gian chuẩn, sử dụng trị số năm đầy đủ bốn con số y, tháng m1 và ngày d của ngày tháng hiện tại xử lý như sau:
nếu m1 < 3 thì lấy m1 + 12 và lấy y = y – 1
de = d + ë(153 m1 – 457) / 5û + 365 y + ëy / 4û - ëy / 100û + ë y / 400û - 730 426
CHÚ THÍCH: Công thức cho de có thể đơn giản hóa một chút đối với năm theo lịch đến và kể cả 2099 bằng cách thay số hạng ëy / 4û bằng “ – 730 441”.
c) Tính tổng số giây se trôi qua từ ngày tháng quy chiếu sử dụng con số thu được ở bước b) và thời gian của ngày (ở dạng 24 giờ “giờ:phút:giây”) tìm được trong biến chuỗi ở bước a) theo công thức sau:
se = 86 400 de + 3 600 h+ 60 m2 + s
trong đó h, m2 và s tương ứng là giờ, phút và giây.
CHÚ THÍCH 1: Một số ngôn ngữ lập trình có hàm dựng sẵn để thực hiện tính toán trực tiếp se. Các hàm nội tại như vậy cần được xác nhận hiệu lực trước khi sử dụng để đảm bảo ảnh hưởng của năm nhuận và thời gian ghi ban ngày được xử lý thích hợp.
CHÚ THÍCH 2: Trong ứng dụng 32 bit của thuật toán này, giá trị se sẽ tăng thời gian đến điểm gây tràn tính toán. Cần chú ý khi lập trình để đảm bảo giá trị đầu vào luôn được ánh xạ lên từ 1 đến và bao gồm cả 2 147 483 398.
d) Giá trị ở bước c) là giá trị khởi tạo cho bộ tạo giá trị ngẫu nhiên và được dùng để thu giá trị cuối cùng. Bản sao giá trị này được ghi vào biến riêng để lưu hồ sơ khi cần.
e) Số thời gian j mà bộ tạo số ngẫu nhiên sau đó được yêu cầu là một số nguyên ngẫu nhiên từ 1 đến và bao gồm cả 100, dựa trên hai con số ít có nghĩa nhất của giá trị thu được ở bước c) cộng thêm 1, được thể hiện như sau:
j = se – 100 ëse / 100û + 1
7.2.3. Bộ tạo số ngẫu nhiên dùng cho thuật toán tạo giá trị xuất phát tự động (hàm khởi tạo) có dạng quan hệ truy hồi đồng dạng tuyến tính:
a) xi+1 = 40 692 mod 2 147 483 399,
có thể thực hiện trên máy tính có khả năng xử lý số nguyên 32 bit qua các bước sau đây:
b) ë / 52 774û ;
c) = 40 692 (- 52 774 k) – 3 791 k;
d) Nếu < 0 thì lấy = + 2 147 483 399.
7.2.4. Tạo giá trị xuất phát cho thuật toán lấy mẫu ngẫu nhiên bằng cách ấn định kết quả ở điểm c) 7.2.2 cho xi rồi gọi công thức ở 7.2.3 j lần cho mỗi bước 7.2.2 e), mỗi lần thay xi bằng xi+1 cho đến khi thực hiện hết số lần gọi yêu cầu.
7.2.5. Giá trị cuối cùng của xi+1 thu được từ bước 7.2.4 là số nguyên ngẫu nhiên từ 1 đến và bao gồm cả 2 147 483 398 và dùng làm giá trị xuất phát ban đầu cho thuật toán lấy mẫu ngẫu nhiên mô tả ở 7.3 [cụ thể là giá trị yi ở bước b) của 7.3.6]. Bản sao giá trị này được ghi vào biến riêng để lưu hồ sơ khi cần.
7.3. Thuật toán tạo số ngẫu nhiên
7.3.1. Thuật toán tạo số ngẫu nhiên bao gồm
a) một dãy xáo trộn được tạo bởi thuật toán tạo số ngẫu nhiên phân bố đều và,
b) tổ hợp, thuật toán tạo số ngẫu nhiên phân bố đều.
7.3.2. Tạo dãy A gồm 32 phần tử dùng như phương tiện xáo trộn đầu ra của thuật toán lấy mẫu ngẫu nhiên.
7.3.3. Bộ tạo số ngẫu nhiên dưới đây được dùng để tạo dãy xáo trộn:
a) xi+1 = 40 014 xi mod 2 147 483 563,
có thể được thực hiện trên máy tính 32 bit qua các bước sau đây:
b) k = ë/ 53 668û;
c) xi+1 = 40 014 (- 53 668 k) – 12 211 k;
d) Nếu xi+1 < 0 thì lấy xi+1= xi+1 + 2 147 483 563.
7.3.4. Khởi tạo dãy A bằng cách ấn định kết quả ở 7.1.3 hoặc 7.2.5 cho xi rồi gọi bộ tạo giá trị nêu trong 7.3.3 a) 40 lần, mỗi lần gọi thay xi bằng xi+1, loại bỏ 8 giá trị đầu tiên và sau đó ấn định mỗi trong số 32 giá trị đầu ra còn lại của xi+1 cho dãy đó theo thứ tự đảo (nghĩa là phần tử 32 xuống đến phần tử 1).
7.3.5. Đặt phần tử 1 của dãy A (nghĩa là A[1]) là giá trị khởi tạo k cho tổ hợp thuật toán tạo số ngẫu nhiên.
7.3.6. Tổ hợp bộ tạo số ngẫu nhiên dùng để tạo mẫu ngẫu nhiên có dạng tổ hợp quan hệ tái diễn đồng dạng tuyến tính và các bước xác định chỉ số dãy sau đây:
a) xi+1 = 40 014 mod 2 147 483 563,
b) yi+1 = 40 692 yi mod 2 147 483 399,
c) J = ë32 k / 2 147 483 563û + 1;
d) k = A[J] – yi+1;
e) A[J] = xi+1;
f) Nếu k < 1 thì lấy k = k + 2 147 483 562.
CHÚ THÍCH: Hai bộ tạo số ngẫu nhiên ở trên được mô tả trong 7.2.3 và 7.3.3 (tham khảo các điều con nếu cần các ứng dụng tương đương 32 bit).
7.3.7. Thuật toán ở 7.3.6 được bắt đầu bằng việc đặt xi+1 theo giá trị cuối cùng của xi+1 từ 7.3.4 và đặt yi theo giá trị tham chiếu ở 7.2.5. Các giá trị xi+1 và yi+1 dùng làm giá trị tiếp theo của xi và yI cho tất cả các lần gọi sau của thuật toán. Chỉ số ngẫu nhiên J cho dãy xáo trộn A được tính bằng cách sử dụng giá trị của k (ban đầu từ 7.3.5) và hiệu của A[J] và yi+1 được ấn định cho k, trong khi A[J] được cập nhật với xi+1. Cuối cùng giá trị của k được thay đổi nếu cần để tạo ra giá trị dương.
7.3.8. Đầu ra của thuật toán lấy mẫu ngẫu nhiên là giá trị k, là số ngẫu nhiên từ 1 đến và bao gồm cả 2 147 483 562, được chỉnh tỷ lệ như biến thực phân bố đều chuẩn hóa U trong dải tần từ 0 đến 1, không bao gồm giá trị đầu mút của dải này, như sau: U = k / 2 147 483 563.
7.3.9. Đầu ra của 7.3.8 có thể được chỉnh tỷ lệ là biến nguyên phân bố đều L trong dải tần từ 1 đến N, bao gồm cả N, như sau: L = ëN Uû + 1.
7.3.10. Để tạo ra mẫu ngẫu nhiên, lặp lại các bước từ 7.3.6 đến 7.3.9 cho đến khi thu được số giá trị ngẫu nhiên cần thiết.
7.4. Hồ sơ đánh giá
Khi có yêu cầu duy trì hồ sơ cho việc đánh giá của cơ quan chịu trách nhiệm hay cơ quan có thẩm quyền, thì ghi lại cỡ lô và cỡ mẫu.
Ngoài ra, đối với các thuật toán, ghi lại giá trị xuất phát nhập bằng tay theo 7.1.3 hoặc nếu sử dụng bộ tạo giá trị xuất phát ngẫu nhiên thì ghi lại.
a) ngày và thời gian của hệ thống máy tính sử dụng để tính giá trị xuất phát ban đầu,
b) giá trị của số khởi tạo theo 7.2.2 d) và
c) giá trị của số khởi tạo cuối cùng theo 7.2.5.
8. Áp dụng cho tình huống lấy mẫu phổ biến
8.1. Khái quát
8.1.1. Điều này đưa ra thuật toán dùng cho nhiều phương án lấy mẫu ngẫu nhiên phù hợp với nhiều tình huống thực tiễn khác nhau.
8.1.2. Xuyên suốt điều này, U được xác định là biến ngẫu nhiên thực, phân bố đều trong dải tần từ 0 đến 1, không bao gồm các giá trị đầu mút của dải, như cung cấp bởi thuật toán ở 7.3. Nếu sử dụng nguồn khác cho U và đầu ra được biết bao gồm 1 nhưng không bao gồm 0 là giá trị đầu mút của dải thì đặt U bằng 1 – U. Nếu nguồn khác của U bao gồm 0 và 1 là giá trị đầu mút của dải thì giá trị 1 cần được chặn và loại ra.
8.2. Số nguyên ngẫu nhiên trong dải
Số nguyên ngẫu nhiên K trong dải từ M đến và gồm cả N có thể được tạo ra theo thuật toán dưới đây.
a) Tạo giá trị thực ngẫu nhiên U.
b) Đặt K bằng M + ëU (N – M + 1)û.
8.3. Hoán vị ngẫu nhiên
Đối với dãy A với N phần tử riêng biệt, phép hoán vị ngẫu nhiên N đơn vị lấy n mỗi lần có thể được tạo ra theo thuật toán xáo trộn dưới đây.
a) Ẩn định N giá trị chỉ số phần tử riêng rẽ theo thứ tự ban đầu đến A[1:N].
b) Đặt J bằng 1.
c) Tạo số nguyên ngẫu nhiên K trong dải tần từ J đến và bao gồm cả N.
d) Đổiv A[J] và A[K].
e) Tăng J thêm 1.
f) Nếu J nhỏ hơn hoặc bằng n thì đi tiếp bước c).
g) Thu được hoán vị ngẫu nhiên từ các giá trị n đầu tiên của dãy A.
8.4. Trộn ngẫu nhiên
Đối với dãy A với N phần tử riêng biệt, trộn ngẫu nhiên N đơn vị có thể được tạo ra theo thuật toán dưới đây.
a) Ấn định N giá trị chỉ số phần tử riêng rẽ theo thứ tự ban đầu đến A[1:N] và sao chép vào dãy B[1:N].
b) Sử dụng dãy B tạo xáo trộn ngẫu nhiên N đơn vị lấy N (nghĩa là tất cả) đồng thời, sử dụng phương pháp nêu ở 8.3.
c) So sánh sự ngang bằng các phần tử từ 1 đến N của dãy A và dãy B
d) Nếu phần tử bất kỳ của dãy B bằng với phần tử đối ứng ở dãy A thì dừng việc so sánh và đi tiếp bước b).
e) Thu được phép trộn ngẫu nhiên từ dãy B.
CHÚ THÍCH: Thuật toán này có thể được thực hiện hiệu quả hơn ở bước b) và c) bằng cách so sánh phần tử A[J] với phần tử B[J] ngay khi xác định được B[J] chứ không đợi đến khi hoán vị hết toàn bộ dãy B.
8.5. Lấy mẫu ngẫu nhiên có hoàn lại
Mẫu ngẫu nhiên đơn gồm n đơn vị từ lô N đơn vị có thể được tạo ra có hoàn lại theo thuật toán dưới đây.
a) Tạo số nguyên ngẫu nhiên K trong dải từ 1 đến và bao gồm cả N.
b) Lặp lại bước a) cho đến khi thu được n giá trị của K.
CHÚ THÍCH: Có thể áp dụng lặp lại phương pháp này để thu được số lượng mẫu bất kỳ với cỡ mẫu bất kỳ. Nếu giá trị thu được của mẫu đơn không được lựa chọn thì có thể sử dụng mẫu đó cho kiểm tra lấy mẫu liên tiếp.
8.6. Lấy mẫu ngẫu nhiên không hoàn lại
Mẫu ngẫu nhiên đơn gồm n đơn vị riêng rẽ từ lô N đơn vị có thể được tạo ra không hoàn lại bằng một trong hai phương pháp dưới đây.
a) Phương pháp 1
1) Tạo số nguyên ngẫu nhiên K trong dải từ 1 đến và bao gồm cả N.
2) Xác nhận rằng giá trị K chưa được tạo ra trước đó; nếu nó khác biệt thì lưu lại giá trị đó còn nếu không thì loại ra.
3) Lặp lại bước 1) và bước 2) cho đến khi thu được n giá trị của K.
b) Phương pháp 2
1) Tạo hoán vị ngẫu nhiên N đơn vị, mỗi lần lấy n theo 8.3.
2) Sử dụng các giá trị n đầu tiên trong đầu ra dãy A làm mẫu ngẫu nhiên.
CHÚ THÍCH: Có thể sử dụng một trong hai phương pháp này để thu được số mẫu với cỡ mẫu bất kỳ (cho các mục đích như lấy mẫu hai lần hay lấy mẫu nhiều lần) bằng cách sử dụng tổng nt của cỡ mẫu riêng ni như giá trị đầu vào của n cho thuật toán này, để nguyên các giá trị ở thứ tự đầu ra ban đầu, sau đó lấy các giá trị kết quả n1 đầu tiên làm mẫu đầu tiên, các kết quả giá trị n2 tiếp theo làm mẫu thứ hai và cứ tiếp tục như vậy. Hơn nữa, nếu giá trị kết quả của một mẫu đơn không được chọn thì mẫu đó có thể được sử dụng cho kiểm tra lấy mẫu liên tiếp bằng cách kiểm tra từng đơn vị theo thứ tự được chọn.
8.7. Lấy mẫu ngẫu nhiên cho phương án lấy mẫu liên tục (CSP)
Phương án lấy mẫu liên tục CSP-1 được thiết kế để áp dụng cho việc kiểm tra chất lượng dây chuyền sản xuất và luân phiên giữa các giai đoạn kiểm tra 100% yêu cầu i đơn vị được chấp nhận liên tiếp trước khi tiến hành các giai đoạn tiếp theo của kiểm tra lấy mẫu ở xác suất f, với sự trở lại kiểm tra 100 % khi tìm thấy đơn vị không chấp nhận được. Trong các giai đoạn kiểm tra lấy mẫu, các đơn vị từ dây chuyền sản xuất có thể được chọn cho kiểm tra theo một trong hai phương pháp dưới đây.
a) Phương pháp 1
1) Đối với mỗi đơn vị sản xuất, tạo giá trị thực ngẫu nhiên U.
2) Nếu U nhỏ hơn hoặc bằng f thì chọn đơn vị đó cho kiểm tra lấy mẫu.
3) Lặp lại bước 1) và 2) cho đến khi thu được đơn vị không chấp nhận được.
b) Phương pháp 2
1) Đối với mỗi phân đoạn sản xuất n đơn vị, trong đó n bằng 1/f, tạo số nguyên ngẫu nhiên K trong dải từ 1 đến và bao gồm cả n.
2) Chọn đơn vị tương ứng với K làm đơn vị lấy mẫu để kiểm tra.
3) Lặp lại bước 1) và 2) cho đến khi thu được đơn vị không chấp nhận được.
CHÚ THÍCH: Đối với phương án CSP-1, giá trị f được quy định là nghịch đảo của số nguyên.
8.8. Lấy mẫu ngẫu nhiên phân tầng
Đối với lô gồm hai hay nhiều tầng cỡ N, chọn mẫu ngẫu nhiên đơn cỡ n, từ mỗi tầng i sử dụng các phương pháp nêu trong 8.3 hoặc 8.6 khi lấy mẫu không hoàn lại được yêu cầu hoặc phương pháp nêu trong 8.5 khi yêu cầu lấy mẫu có hoàn lại.
8.9. Lấy mẫu ngẫu nhiên một lần từ cỡ lô ban đầu chưa biết
Mẫu ngẫu nhiên đơn gồm n đơn vị khác nhau từ một lô ban đầu chưa biết cỡ lô, nhưng ít nhất là bằng cỡ n, có thể thu được theo phương pháp dưới đây (lấy từ tài liệu tham khảo[11]).
a) Ấn định các đơn vị n đầu tiên từ lô cho dãy mẫu A[1:n].
b) Nếu có đơn vị khác trong lô liệt kê thì đặt N bằng số đếm đơn vị tiếp theo; nếu không thì thực hiện bước f).
c) Tạo số nguyên ngẫu nhiên K trong dải từ 1 đến và bao gồm cả N.
d) Nếu K nhỏ hơn hoặc bằng n thì đặt A[K] bằng N.
e) Thực hiện bước b).
f) Thu được mẫu ngẫu nhiên từ dãy A và cỡ lô từ giá trị N.
CHÚ THÍCH: Phương pháp này cũng có thể sử dụng khi đã biết cỡ lô.
8.10. Lấy mẫu ngẫu nhiên một lần theo thứ tự, không hoàn lại
Mẫu ngẫu nhiên đơn gồm n đơn vị riêng biệt từ lô N đơn vị có thể được tạo ra trực tiếp theo thứ tự tăng dần theo các phương pháp dưới đây.
a) Phương pháp 1(lấy từ tài liệu tham khảo [2])
1) Khởi tạo các biến sau:
i) tạo dãy A[1:n];
ii) đặt L bằng N, K bằng N – n và J bằng 0.
2) Tăng J thêm 1.
3) Nếu J lớn hơn n thì đi tiếp bước 8).
4) Tạo giá trị thực ngẫu nhiên U và đặt P bằng 1.
5) Đặt P bằng P K / N.
6) Nếu P nhỏ hơn hoặc bằng U:
i) đặt A[J] bằng N – L +1 sau đó tăng L thêm 1;
ii) thực hiện bước 2).
7) Nếu P lớn hơn U:
i) tăng L thêm 1 và K thêm 1;
ii) thực hiện bước 5).
8) Thu được mẫu ngẫu nhiên theo thứ tự tăng dần từ dãy A.
b) Phương pháp 2 (lấy từ tài liệu tham khảo [3])
1) Lấy C(a,b) là hàm số thu được số tổ hợp các đơn vị lấy a lấy b mỗi lần (còn gọi là hệ số nhị thức và bằng a! / [(a-b)! b!]).
2) Tạo số nguyên ngẫu nhiên L trong dải từ 1 đến và bao gồm cả C(N,n).
3) Tạo dãy A[1:n].
4) Đặt K bằng 0, J bằng 1 và m bằng n – 1.
5) Đặt A[J] bằng 0.
6) Nếu J không bằng 1 thì đặt A[J] bằng A[J – 1].
7) Đặt A[J] bằng A[J] +1.
8) Đặt R bằng C(N - A[J], n – J).
9) Tăng K thêm R.
10) Nếu K nhỏ hơn L thì thực hiện bước 7).
11) Giảm K đi R.
12) Tăng J thêm 1.
13) Nếu J nhỏ hơn hoặc bằng N thì thực hiện bước 5).
14) Đặt A[n] bằng A[m] + L – K.
15) Thu được mẫu ngẫu nhiên theo thứ tự tăng dần từ dãy A
CHÚ THÍCH: Do những hạn chế trong trình bày lượng số nguyên lớn trên máy tính cũng như những giới hạn trong độ phân giải của bộ tạo số ngẫu nhiên, cần chú ý để đảm bảo rằng Phương pháp 2 có thể thực hiện được bằng máy tính và không có độ chệch quá mức do bộ tạo số ngẫu nhiên được sử dụng.
VÍ DỤ: Mẫu ngẫu nhiên gồm 5 đơn vị sắp xếp theo thứ tự được yêu cầu lấy từ lô gồm 25 đơn vị. Có thể tạo 25! / (20! 5!) = 53 130 tổ hợp gồm 5 đơn vị từ 25 đơn vị, thực hiện được trên máy tính hiện đại. Ngoài ra, bộ tạo số ngẫu nhiên mô tả ở Điều 7 được chọn cho mục đích lấy mẫu này; giá trị đầu ra tối đa của nó là 2 147 483 562 lớn hơn trên 40 419 lần so với dải yêu cầu nên độ chệch tạo ra trong phương pháp này là không đáng kể đối với mục đích thực tiễn. Số nguyên ngẫu nhiên đơn từ 1 đến và bao gồm cả 53 130 được tạo ra là 7 319. Tập hợp mẫu thu được là {1, 7, 13, 18, 19}.
8.11. Lấy mẫu chùm
Đối với tổng thể hoặc lô gồm chùm các đơn vị liên quan, ghi các chùm vào một danh mục và chọn ngẫu nhiên từ danh mục này sử dụng các phương pháp nêu trong 8.3 hoặc 8.6 khi lấy mẫu không hoàn lại được yêu cầu hoặc phương pháp nêu trong 8.5 khi yêu cầu lấy mẫu có hoàn lại. Mẫu thu được bao gồm tổng số đơn vị trong các chùm được chọn.
8.12. Lấy mẫu ngẫu nhiên với xác suất tỷ lệ thuận với cỡ mẫu
Đối với tổng thể gồm các đơn vị có tích hợp khác nhau, có thể thu được mẫu ngẫu nhiên các đơn vị được chọn tỷ lệ với cỡ mẫu bằng cách sử dụng một trong hai phương pháp dưới đây.
a) Phương pháp 1
1) Trong danh mục N đơn vị có cỡ khác nhau, ghi lại cỡ mẫu cộng dồn Si của các đơn vị bên cạnh từng đơn vị liên tiếp.
2) Tạo số nguyên ngẫu nhiên K trong dải từ 1 đến và kể cả SN, trong đó SN là cỡ cộng dồn của toàn bộ tổng thể.
3) Từ danh mục, chọn đơn vị kèm theo cỡ cộng dồn lớn nhất không vượt quá K làm thành phần mẫu.
4) Lặp lại bước 2) và 3) cho đến khi thu được số n đơn vị lấy mẫu (có hoàn lại hoặc không hoàn lại) mong muốn.
b) Phương pháp 2
1) Từ danh mục N đơn vị có cỡ khác nhau, xác định cỡ đơn vị lớn nhất M.
2) Tạo cặp số nguyên ngẫu nhiên (K, L) với K trong dải từ 1 đến và kể cả N và L trong dải từ 1 đến và kể cả M.
3) Nếu cỡ đơn vị K không vượt quá M thì chọn đơn vị K làm thành phần mẫu.
4) Lặp lại bước 2) và 3) cho đến khi thu được số n đơn vị lấy mẫu (có hoàn lại hoặc không hoàn lại) mong muốn.
VÍ DỤ: Một công ty marketing muốn tiến hành một cuộc khảo sát các hộ gia đình với lựa chọn tỷ lệ với cỡ hộ gia đình (nghĩa là số nhân khẩu). Thu được một danh sách 10 hộ gia đình xếp theo thứ tự số lượng nhân khẩu (cỡ mẫu) và các cỡ là {2, 2, 3, 3, 3, 4, 4, 5, 6, 7}. Cỡ cộng dồn của danh sách này là: {2, 4, 7, 10, 13, 17, 21, 26, 32, 39}. Mẫu ngẫu nhiên không hoàn lại gồm 4 hộ gia đình được yêu cầu. Số nguyên ngẫu nhiên từ 1 đến và kể cả 39 được tạo ra, thu được {7, 33, 2, 11}. Đơn vị lấy mẫu tương ứng là các hộ gia đình với thứ hạng liệt kê: {3, 10, 1, 5}.
8.13. Lấy mẫu nhiều tầng
Đối với tổng thể hoặc lô có cấu trúc lồng nhóm thứ bậc nhỏ dần, chọn mẫu ngẫu nhiên từ các nhóm lớn nhất, sau đó các nhóm con nhỏ hơn từ mỗi nhóm được chọn trước đó, tiếp tục quy trình này cho đến khi đạt đến từng cấp đơn vị trong hồ sơ. Ở mỗi tầng, sử dụng phương pháp lấy mẫu ngẫu nhiên nêu trong 8.3 hoặc 8.6 khi lấy mẫu không hoàn lại được yêu cầu hoặc phương pháp nêu trong 8.5 khi yêu cầu lấy mẫu có hoàn lại. Số đơn vị trong mẫu là tích của số mẫu được lấy ở mỗi tầng.
VÍ DỤ: Một lô gồm 20 palet, mỗi palet có 20 thùng. Mỗi thùng có 10 đơn vị. Người mua muốn kiểm tra sản phẩm bằng phương án lấy mẫu nhiều tầng. Một mẫu ngẫu nhiên gồm 4 palet được chọn. Sau đó, từ mỗi palet được chọn, chọn ra mẫu ngẫu nhiên gồm 4 thùng. Cuối cùng, từ mỗi thùng được chọn, chọn ra mẫu ngẫu nhiên gồm 3 đơn vị. Quy trình này thu được một mẫu gồm 48 đơn vị từ 4 000 đơn vị trong lô.
8.14. Ngẫu nhiên hóa trong thiết kế thực nghiệm
Trong các ứng dụng thiết kế thực nghiệm, ngẫu nhiên hóa được sử dụng để thực hiện những hoạt động như phân bổ các xử lý thực nghiệm cho các đơn vị hoặc đối tượng và thiết lập thứ tự đánh giá các đơn vị, bao gồm cả thứ tự đánh giá đối với các thiết kế lặp. Có thể sử dụng một trong hai phương pháp ngẫu nhiên hóa dưới đây.
a) Phương pháp 1
1) Ẩn định số nguyên từ 1 đến N cho từng phần tử trong danh mục N xử lý hoặc đơn vị, tùy trường hợp.
2) Tạo hoán vị ngẫu nhiên N số nguyên được lấy (nghĩa là tất cả) tại một thời điểm.
3) Tiến hành hoạt động thực nghiệm theo trình tự thu được từ bước 2).
b) Phương pháp 2
1) Tạo N biến thực ngẫu nhiên Ui và ấn định từng giá trị theo thứ tự tạo ra cho từng phần tử liên tiếp trong danh mục các xử lý hoặc đơn vị, tùy trường hợp.
2) Sắp xếp danh mục xử lý hoặc đơn vị theo thứ tự tăng dần theo giá trị tương ứng U của chúng.
3) Tiến hành hoạt động thực nghiệm theo trình tự thu được từ bước 2).
VÍ DỤ 1: Nhà nghiên cứu y học muốn thử nghiệm tác dụng của một loại thuốc mới so với điều trị sử dụng thông thường trong điều kiện y tế đặc biệt. Mười hai đối tượng tình nguyện và được đánh số từ 1 đến 12 khi tham gia vào thử nghiệm lâm sàng này. Nhà nghiên cứu hoạch định phân bổ điều trị A (thuốc mới) cho 6 đối tượng và điều trị B (thuốc hiện thời) cho sáu đối tượng còn lại. Như một công đoạn làm giảm độ chệch, trước hết thử nghiệm viên quyết định ngẫu nhiên hóa thứ tự 12 điều trị trước khi phân bổ chúng vào danh mục ngẫu nhiên hóa 12 đối tượng. Từng số chỉ số các điều trị và đối tượng được ngẫu nhiên hóa riêng theo phương pháp 1. Danh mục ngẫu nhiên hóa thu được của các điều trị là {B, B, A, B, A, A, B, B, A} và danh mục ngẫu nhiên hóa đối tượng là {3, 7, 12, 5, 1, 9, 11, 4, 10, 2, 8, 6}. Lúc này các điều trị có thể phân bổ trực tiếp cho các đối tượng dựa trên thứ tự trong các danh mục, thu được {B3, B7, A12, B5, A1, A9, B11, A4, A10, B2, B8, B6}. Kết quả là điều trị A được phân bổ cho các đối tượng {1, 4, 6, 9, 10, 12} còn điều trị B được phân bổ cho các đối tượng {2, 3, 5, 7, 8, 11}.
VÍ DỤ 2: Người thử nghiệm muốn tiến hành thực nghiệm lặp lại, thử nghiệm từng đơn vị trong số 5 đơn vị theo thứ tự ngẫu nhiên tại ba thời điểm khác nhau. Tập hợp {1, 2, 3, 4, 5} được hoán vị ngẫu nhiên theo phương pháp 1, thu được ba danh mục theo thứ tự như sau: {2, 1, 5, 4, 3}, {1, 5, 2, 3, 4}, {4, 3, 5, 2, 1}. Ba danh mục này được ấn định theo thứ tự lần thử tương ứng là 1, 2 và 3 và thử nghiệm viên thử nghiệm các đơn vị theo thứ tự quy định trong danh mục kèm theo từng lần thử.
8.15. Hình vuông La tinh ngẫu nhiên
Hình vuông La tinh ngẫu nhiên bậc n là dãy n x n chứa các ký hiệu từ bảng chữ cái cỡ n, sắp xếp sao cho mỗi ký hiệu xuất hiện đúng một lần trong mỗi hàng và đúng một lần trong mỗi cột. Sẽ hữu ích trong việc hoạch định một số loại hoạch định một số loại thiết kế thực nghiệm. Hình vuông La tinh ngẫu nhiên bậc n có thể tạo ra bằng phương pháp dưới đây (từ tài liệu tham khảo [4]).
a) Tạo dãy A[1:n, 1:n] và C[1:n].
b) Đặt R bằng 1.
c) Ấn định các số nguyên từ 1 đến n cho dãy C[1:n]
d) Đặt J bằng N.
e) Đặt C bằng 1.
f) Đặt I bằng 0.
g) Tạo số nguyên ngẫu nhiên X trong dải từ 1 đến và bao gồm cả J.
h) Đặt H bằng 1.
i) Nếu I lớn hơn 50, thực hiện bước c).
j) Nếu A[H, C] bằng C[X] tăng I thêm 1 và thực hiện bước g).
k) Tăng H thêm 1.
l) Nếu H lớn hơn hoặc bằng R – 1, thực hiện bước i).
m) Đặt A[R, C] bằng C[X], giảm J đi 1
n) Nếu X lớn hơn J, thực hiện bước r).
o) Đặt K bằng X.
p) Đặt C[K] bằng C[K+1].
q) Tăng K thêm 1; nếu K nhỏ hơn hoặc bằng J, thực hiện bước p).
r) Tăng C thêm 1; nếu C nhỏ hơn hoặc bằng n, thực hiện bước f).
s) Tăng R thêm 1; nếu R nhỏ hơn hoặc bằng n, thực hiện bước c).
t) Thu được hình vuông La tinh ngẫu nhiên từ dãy A.
CHÚ THÍCH: Thuật toán tạo các hình vuông La tinh ngẫu nhiên phân bố đều có thể thấy trong tài liệu tham khảo [5]. Ngoài ra, cần chú ý rằng có sự kết nối giữa hình vuông La tinh ngẫu nhiên và việc tạo ra xáo trộn ngẫu nhiên một hoán vị vì mỗi hàng và cột hình vuông La tinh là một xáo trộn của tất cả các hàng và các cột trước đó.
PHỤ LỤC A
(quy định)
BẢNG SỐ NGẪU NHIÊN
A.1. Mô tả
Phụ lục này đưa ra hai bảng số ngẫu nhiên áp dụng khi không có sẵn máy tính để thực hiện các thuật toán tạo số ngẫu nhiên của tiêu chuẩn này. Mỗi bảng gồm 3 600 số ngẫu nhiên từ 0 đến 9, mỗi số xuất hiện với tần suất bằng nhau. Các bảng đều được sắp xếp dưới dạng 60 hàng và 60 cột để thuận tiện cho việc sử dụng thời gian trong ngày làm điểm khởi đầu. Các bảng được tạo ra bằng cách sử dụng các thuật toán mô tả trong Điều 7.
A.2. Sử dụng
A.2.1. Số chữ và giải thích
A.2.1.1. Xác định số chữ m cần thiết để thể hiện cỡ lô N. Số chữ số bằng số chữ số trong cỡ lô trừ trường hợp cỡ lô là lũy thừa của 10; trong trường hợp này, bỏ qua số đầu trong cỡ lô và giải thích các số không còn lại là số chữ số yêu cầu cũng như bằng với giá trị cỡ lô (ví dụ nếu N = 100, giải thích giá trị 00 là 100).
A.2.1.2. Khi cỡ lô nhỏ hơn hoặc bằng một nửa của 10m thì các số nhập vào bảng có thể được giải thích dựa trên ánh xạ của giá trị quan trắc lên dải từ 1 đến N, với điều kiện là độ chệch không được đưa vào quá trình này. Điều này có thể được thực hiện bằng cách bỏ qua tất cả các giá trị vượt quá kN, trong đó k = ë10m / Nû, trước khi ánh xạ giá trị theo công thức v2 = 1 + (v1 – 1) mô đun N, trong đó v1 là giá trị ban đầu và v2 là giá trị ánh xạ vào dải mong muốn.
A.2.2. Điểm bắt đầu
A.2.2.1. Trước khi có thể thu được các số trong bảng, cần quyết định về kế hoạch chọn điểm bắt đầu. Các bảng được thiết kế để dễ dàng cho phép thời gian trong ngày từ đồng hồ có thể hiển thị thời gian tính đến giây sử dụng cho mục đích này. Dưới đây là phương pháp có thể sử dụng.
a) Ghi thời gian hiện tại dưới dạng “giờ:phút:giây”.
b) Sử dụng giá trị giây để xác định giá trị hàng, giải thích 00 là 60.
c) Sử dụng giá trị phút để xác định giá trị cột, giải thích 00 là 60.
d) Sử dụng giá trị giờ để xác định việc sử dụng Bảng A.1 hay Bảng A.2, dựa trên giá trị là chẵn hay lẻ.
VÍ DỤ: Thử nghiệm viên mong muốn chọn điểm bắt đầu trong bảng để chọn mẫu ngẫu nhiên từ lô gồm 100 đơn vị. Thời gian hiện thời được ghi là 10:35:23. Do đó, tọa độ nhập vào bảng là hàng 13 cột 53 của Bảng A.2 (vì 10 là số chẵn). Chữ số tại vị trí đó là 6 nhưng vì cần hai chữ số để chọn mẫu từ 100 đơn vị nên giá trị từ cột 36 cũng được tính để nhận biết đơn vị mẫu đầu tiên là 66.
A.2.2.2. Cũng có thể sử dụng phương pháp bất kỳ khác đưa ra nguồn ngẫu nhiên các số nguyên phân bố đều tong phạm vi dải từ 1 đến và bao gồm cả 60 như phương pháp đồng xu hay xúc sắc trong 5.2 hoặc thuật toán trên máy tính trong Điều 7 (có thể sử dụng để tạo một danh mục dài các tọa độ ngẫu nhiên để sử dụng vào những lần liên tiếp). Ngoài ra, khi kết thúc việc chọn mẫu từ bảng trong một lần cụ thể, có thể ghi lại các tọa độ nhập ngay tiếp sau và sau đó sử dụng làm điểm bắt đầu cho lần lấy mẫu tiếp theo.
VÍ DỤ: Tiếp tục với ví dụ ở A.2.2.1, giả định rằng mẫu ngẫu nhiên có hoàn lại gồm 10 đơn vị được yêu cầu và hướng được sử dụng để chọn những số này là hướng đi xuống. Mẫu thu được là {66, 13, 10, 45, 32, 22, 41, 49, 22, 99}. Tọa độ của giá trị ngay sau đó là hàng 23 và cột 35. Các giá trị này có thể được ghi lại và sử dụng làm điểm nhập khi mẫu được yêu cầu cho lần tiếp theo.
A.2.2.3. Tọa độ nhập cũng có thể được xác định bằng cách thiết lập chữ số ban đầu dựa trên các giá trị hàng và cột từ A.2.2.1 hoặc A.2.2.2, và các chữ số bổ sung dựa trên giá trị của hàng hiện thời và cột bổ sung dựa trên các số được tạo ngẫu nhiên không hoàn lại trong dải từ 1 đến và kể cả 60 đối với các chữ số m – 1 còn lại yêu cầu. Số nhiều chữ số thu được hình thành theo thứ tự các số nhập trong cột được tạo ra.
VÍ DỤ: Một mẫu ngẫu nhiên từ lô 1 000 được yêu cầu. Hàng và cột đầu tiên được xác định tương ứng là 5 và 11, trong Bảng A.1. Cần thêm hai chữ số nữa và chúng được tạo ra bên ngoài là 1 và 30, thu được tọa độ sau đây tương ứng cho chữ số đầu tiên, thứ hai và thứ 3: (5, 11), (5, 1) và (5, 30). Hướng lấy trong bảng được quyết định là hướng đi xuống. Do đó, số đầu tiên là 511, tiếp theo là 943, 419, 413, 899, 209, …
A.2.3. Xử lý với các ranh giới của bảng
A.2.3.1. Khi đọc số gồm m chữ số và các chữ số phía bên phải của chữ số đầu tiên vượt quá cột thứ 60 thì coi các cột 1, 2, … tương ứng là cột 61, 62, … Có thể áp dụng nguyên tắc này trong phạm vi bảng hiện hành hoặc bằng cách coi bảng số ngẫu nhiên khác là mở rộng của bảng đầu tiên.
A.2.3.2. Nguyên tắc thông thường là thu được các số ngẫu nhiên tiếp theo bằng cách tăng giá trị hàng thêm một và đọc m chữ số của số đó dựa trên các giá trị cột xác định trước và thứ tự của chúng. Khi giá trị của hàng này vượt quá hàng thứ 60 thì coi hàng 1 là hàng 61 và tăng giá trị cột thêm m trong trường hợp các cột được sử dụng liên tiếp hoặc tăng thêm một trong trường hợp A.2.2.3 được sử dụng để thiết lập các cột, và tiếp tục thu được các số. Có thể áp dụng nguyên tắc này trong phạm vi bảng hiện hành hoặc bằng cách coi bảng số ngẫu nhiên khác là mở rộng của bảng đầu tiên, với điều kiện là nó chưa được sử dụng như theo A.2.3.1.
A.2.4. Hồ sơ đánh giá
Khi hồ sơ được yêu cầu lưu giữ cho mục đích đánh giá bởi cơ quan chịu trách nhiệm hoặc cơ quan chức năng, thì ghi lại cỡ lô và cỡ mẫu.
Ngoài ra, đối với các bảng và sử dụng bảng, ghi lại
a) hàng ban đầu,
b) (các) cột ban đầu và thứ tự của chúng,
c) hướng lấy trong bảng,
d) bảng ban đầu sử dụng và cách thức mở rộng bởi bảng khác, nếu áp dụng, và
e) ánh xạ sử dụng.
Bảng A.1 – Số ngẫu nhiên (đối với giá trị lẻ)
Hàng i | Cột j. | |||||||||||
5 | 10 | 15 | 20 | 25 | 30 | 35 | 40 | 45 | 50 | 55 | 60 | |
5 | 95183 08509 45448 02230 13275 | 14683 97009 66819 00022 96798 | 96585 47525 86936 46390 51425 | 84761 88791 95349 76658 67147 | 65044 93751 08657 91934 15216 | 65183 70490 75106 64676 71831 | 55567 17749 97487 42429 16229 | 28734 32927 85268 96812 25862 | 19802 65080 59208 30560 22090 | 56410 94970 43206 99913 91420 | 79127 55541 14898 72809 24352 | 02879 89466 29083 66736 03550 |
10 | 44439 17629 14328 96896 09725 | 33385 80967 77127 02466 80938 | 95151 42144 40397 86706 27971 | 92374 58190 78105 09507 01243 | 14683 24550 75031 66840 29232 | 00323 62189 99553 68509 28799 | 57667 94525 84296 38033 88456 | 78341 44967 01482 90785 99618 | 09004 15860 25738 75831 20071 | 80139 85739 32761 98886 79865 | 81132 93323 85035 00905 63584 | 87552 87043 68873 48343 69087 |
15 | 55021 06492 20604 20202 27160 | 37184 95014 54145 58870 01595 | 69480 54908 27781 67569 64831 | 56317 21591 35157 71756 07126 | 19944 13771 50127 76284 25821 | 56756 35967 61025 30909 81524 | 37514 78637 57344 87763 12585 | 86439 29918 36615 21951 76273 | 69831 47923 07766 67756 36256 | 15172 61404 83959 82597 41879 | 81398 63378 34546 15210 33287 | 69574 72394 67011 04291 84361 |
20 | 95089 74825 80338 16596 34134 | 78572 21529 94074 43179 42056 | 87167 24660 65731 42026 40153 | 65888 33314 39470 94264 00994 | 93358 64512 03807 28301 14179 | 23879 80550 72355 29514 44447 | 84496 51712 40407 60657 99399 | 16147 23057 86049 21732 86963 | 31130 53841 81583 21548 71862 | 96978 32470 06786 28693 01306 | 80361 36790 16673 15241 15489 | 85195 60455 06017 68944 00515 |
25 | 01118 67371 03485 33328 84302 | 98623 71659 55173 74045 10060 | 33695 30505 68477 25331 25334 | 49221 71239 12348 37635 84920 | 97197 56944 76971 39081 30270 | 21424 35898 64800 28786 09722 | 91691 02207 86498 20843 61706 | 09365 93274 42059 32565 52863 | 62483 40142 08942 24316 03417 | 98893 98319 32931 17888 95658 | 22106 41218 73896 47626 74490 | 45399 43739 27772 69199 00143 |
30 | 94775 51700 75920 32385 13424 | 52191 63604 13260 28423 00587 | 94552 96771 44283 46784 12231 | 99265 34444 27735 59222 44543 | 55079 30002 31134 17776 62984 | 64517 67975 97100 57726 58391 | 16803 93167 36706 56449 22054 | 13037 16746 24404 32109 16134 | 50984 97842 56970 11825 73790 | 14886 25589 44575 57995 59050 | 04385 12568 68832 91217 24893 | 67907 81785 42374 12802 62342 |
35 | 90896 60682 38746 51658 49174 | 00608 38700 34667 18422 12449 | 31377 34039 84499 05732 97583 | 53338 93512 70915 91001 85835 | 84813 38596 91391 98070 82313 | 76825 40004 25660 13591 96349 | 92192 71447 12328 44468 92721 | 24937 97193 35273 88460 64617 | 81481 52407 08135 66964 06030 | 01866 44146 04799 24038 22312 | 22641 77116 14489 93987 94263 | 21817 99965 19984 66335 80291 |
40 | 44215 33877 83411 27135 29475 | 21953 94654 43288 82404 31431 | 21844 10025 47832 52031 46863 | 44114 84935 40488 44648 70098 | 93162 94630 89085 97600 98659 | 51028 49660 69731 72166 72035 | 29551 23473 00790 70830 21538 | 66121 89644 60182 27701 12923 | 63959 67212 71358 01755 76963 | 97789 75851 22571 00523 78288 | 44259 83767 94204 01837 59083 | 90865 45647 64211 31304 18839 |
45 | 56886 55061 01646 41789 26066 | 38711 35916 62126 28167 80119 | 66126 15955 37253 90577 44259 | 16504 28228 24997 84499 94514 | 87900 36994 53016 25059 21211 | 74055 73167 96515 90583 44302 | 46028 17137 40536 09422 29023 | 84821 36572 39311 87357 28138 | 83323 48592 64151 55416 03693 | 35962 60721 93960 81135 50650 | 27522 97714 24053 41286 38450 | 87875 61215 87645 92320 61118 |
50 | 63559 35054 32826 07860 79276 | 20927 84077 26937 90064 72512 | 12881 02504 75563 91220 19525 | 25582 10800 14290 46786 27397 | 07872 75293 30078 45994 88975 | 28073 86466 70820 47375 77137 | 59006 92406 58639 70140 40032 | 55666 56289 64900 35592 06205 | 68690 79081 61699 05990 06997 | 59772 55271 34974 58470 53504 | 25162 73177 11738 82014 07760 | 87924 70568 64065 05265 62546 |
55 | 41093 27382 38924 51411 80310 | 04332 27938 47230 44221 18848 | 68677 91695 59448 93363 23722 | 27073 64013 97802 48654 30788 | 94104 46719 37987 42656 27435 | 58532 61629 22733 99464 03780 | 53616 33668 52199 08481 85737 | 32156 32391 12325 98128 05561 | 66153 35411 18625 66677 57203 | 00264 68209 01271 89441 07316 | 36374 33885 84870 66019 98597 | 15230 64050 10911 75095 73621 |
60 | 40082 86922 07932 20383 45471 | 39571 84354 69932 07288 31340 | 89790 81939 18796 50265 30187 | 65382 32180 87070 48321 23899 | 01447 32891 82202 63056 36361 | 15984 52704 05372 35861 96780 | 60854 84659 93506 80864 55823 | 72833 95442 60697 86357 37743 | 87320 86204 48535 51567 06957 | 95245 44040 89027 68151 77884 | 40678 51613 45719 11723 78061 | 89785 15984 51567 06990 36603 |
Bảng A.2 – Số ngẫu nhiên (đối với giá trị chẵn)
Hàng i | Cột j | |||||||||||
5 | 10 | 15 | 20 | 25 | 30 | 35 | 40 | 45 | 50 | 55 | 60 | |
5 | 51326 96821 67104 93315 45823 | 91644 43647 67934 93110 44862 | 88971 41707 95662 01022 86472 | 00664 91062 85259 16079 77354 | 10776 20037 08546 74364 95916 | 90888 47660 77032 97582 36599 | 97107 34652 28958 34309 52350 | 00930 82087 26815 18699 89866 | 87438 29652 66683 24437 98532 | 23714 51614 50539 12839 69704 | 33246 11015 65189 48005 33735 | 72109 66187 22993 46478 13696 |
10 | 32573 74553 06794 75606 97535 | 58513 41700 48960 34848 55169 | 70797 25357 75160 74458 47044 | 53560 17428 18552 71100 81940 | 23115 66708 00424 01512 16507 | 38325 83630 25976 89662 12220 | 74380 42360 69852 01391 16375 | 99917 16842 35837 49140 65306 | 21721 40782 69810 18048 38691 | 00323 21345 64014 59282 75019 | 29402 88668 03045 77344 55186 | 27080 95845 53378 72419 47269 |
15 | 89809 88095 48854 97951 48953 | 48811 48475 75803 73015 47945 | 09494 07399 34089 36585 81153 | 06576 02165 45335 89007 10121 | 58258 98038 13056 12069 69935 | 73115 97247 44509 96858 60894 | 46712 48441 77886 17241 23151 | 11106 93066 65036 37189 00113 | 38382 20276 42619 44193 40597 | 70893 72169 95564 28270 71164 | 39503 49706 66315 81624 61331 | 42937 56553 49084 75256 10930 |
20 | 83334 31105 94245 19221 33503 | 44992 74546 19396 70541 45776 | 30210 74875 03648 58195 88514 | 99370 51747 28548 21383 10094 | 60425 41021 42987 57877 28589 | 87391 22338 78668 27812 47548 | 63244 49403 09292 06504 64714 | 54828 20173 23073 18289 96174 | 12155 75454 21116 18606 10026 | 64082 62122 07199 17860 87111 | 43773 37227 21398 09218 29333 | 66172 35790 18770 58984 77885 |
25 | 03602 43277 31966 19193 98935 | 99374 65791 42142 31952 48606 | 41918 12217 71410 87947 27475 | 43875 23767 28139 89521 73462 | 11258 09833 60147 65225 66692 | 83646 66504 68496 97987 11151 | 46042 82359 89021 14794 21709 | 26986 95754 01615 90695 32836 | 11003 40249 36565 69314 92997 | 94756 71472 85598 10359 33682 | 89972 61588 18048 27881 12722 | 00805 04428 32584 38183 38906 |
30
35 | 21880 81695 68883 59547 91709 57195 03657 93373 35158 38056 | 10506 06183 60266 60741 73154 97283 71909 88795 50868 14298 | 78478 08147 66180 56065 86898 25156 82018 11353 45055 10431 | 85067 01241 05680 71467 20234 59277 83110 44726 12180 53147 | 30375 16278 38799 07193 05773 33608 21722 66989 29993 76843 | 82944 54886 40481 38784 47157 73937 03455 24389 69555 32128 | 06660 36468 73524 08169 72305 19341 30654 93445 69613 46844 | 40750 21315 73255 07389 20819 17262 57890 53752 69358 23407 | 84252 49106 79950 64049 57301 63955 18530 98703 96861 62423 | 20463 10291 42007 21355 89018 41678 60458 55276 01667 01712 | 37184 16837 56334 86589 74851 36229 57145 18391 47738 46033 | 27248 40481 54332 06583 50560 54204 08764 53513 11964 64425 |
40 | 49152 80000 53597 09151 99734 | 05010 90734 22379 34061 68144 | 84942 70131 94302 64751 63963 | 25483 19986 15425 96631 73011 | 52825 34949 62185 50373 22832 | 17485 76990 27894 61603 98145 | 67614 48325 37281 84917 31523 | 12493 39323 38876 56084 60195 | 88626 66921 97902 57647 34172 | 39589 89134 34008 80898 40637 | 56044 21853 45051 55489 60940 | 21968 18973 05607 24602 51237 |
45 | 84547 18815 14169 90528 99055 | 89655 26665 38336 60501 42696 | 53120 25301 41192 73201 14376 | 95599 67754 56208 72999 24907 | 04602 88457 29069 30335 06082 | 07968 19913 87045 86428 61789 | 85748 96787 32135 39401 03963 | 74914 71084 25975 72077 64664 | 76227 14867 71643 48056 09132 | 07158 03077 74200 17853 87218 | 24432 89575 52556 24894 64755 | 22963 66834 30213 19838 46107 |
50 | 62530 74196 27293 94220 68430 | 10183 77214 56047 93209 23169 | 38149 89483 73998 32369 58879 | 70004 43933 19996 82003 97812 | 74983 80953 94427 82433 39399 | 02092 81268 09157 85790 71469 | 40704 46485 62999 47632 40835 | 01062 23647 88803 36285 04924 | 17000 98173 81272 68771 30336 | 61170 55947 22315 06006 59222 | 99026 96727 92708 37556 06350 | 24025 86378 07343 51601 45656 |
55 | 61949 57248 10777 06717 09519 | 23031 90383 53979 92287 67689 | 50698 23502 65288 42775 13829 | 85772 22642 39116 79274 30992 | 85990 80722 80635 90874 44921 | 36942 38164 49653 44006 67375 | 11098 12160 36903 27312 94754 | 06636 51707 33854 15909 95322 | 57547 22075 79873 25276 25501 | 73247 20624 67823 59863 78486 | 46229 91644 23256 75607 99059 | 52551 08780 31643 22277 62524 |
60 | 57335 14911 04837 14430 68896 | 48704 08271 08929 20139 64599 | 79426 21662 81607 15027 91227 | 49770 40886 33210 52208 55882 | 32989 53783 61894 16440 60220 | 22640 76430 17240 59911 70202 | 88230 41233 37617 57566 73354 | 66598 44057 56753 22227 34776 | 27685 28385 61251 60109 55530 | 29719 21751 49433 95260 20599 | 99930 51746 65644 21388 45720 | 26181 64387 63758 96686 75145 |
PHỤ LỤC B
(tham khảo)
MÃ MÁY TÍNH THUẬT TOÁN TẠO SỐ NGẪU NHIÊN
B.1. Tổng quan
Bộ mã dưới đây được viết trên ngôn ngữ lập trình C (xem tài liệu tham khảo [6] về chi tiết ngôn ngữ và đưa ra việc áp dụng các thuật toán mô tả ở Điều 7. Tài liệu tham khảo cho các phần liên quan của Điều 7 được nêu trực tiếp trong phần ghi chú trong các phân đoạn mã lập trình để hỗ trợ việc chuyển dịch sang các ngôn ngữ lập trình khác.
B.2. Chương trình minh họa
B.3. Hàm tạo giá trị xuất phát ngẫu nhiên tự động
Khi giá trị xuất phát nhập bằng tay được yêu cầu cho mục đích xác nhận hay đánh giá như đề cập ở 7.1.3 thì không gọi hàm này.
B.4. Hàm tạo số ngẫu nhiên
Khi tùy chọn giá trị xuất phát nhập bằng tay theo 7.1.3 thì tham số “giá trị xuất phát” (và do đó “Seed2”) được đặt bằng giá trị nhập bằng tay trước khi gọi hàm này.
PHỤ LỤC C
(tham khảo)
LẤY MẪU NGẪU NHIÊN VÀ MÃ MÁY TÍNH NGẪU NHIÊN HÓA
C.1. Giới thiệu
Phụ lục này cung cấp ứng dụng ngôn ngữ lập trình C (xem tài liệu tham khảo [6] và chi tiết ngôn ngữ) cho các thuật toán lựa chọn mô tả ở Điều 8. Mã chương trình của Phụ lục này được viết để minh họa các mô tả trong Điều 8 và không phải là tùy chọn nhất thiết trong cấu trúc của nó.
C.2. Chương trình minh họa
C.3. Các hàm
THƯ MỤC TÀI LIỆU THAM KHẢO
[1] BAYS, C. and DURHAM, S.D. Improving a Poor Random Number Generator. ACM Transactions on Mathematical Software, 2 (1), 1976, pp. 59-64 (Cải tiến bộ tạo số ngẫu nhiên kém. Giao dịch ACM trên phần mềm toán học)
[2] BISSEL, A.F. Ordered random selection without replacement. Applied Statistics, 35, 1986, pp. 73-75 (Chọn ngẫu nhiên theo thứ tự, không hoàn lại. Thống kê ứng dụng)
[3] BUCKLES, B.P. and LYBANON, M. Algorithm 515, Generation of a Vector from the Lexicographical Index. ACM Transactions on Mathematical Software, 3 (2), 1977, pp. 180-182 (Tạo véctơ từ chỉ mục từ điển. Giao dịch ACM trên phần mềm toán học)
[4] BYERS, J.A. Random selection algorithms for spatial and temporal sampling. Computers in Biology and Medicine, 26, 1996, pp. 41-52 (Thuật toán chọn lọc ngẫu nhiên dùng cho lấy mẫu theo không gian và thời gian. Máy tính trong sinh học và y học).
[5] JACOBSON, M.T and MATTHEWS, P. Generating uniformly distributed random Latin squares. Journal of Combinatorial Design, 4, 1996, pp. 405-437 (Tạo hình vuông La tinh ngẫu nhiên phân bố đều. Tạp chí thiết kế tổ hợp)
[6] ISO/IEC 9899:1999, Programming languages – C (Ngôn ngữ lập trình C)
[7] L’ECUYER, P. An Efficient and Portable Combined Random Number Generator. Communications of the ACM, 31 (6), 1988, pp. 742-749, 774 (Bộ tạo số ngẫu nhiên kết hợp hiệu quả và di động. Truyền thông ACM)
[8] MARSAGLIA, G. Random Number Generators, Journal of modern Applied Statistical Methods, 2 (1), 2003, pp. 2-13 (Bộ tạo số ngẫu nhiên, Tạp chí phương pháp thống kê ứng dụng hiện đại)
[9] MCCULLOUGH, B.D. Assessing the Reliability of Statistical Software: Part II. The American Statistician, Vol. 53, No. 2 (May), 1999, pp. 149-159 (Đánh giá độ tin cậy của phần mềm thống kê: Phần II. Nhà thống kê học người Mỹ)
[10] MCCULLOUGH, B.D. and WILSON, B. On the Accuracy of Statistical Procedures in Microsoft EXCAL 97. Computational Statistics and Data Analysis, 31 (1), 1999, pp. 27-37 (Độ chính xác của quy trình thống kê trong Microsoft EXCEL 97. Thống kê và phân tích dữ liệu trên máy tính)
[11] MCLEOD, A.I and BELLHOUSE, D.R. A convenient algorithm for drawing a simple random sample. Applied Statistics, 32, 1983, pp. 182-184 (Thuật toán thuận lợi cho việc vẽ biến ngẫu nhiên đơn giản. Thống kê ứng dụng)
[12] PARK, S.K. and MILLER, K.W. Random Number Generators: Good Ones are Hard to Find. Communications of the ACM, 31 (10), 1988, pp. 1192-1201 (Bộ tạo số ngẫu nhiên: Khó tìm được sản phẩm tốt. Truyền thông ACM)
[13] PRESS, W.H., Teukolsky, S.A., Vetterling, W.T., and Flannery, B.P. Numerical Recipes in Fortran 77: The Art of Scientific Computing, Second Edition (volume 1 of Fortran Numerical Recipes), Cambridge University Press, Cambridge, UK, 1992, 2001 (Bí quyết số trong Fortran 77: Công nghệ Khoa học máy tính)
[14] SOM, R.K. A Manual of Sampling Techniques. Heinemann Educational Books Ltd., London 1973 (Sổ tay kỹ thuật lấy mẫu)
MỤC LỤC
Lời nói đầu
Lời giới thiệu
1. Phạm vi áp dụng
2. Tài liệu viện dẫn
3. Thuật ngữ, định nghĩa và ký hiệu
3.1. Thuật ngữ và định nghĩa
3.2. Ký hiệu
4. Quy định chung
5. Lấy mẫu ngẫu nhiên – Phương pháp dùng thiết bị cơ
5.1. Phương pháp bình
5.2. Phương pháp đồng xu hay xúc sắc
6. Lấy mẫu ngẫu nhiên giả độc lập – Phương pháp bảng số
6.1. Bảng số ngẫu nhiên
6.2. Phương pháp cơ bản
7. Lấy mẫu ngẫu nhiên giả độc lập – Phương pháp máy tính
7.1. Tổng quan
7.2. Thuật toán khởi tạo
7.3. Thuật toán tạo số ngẫu nhiên
7.4. Hồ sơ đánh giá
8. Áp dụng cho tình huống lấy mẫu phổ biến
8.1. Khái quát
8.2. Số nguyên ngẫu nhiên trong dải
8.3. Hóan vị ngẫu nhiên
8.4. Trộn ngẫu nhiên
8.5. Lấy mẫu ngẫu nhiên có hoàn lại
8.6. Lấy mẫu ngẫu nhiên không hoàn lại
8.7. Lấy mẫu ngẫu nhiên cho phương án lấy mẫu liên tục (CSP)
8.8. Lấy mẫu ngẫu nhiên phân tầng
8.9. Lấy mẫu ngẫu nhiên một lần từ cỡ lô ban đầu chưa biết
8.10. Lấy mẫu ngẫu nhiên một lần theo thứ tự, không hoàn lại
8.11. Lấy mẫu chùm
8.12. Lấy mẫu ngẫu nhiên với xác suất tỷ lệ thuận với cỡ mẫu
8.13. Lấy mẫu nhiều tầng
8.14. Ngẫu nhiên hóa trong thiết kế thực nghiệm
8.15. Hình vuông La Tinh ngẫu nhiên
Phụ lục A (quy định), Bảng số ngẫu nhiên
Phụ lục A (tham khảo), Mã máy tính thuật toán tạo số ngẫu nhiên
Phụ lục A (tham khảo), Lấy mẫu ngẫu nhiên và mã máy tính ngẫu nhiên hóa
Thư mục tài liệu tham khảo
Click Tải về để xem toàn văn Tiêu chuẩn Việt Nam nói trên.