1.1
Definitions of Statistics, Probability, and Key Terms
1.1
Định nghĩa về Thống kê, Xác suất và Các thuật ngữ chính
The science of statistics deals with the collection, analysis, interpretation, and presentation of data. We see and use data in our everyday lives.
Khoa học về thống kê liên quan đến việc thu thập, phân tích, diễn giải và trình bày dữ liệu. Chúng ta bắt gặp và sử dụng dữ liệu trong cuộc sống hàng ngày.
Collaborative Exercise
Bài tập Phối hợp
In your classroom, try this exercise. Have class members write down the average time—in hours, to the nearest half-hour—they sleep per night. Your instructor will record the data. Then create a simple graph, called a dot plot, of the data. A dot plot consists of a number line and dots, or points, positioned above the number line. For example, consider the following data:
Trong lớp học của bạn, hãy thử bài tập này. Yêu cầu các thành viên trong lớp viết ra thời gian ngủ trung bình mỗi đêm—tính bằng giờ, làm tròn đến nửa giờ. Giảng viên của bạn sẽ ghi lại dữ liệu. Sau đó, tạo một biểu đồ đơn giản, gọi là biểu đồ chấm (dot plot), từ dữ liệu đó. Biểu đồ chấm bao gồm một trục số và các chấm, hoặc các điểm, được đặt phía trên trục số. Ví dụ, hãy xem xét dữ liệu sau:
5, 5.5, 6, 6, 6, 6.5, 6.5, 6.5, 6.5, 7, 7, 8, 8, 9.
5, 5.5, 6, 6, 6, 6.5, 6.5, 6.5, 6.5, 7, 7, 8, 8, 9.
The dot plot for this data would be as follows:
Biểu đồ chấm cho dữ liệu này sẽ như sau:
Does your dot plot look the same as or different from the example? Why? If you did the same example in an English class with the same number of students, do you think the results would be the same? Why or why not?
Biểu đồ chấm của bạn trông giống hay khác so với ví dụ? Tại sao? Nếu bạn làm cùng một ví dụ trong một lớp học tiếng Anh với cùng số lượng sinh viên, bạn có nghĩ kết quả sẽ giống nhau không? Tại sao có hoặc tại sao không?
Where do your data appear to cluster? How might you interpret the clustering?
Dữ liệu của bạn dường như tập trung lại ở đâu? Bạn có thể diễn giải sự tập trung này như thế nào?
The questions above ask you to analyze and interpret your data. With this example, you have begun your study of statistics.
Các câu hỏi trên yêu cầu bạn phân tích và diễn giải dữ liệu của mình. Với ví dụ này, bạn đã bắt đầu việc nghiên cứu thống kê.
In this course, you will learn how to organize and summarize data. Organizing and summarizing data is called descriptive statistics. Two ways to summarize data are by graphing and by using numbers, for example, finding an average. After you have studied probability and probability distributions, you will use formal methods for drawing conclusions from good data. The formal methods are called inferential statistics. Statistical inference uses probability to determine how confident we can be that our conclusions are correct.
Trong khóa học này, bạn sẽ học cách tổ chức và tóm tắt dữ liệu. Việc tổ chức và tóm tắt dữ liệu được gọi là thống kê mô tả. Hai cách để tóm tắt dữ liệu là bằng cách vẽ biểu đồ và sử dụng các con số, ví dụ như tính trung bình. Sau khi bạn đã nghiên cứu xác suất và các phân phối xác suất, bạn sẽ sử dụng các phương pháp chính thức để rút ra kết luận từ dữ liệu tốt. Các phương pháp chính thức được gọi là thống kê suy luận. Suy luận thống kê sử dụng xác suất để xác định mức độ tự tin của chúng ta về độ chính xác của các kết luận.
Effective interpretation of data, or inference, is based on good procedures for producing data and thoughtful examination of the data. You will encounter what will seem to be too many mathematical formulas for interpreting data. The goal of statistics is not to perform numerous calculations using the formulas, but to gain an understanding of your data. The calculations can be done using a calculator or a computer. The understanding must come from you. If you can thoroughly grasp the basics of statistics, you can be more confident in the decisions you make in life.
Việc diễn giải dữ liệu hiệu quả, hay suy luận, dựa trên các quy trình tốt để tạo ra dữ liệu và sự kiểm tra dữ liệu cẩn thận. Bạn sẽ gặp phải những gì dường như là quá nhiều công thức toán học để diễn giải dữ liệu. Mục tiêu của thống kê không phải là thực hiện vô số phép tính bằng cách sử dụng các công thức, mà là để hiểu rõ về dữ liệu của bạn. Các phép tính có thể được thực hiện bằng máy tính cầm tay hoặc máy vi tính. Sự hiểu biết phải đến từ chính bạn. Nếu bạn có thể nắm vững nền tảng của thống kê, bạn có thể tự tin hơn trong những quyết định mình đưa ra trong cuộc sống.
Statistical Models
Mô hình thống kê
Statistics, like all other branches of mathematics, uses mathematical models to describe phenomena that occur in the real world. Some mathematical models are deterministic. These models can be used when one value is precisely determined from another value. Examples of deterministic models are the quadratic equations that describe the acceleration of a car from rest or the differential equations that describe the transfer of heat from a stove to a pot. These models are quite accurate and can be used to answer questions and make predictions with a high degree of precision. Space agencies, for example, use deterministic models to predict the exact amount of thrust that a rocket needs to break away from Earth’s gravity and achieve orbit.
Thống kê, giống như tất cả các nhánh khác của toán học, sử dụng các mô hình toán học để mô tả các hiện tượng xảy ra trong thế giới thực. Một số mô hình toán học là tất định. Các mô hình này có thể được sử dụng khi một giá trị được xác định một cách chính xác từ một giá trị khác. Các ví dụ về mô hình tất định là các phương trình bậc hai mô tả sự tăng tốc của một chiếc xe từ trạng thái nghỉ hoặc các phương trình vi phân mô tả sự truyền nhiệt từ một chiếc bếp sang một cái nồi. Các mô hình này khá chính xác và có thể được sử dụng để trả lời các câu hỏi và đưa ra các dự đoán với độ chính xác cao. Các cơ quan vũ trụ, ví dụ, sử dụng các mô hình tất định để dự đoán chính xác lực đẩy mà một tên lửa cần để thoát khỏi lực hấp dẫn của Trái đất và đi vào quỹ đạo.
However, life is not always precise. While scientists can predict to the minute the time that the sun will rise, they cannot say precisely where a hurricane will make landfall. Statistical models can be used to predict life’s more uncertain situations. These special forms of mathematical models or functions are based on the idea that one value affects another value. Some statistical models are mathematical functions that are more precise—one set of values can predict or determine another set of values. Or some statistical models are mathematical functions in which a set of values do not precisely determine other values. Statistical models are very useful because they can describe the probability or likelihood of an event occurring and provide alternative outcomes if the event does not occur. For example, weather forecasts are examples of statistical models. Meteorologists cannot predict tomorrow’s weather with certainty. However, they often use statistical models to tell you how likely it is to rain at any given time, and you can prepare yourself based on this probability.
Tuy nhiên, cuộc sống không phải lúc nào cũng chính xác. Trong khi các nhà khoa học có thể dự đoán đến từng phút thời điểm mặt trời sẽ mọc, họ không thể nói chính xác nơi một cơn bão sẽ đổ bộ. Các mô hình thống kê có thể được sử dụng để dự đoán những tình huống bất định hơn của cuộc sống. Những dạng đặc biệt của mô hình hay hàm toán học này dựa trên ý tưởng rằng một giá trị sẽ ảnh hưởng đến một giá trị khác. Một số mô hình thống kê là những hàm toán học có độ chính xác cao hơn—một tập hợp các giá trị có thể dự đoán hoặc quyết định một tập hợp các giá trị khác. Hoặc một số mô hình thống kê là những hàm toán học mà trong đó một tập hợp các giá trị không quyết định chính xác các giá trị khác. Các mô hình thống kê rất hữu ích vì chúng có thể mô tả xác suất hoặc khả năng xảy ra của một sự kiện và cung cấp các kết quả thay thế nếu sự kiện đó không xảy ra. Ví dụ, dự báo thời tiết là những ví dụ điển hình về các mô hình thống kê. Các nhà khí tượng học không thể dự đoán thời tiết ngày mai một cách chắc chắn. Tuy nhiên, họ thường sử dụng các mô hình thống kê để cho bạn biết khả năng trời mưa tại bất kỳ thời điểm nào là bao nhiêu, và bạn có thể chuẩn bị sẵn sàng dựa trên xác suất này.
Probability
Xác suất
Probability is a mathematical tool used to study randomness. It deals with the chance of an event occurring. For example, if you toss a fair coin four times, the outcomes may not be two heads and two tails. However, if you toss the same coin 4,000 times, the outcomes will be close to half heads and half tails. The expected theoretical probability of heads in any one toss is or .5. Even though the outcomes of a few repetitions are uncertain, there is a regular pattern of outcomes when there are many repetitions. After reading about the English statistician Karl Pearson who tossed a coin 24,000 times with a result of 12,012 heads, one of the authors tossed a coin 2,000 times. The results were 996 heads. The fraction is equal to .498 which is very close to .5, the expected probability.
Xác suất là một công cụ toán học được sử dụng để nghiên cứu tính ngẫu nhiên. Nó giải quyết cơ hội xảy ra của một sự kiện. Ví dụ, nếu bạn tung một đồng xu cân đối bốn lần, kết quả có thể không phải là hai mặt ngửa và hai mặt sấp. Tuy nhiên, nếu bạn tung cùng một đồng xu đó 4.000 lần, kết quả sẽ gần bằng một nửa ngửa và một nửa sấp. Xác suất lý thuyết dự kiến cho mặt ngửa trong bất kỳ lần tung nào là hoặc .5. Mặc dù kết quả của một vài lần lặp lại là không chắc chắn, nhưng luôn có một mô hình kết quả có tính quy luật khi có nhiều lần lặp lại. Sau khi đọc về nhà thống kê học người Anh Karl Pearson, người đã tung một đồng xu 24.000 lần với kết quả là 12.012 lần ngửa, một trong những tác giả đã tung một đồng xu 2.000 lần. Kết quả là 996 lần ngửa. Phân số bằng với .498, rất gần với mức .5, tức là xác suất dự kiến.
The theory of probability began with the study of games of chance such as poker. Predictions take the form of probabilities. To predict the likelihood of an earthquake, of rain, or whether you will get an A in this course, we use probabilities. Doctors use probability to determine the chance of a vaccination causing the disease the vaccination is supposed to prevent. A stockbroker uses probability to determine the rate of return on a client's investments.
Lý thuyết xác suất bắt đầu từ việc nghiên cứu các trò chơi may rủi chẳng hạn như bài poker. Các dự đoán mang hình thức của các xác suất. Để dự đoán khả năng xảy ra động đất, trời mưa, hoặc việc bạn có đạt điểm A trong khóa học này hay không, chúng ta sử dụng xác suất. Các bác sĩ sử dụng xác suất để xác định cơ hội mà một loại vắc-xin có thể gây ra chính căn bệnh mà nó được cho là để ngăn ngừa. Một người môi giới chứng khoán sử dụng xác suất để xác định tỷ suất sinh lời trên các khoản đầu tư của một khách hàng.
Key Terms
Thuật ngữ chính
In statistics, we generally want to study a population. You can think of a population as a collection of persons, things, or objects under study. To study the population, we select a sample. The idea of sampling is to select a portion, or subset, of the larger population and study that portion—the sample—to gain information about the population. Data are the result of sampling from a population.
Trong thống kê, chúng ta thường muốn nghiên cứu một tổng thể. Bạn có thể coi một tổng thể là một tập hợp các cá nhân, sự vật hoặc đối tượng đang được nghiên cứu. Để nghiên cứu tổng thể, chúng ta chọn một mẫu. Ý tưởng của việc lấy mẫu là chọn một phần, hoặc một tập con, của tổng thể lớn hơn và nghiên cứu phần đó—tức là mẫu—để thu thập thông tin về tổng thể. Dữ liệu là kết quả của việc lấy mẫu từ một tổng thể.
Because it takes a lot of time and money to examine an entire population, sampling is a very practical technique. If you wished to compute the overall grade point average at your school, it would make sense to select a sample of students who attend the school. The data collected from the sample would be the students' grade point averages. In presidential elections, opinion poll samples of 1,000–2,000 people are taken. The opinion poll is supposed to represent the views of the people in the entire country. Manufacturers of canned carbonated drinks take samples to determine if a 16-ounce can contains 16 ounces of carbonated drink.
Bởi vì việc kiểm tra toàn bộ tổng thể đòi hỏi rất nhiều thời gian và tiền bạc, lấy mẫu là một kỹ thuật rất thiết thực. Nếu bạn muốn tính điểm trung bình chung tại trường học của mình, sẽ rất hợp lý nếu chọn một mẫu gồm các học sinh đang theo học tại trường. Dữ liệu thu thập được từ mẫu sẽ là điểm trung bình của các học sinh đó. Trong các cuộc bầu cử tổng thống, các mẫu thăm dò ý kiến gồm 1.000–2.000 người được thực hiện. Cuộc thăm dò ý kiến được cho là đại diện cho quan điểm của người dân trên toàn quốc. Các nhà sản xuất đồ uống có ga đóng lon lấy mẫu để xác định xem một lon 16-ounce có thực sự chứa 16 ounce đồ uống có ga hay không.
From the sample data, we can calculate a statistic. A statistic is a number that represents a property of the sample. For example, if we consider one math class as a sample of the population of all math classes, then the average number of points earned by students in that one math class at the end of the term is an example of a statistic. Since we do not have the data for all math classes, that statistic is our best estimate of the average for the entire population of math classes. If we happen to have data for all math classes, we can find the population parameter. A parameter is a numerical characteristic of the whole population that can be estimated by a statistic. Since we considered all math classes to be the population, then the average number of points earned per student over all the math classes is an example of a parameter.
Từ dữ liệu mẫu, chúng ta có thể tính toán một thống kê lượng. Một thống kê lượng là một con số đại diện cho một thuộc tính của mẫu. Ví dụ, nếu chúng ta coi một lớp toán là một mẫu của tổng thể gồm tất cả các lớp toán, thì số điểm trung bình mà các sinh viên đạt được trong lớp toán đó vào cuối kỳ là một ví dụ về một thống kê lượng. Vì chúng ta không có dữ liệu của tất cả các lớp toán, thống kê lượng đó là ước tính tốt nhất của chúng ta về giá trị trung bình cho toàn bộ tổng thể các lớp toán. Nếu chúng ta tình cờ có dữ liệu cho tất cả các lớp toán, chúng ta có thể tìm ra tham số của tổng thể. Một tham số là một đặc điểm bằng số của toàn bộ tổng thể có thể được ước tính bằng một thống kê lượng. Vì chúng ta đã coi tất cả các lớp toán là tổng thể, nên số điểm trung bình mà mỗi sinh viên đạt được trên tất cả các lớp toán là một ví dụ về một tham số.
One of the main concerns in the field of statistics is how accurately a statistic estimates a parameter. In order to have an accurate sample, it must contain the characteristics of the population in order to be a representative sample. We are interested in both the sample statistic and the population parameter in inferential statistics. In a later chapter, we will use the sample statistic to test the validity of the established population parameter.
Một trong những mối quan tâm chính trong lĩnh vực thống kê là độ chính xác của một thống kê lượng khi ước tính một tham số. Để có một mẫu chính xác, nó phải chứa các đặc điểm của tổng thể để trở thành một mẫu đại diện. Chúng ta quan tâm đến cả thống kê lượng của mẫu và tham số của tổng thể trong thống kê suy luận. Trong một chương sau, chúng ta sẽ sử dụng thống kê lượng của mẫu để kiểm tra tính hợp lệ của tham số tổng thể đã được thiết lập.
A variable, usually notated by capital letters such as X and Y, is a characteristic or measurement that can be determined for each member of a population. Variables may describe values like weight in pounds or favorite subject in school. Numerical variables take on values with equal units such as weight in pounds and time in hours. Categorical variables place the person or thing into a category. If we let X equal the number of points earned by one math student at the end of a term, then X is a numerical variable. If we let Y be a person's party affiliation, then some examples of Y include Republican, Democrat, and Independent. Y is a categorical variable. We could do some math with values of X—calculate the average number of points earned, for example—but it makes no sense to do math with values of Y—calculating an average party affiliation makes no sense.
Một biến số, thường được ký hiệu bằng các chữ cái in hoa như X và Y, là một đặc điểm hoặc một phép đo lường có thể được xác định cho mỗi thành viên của một tổng thể. Các biến số có thể mô tả các giá trị như trọng lượng tính bằng pound hoặc môn học yêu thích ở trường. Biến định lượng nhận các giá trị với các đơn vị ngang nhau, chẳng hạn như trọng lượng tính bằng pound và thời gian tính bằng giờ. Biến phân loại sắp xếp một người hoặc một vật vào một nhóm/loại nhất định. Nếu chúng ta gọi X là số điểm mà một sinh viên toán đạt được vào cuối kỳ, thì X là một biến định lượng. Nếu chúng ta gọi Y là sự liên kết đảng phái của một người, thì một số ví dụ về Y bao gồm đảng Cộng hòa, đảng Dân chủ và Độc lập. Y là một biến phân loại. Chúng ta có thể thực hiện một số phép toán với các giá trị của X—ví dụ, tính điểm trung bình đạt được—nhưng sẽ không có ý nghĩa gì khi làm toán với các giá trị của Y—việc tính toán sự liên kết đảng phái trung bình là hoàn toàn vô nghĩa.
Data are the actual values of the variable. They may be numbers or they may be words. Datum is a single value.
Dữ liệu là các giá trị thực tế của biến số. Chúng có thể là các con số hoặc có thể là các từ. Datum là một giá trị đơn lẻ.
Two words that come up often in statistics are mean and proportion. If you were to take three exams in your math classes and obtain scores of 86, 75, and 92, you would calculate your mean score by adding the three exam scores and dividing by three. Your mean score would be 84.3 to one decimal place. If, in your math class, there are 40 students and 22 are males and 18 females, then the proportion of men students is and the proportion of women students is . Mean and proportion are discussed in more detail in later chapters.
Hai từ thường xuất hiện trong thống kê là trung bình và tỷ lệ. Nếu bạn tham gia ba bài kiểm tra trong lớp toán của mình và đạt được các số điểm là 86, 75 và 92, bạn sẽ tính điểm trung bình của mình bằng cách cộng ba điểm kiểm tra lại và chia cho ba. Điểm trung bình của bạn sẽ là 84,3 với một chữ số thập phân. Nếu trong lớp toán của bạn có 40 sinh viên, trong đó có 22 nam và 18 nữ, thì tỷ lệ sinh viên nam là và tỷ lệ sinh viên nữ là . Trung bình và tỷ lệ sẽ được thảo luận chi tiết hơn trong các chương sau.
The words mean and average are often used interchangeably. In this book, we use the term arithmetic mean for mean.
Các từ trung bình (mean) và trung bình (average) trong tiếng Anh thường được sử dụng thay thế cho nhau. Trong cuốn sách này, chúng ta sử dụng thuật ngữ trung bình cộng (arithmetic mean) cho mean.
Problem
Bài toán
Determine what the population, sample, parameter, statistic, variable, and data referred to in the following study.
Xác định tổng thể, mẫu, tham số, thống kê lượng, biến số và dữ liệu được đề cập đến trong nghiên cứu sau đây.
We want to know the mean amount of extracurricular activities in which high school students participate. We randomly surveyed 100 high school students. Three of those students were in 2, 5, and 7 extracurricular activities, respectively.
Chúng ta muốn biết số lượng hoạt động ngoại khóa trung bình mà học sinh trung học tham gia. Chúng ta khảo sát ngẫu nhiên 100 học sinh trung học. Ba trong số các học sinh đó đã tham gia lần lượt 2, 5 và 7 hoạt động ngoại khóa.
Solution
Giải pháp
The population is all high school students.
Tổng thể là tất cả học sinh trung học.
The sample is the 100 high school students interviewed.
Mẫu là 100 học sinh trung học được phỏng vấn.
The parameter is the mean amount of extracurricular activities in which all high school students participate.
Tham số là số lượng hoạt động ngoại khóa trung bình mà toàn bộ học sinh trung học tham gia.
The statistic is the mean amount of extracurricular activities in which the sample of high school students participate.
Thống kê lượng là số lượng hoạt động ngoại khóa trung bình mà mẫu học sinh trung học tham gia.
The variable could be the amount of extracurricular activities by one high school student. Let X = the amount of extracurricular activities by one high school student.
Biến số có thể là số lượng hoạt động ngoại khóa của một học sinh trung học. Gọi X = số lượng hoạt động ngoại khóa của một học sinh trung học.
The data are the number of extracurricular activities in which the high school students participate. Examples of the data are 2, 5, 7.
Dữ liệu là số lượng hoạt động ngoại khóa mà các học sinh trung học tham gia. Ví dụ về dữ liệu là 2, 5, 7.
Find an article online or in a newspaper or magazine that refers to a statistical study or poll. Identify what each of the key terms—population, sample, parameter, statistic, variable, and data—refers to in the study mentioned in the article. Does the article use the key terms correctly?
Tìm một bài báo trực tuyến, trên báo chí hoặc tạp chí có đề cập đến một nghiên cứu thống kê hoặc cuộc thăm dò ý kiến. Xác định từng thuật ngữ chính—tổng thể, mẫu, tham số, thống kê lượng, biến số và dữ liệu—đề cập đến điều gì trong nghiên cứu được nhắc tới trong bài báo. Bài báo có sử dụng đúng các thuật ngữ chính không?
Problem
Bài toán
Determine what the key terms refer to in the following study.
Xác định các thuật ngữ chính đề cập đến điều gì trong nghiên cứu sau đây.
A study was conducted at a local high school to analyze the average cumulative GPAs of students who graduated last year. Fill in the letter of the phrase that best describes each of the items below.
Một nghiên cứu đã được thực hiện tại một trường trung học địa phương để phân tích điểm trung bình tích lũy (GPA) của các học sinh đã tốt nghiệp năm ngoái. Điền chữ cái của cụm từ mô tả đúng nhất cho từng mục dưới đây.
1. Population ____ 2. Statistic ____ 3. Parameter ____ 4. Sample ____ 5. Variable ____ 6. Data ____
1. Tổng thể ____ 2. Thống kê lượng ____ 3. Tham số ____ 4. Mẫu ____ 5. Biến số ____ 6. Dữ liệu ____
- a) all students who attended the high school last year
- a) tất cả học sinh đã theo học tại trường trung học vào năm ngoái
- b) the cumulative GPA of one student who graduated from the high school last year
- b) điểm trung bình tích lũy của một học sinh đã tốt nghiệp từ trường trung học đó vào năm ngoái
- c) 3.65, 2.80, 1.50, 3.90
- c) 3.65, 2.80, 1.50, 3.90
- d) a group of students who graduated from the high school last year, randomly selected
- d) một nhóm học sinh đã tốt nghiệp từ trường trung học đó vào năm ngoái, được chọn ngẫu nhiên
- e) the average cumulative GPA of students who graduated from the high school last year
- e) điểm trung bình tích lũy của những học sinh đã tốt nghiệp từ trường trung học đó vào năm ngoái
- f) all students who graduated from the high school last year
- f) tất cả học sinh đã tốt nghiệp từ trường trung học đó vào năm ngoái
- g) the average cumulative GPA of students in the study who graduated from the high school last year
- g) điểm trung bình tích lũy của những học sinh trong nghiên cứu đã tốt nghiệp từ trường trung học đó vào năm ngoái
Solution
Giải pháp
1. f;
2. g;
3. e;
4. d;
5. b;
6. c
1. f;
2. g;
3. e;
4. d;
5. b;
6. c
Problem
Bài toán
Determine what the population, sample, parameter, statistic, variable, and data referred to in the following study.
Xác định tổng thể, mẫu, tham số, thống kê lượng, biến số và dữ liệu được đề cập trong nghiên cứu sau đây.
As part of a study designed to test the safety of automobiles, the National Transportation Safety Board collected and reviewed data about the effects of an automobile crash on test dummies (The Data and Story Library, n.d.). Here is the criterion they used.
Là một phần của nghiên cứu được thiết kế để kiểm tra sự an toàn của ô tô, Ủy ban An toàn Giao thông Quốc gia đã thu thập và xem xét dữ liệu về tác động của một vụ tai nạn ô tô đối với các hình nhân thử nghiệm (The Data and Story Library, n.d.). Dưới đây là tiêu chí họ đã sử dụng.
| Speed at which Cars Crashed | Tốc độ ô tô đâm |
Location of Driver (i.e., dummies) | Vị trí của Người lái (tức là, hình nhân) |
| 35 miles/hour | 35 dặm/giờ |
Front seat | Ghế trước |
Table
1.1
Cars with dummies in the front seats were crashed into a wall at a speed of 35 miles per hour. We want to know the proportion of dummies in the driver’s seat that would have had head injuries, if they had been actual drivers. We start with a simple random sample of 75 cars.
Những chiếc ô tô có hình nhân ở hàng ghế trước đã đâm vào tường với tốc độ 35 dặm một giờ. Chúng ta muốn biết tỷ lệ hình nhân ở ghế lái có thể bị chấn thương ở đầu, nếu họ là những người lái xe thực sự. Chúng ta bắt đầu với một mẫu ngẫu nhiên đơn giản gồm 75 chiếc ô tô.
Solution
Giải pháp
The population is all cars containing dummies in the front seat.
Tổng thể là tất cả các ô tô có chứa hình nhân ở hàng ghế trước.
The sample is the 75 cars, selected by a simple random sample.
Mẫu là 75 chiếc ô tô, được chọn bằng phương pháp lấy mẫu ngẫu nhiên đơn giản.
The parameter is the proportion of driver dummies—if they had been real people—who would have suffered head injuries in the population.
Tham số là tỷ lệ hình nhân người lái—nếu họ là người thật—sẽ bị chấn thương ở đầu trong tổng thể.
The statistic is proportion of driver dummies—if they had been real people—who would have suffered head injuries in the sample.
Thống kê lượng là tỷ lệ hình nhân người lái—nếu họ là người thật—sẽ bị chấn thương ở đầu trong mẫu.
The variable X = whether driver dummies—if they had been real people—would have suffered head injuries.
Biến số X = liệu các hình nhân người lái—nếu họ là người thật—có bị chấn thương ở đầu hay không.
The data are either: yes, had head injury, or no, did not.
Dữ liệu là: có, bị chấn thương ở đầu, hoặc không, không bị.
Problem
Bài toán
Determine what the population, sample, parameter, statistic, variable, and data referred to in the following study.
Xác định tổng thể, mẫu, tham số, thống kê lượng, biến số và dữ liệu được đề cập trong nghiên cứu sau đây.
An insurance company would like to determine the proportion of all medical doctors
who have been involved in one or more malpractice lawsuits. The company selects
500 doctors at random from a professional directory and determines the number in
the sample who have been involved in a malpractice lawsuit.
Một công ty bảo hiểm muốn xác định tỷ lệ tất cả các bác sĩ y khoa
đã từng tham gia vào một hoặc nhiều vụ kiện về sơ suất chuyên môn. Công ty chọn ngẫu nhiên
500 bác sĩ từ một danh bạ nghề nghiệp và xác định số lượng bác sĩ trong mẫu
đã từng liên quan đến một vụ kiện về sơ suất chuyên môn.
Solution
Giải pháp
The population is all medical doctors listed in the professional directory.
Tổng thể là tất cả các bác sĩ y khoa được liệt kê trong danh bạ nghề nghiệp.
The parameter is the proportion of medical doctors who have been involved in one or more malpractice suits in the population.
Tham số là tỷ lệ bác sĩ y khoa đã tham gia vào một hoặc nhiều vụ kiện về sơ suất chuyên môn trong tổng thể.
The sample is the 500 doctors selected at random from the professional directory.
Mẫu là 500 bác sĩ được chọn ngẫu nhiên từ danh bạ nghề nghiệp.
The statistic is the proportion of medical doctors who have been involved in one or more malpractice suits in the sample.
Thống kê lượng là tỷ lệ bác sĩ y khoa đã tham gia vào một hoặc nhiều vụ kiện về sơ suất chuyên môn trong mẫu.
The variable X records whether a doctor has or has not been involved in a malpractice suit.
Biến số X ghi lại xem một bác sĩ đã từng hoặc chưa từng tham gia vào một vụ kiện về sơ suất chuyên môn hay không.
The data are either: yes, was involved in one or more malpractice lawsuits; or no, was not.
Dữ liệu là: có, đã tham gia vào một hoặc nhiều vụ kiện về sơ suất chuyên môn; hoặc không, chưa từng.
Collaborative Exercise
Bài tập Phối hợp
Do the following exercise collaboratively with up to four people per group. Find a population, a sample, the parameter, the statistic, a variable, and data for the following study: You want to determine the average—mean—number of glasses of milk college students drink per day. Suppose yesterday, in your English class, you asked five students how many glasses of milk they drank the day before. The answers were 1, 0, 1, 3, and 4 glasses of milk.
Thực hiện bài tập sau cùng với tối đa bốn người mỗi nhóm. Xác định tổng thể, mẫu, tham số, thống kê lượng, biến số và dữ liệu cho nghiên cứu sau: Bạn muốn xác định số ly sữa trung bình—mean—mà sinh viên đại học uống mỗi ngày. Giả sử hôm qua, trong lớp tiếng Anh của bạn, bạn đã hỏi năm sinh viên rằng họ đã uống bao nhiêu ly sữa vào ngày hôm trước. Các câu trả lời là 1, 0, 1, 3 và 4 ly sữa.