[본문TEXT 3과] 영어2 능률(김성곤) Tricks behind Statistics
- 블로그 지난 자료실
- 2019. 8. 6. 09:26
[본문TEXT 3과] 영어2 능률(김성곤) Tricks behind Statistics
Tricks behind Statistics
p.74
In today’s world, there is a lot of statistical information around us all the time. Every time we
read an article on the Internet or see a commercial on TV, we are likely to come into contact with numbers and figures. Generally, these numbers help us make better decisions in our daily lives. For example, when we choose which movie to see, we can check the ratings and see the reviews of thousands of viewers. Similarly, when people see statistics that show fastening a seat belt greatly increases the chances of surviving a car accident, they may choose to wear one themselves. These are just a few examples of how statistical information plays an important role in our lives. However, is it safe to believe statistics exactly the way they are presented to us? Unfortunately, statistics can be misused in many ways. Let’s learn about some common tricks behind statistics.
통계 자료 뒤의 속임수
오늘날의 세상에는, 우리 주위에 항상 많은 통계적 정보가 있다. 우리가 인터넷으로 기사를 읽거나 TV에서 광고를 볼 때마다, 우리는 숫자들과 수치들을 접하기 쉽다. 일반적으로, 이러한 숫자들은 우리가 일상생활에서 더 나은 결정을 내리도록 도와준다. 예를 들어, 우리가 어떤 영화를 볼지 고를 때, 우리는 (영화의) 평점을 확인하고 수천 명의 관객들의 후기를 살펴볼 수 있다. 마찬가지로, 안전벨트를 착용하는 것이 자동차 사고에서의 생존 가능성을 크게 높여 준다는 것을 보여 주는 통계 자료를 보면, 사람들은 아마 스스로 안전벨트를 착용할 것이다. 이것들은 통계적 정보가 우리의 삶에서 중요한 역할을 하는 몇 가지 예시에 불과하다. 하지만, 통계 자료가 우리에게 제시되는 방식 그대로 그것을 믿는 것이 안전할까? 안타깝게도, 통계 자료는 많은 방식으로 악용될 수 있다. 통계 자료 뒤의 몇몇 일반적인 속임수에 대해서 알아보자.
p.75
Samples: How Many and Who?
On the Internet, Minjeong sees an advertisement that reads, “100% of users report brighter and softer skin with Blossom Company’s liquid facial soap.” It claims that these results are from an independent laboratory and are guaranteed by a public agency. Minjeong does not question the statistics and buys some bottles, despite the high price. However, although Minjeong uses the soap for a few months, she does not experience any noticeable changes.
Did Minjeong just happen to buy a defective product? Or was the advertisement completely fake? When Minjeong read “100% of users,” she should have asked herself, “Where did the company get this figure?” If Minjeong had read the tiny letters at the bottom of the ad, she would have found that the sample included only five people. As in this case, when a sample is not large enough to show a wide range of results, it can be misleading. By using small samples, companies can come up with any results they want and use them for their own purposes.
표본: 얼마나 많이 그리고 누가?
인터넷에서, 민정이는 ‘사용자들의 100%가 Blossom사의 액상 세안 비누로 더 환하고 부드러운 피부를 갖게 되었다고 말합니다’라고 쓰인 광고를 보게 된다. 그것은 이러한 결과가 독자적인 연구소로부터 나왔으며 공공 기관에 의해 보장받는다고 주장한다. 민정이는 이 통계에 대해 의문을 갖지 않고 비싼 가격에도 불구하고 몇 개를 구입한다. 그러나 민정이가 그 비누를 몇 달 동안 사용하지만 그녀는 어떤 눈에 띄는 변화도 경험하지 못한다.
민정이가 그저 우연히 결함이 있는 제품을 샀던 것일까? 아니면 그 광고가 완전히 거짓이었을까? 민정이가 ‘사용자들의 100%’를 읽었을 때, 그녀는 스스로에게 “회사가 이 수치를 어디에서 얻었을까?”라고 물었어야만 했다. 만약 민정이가 광고 하단의 작은 글자를 읽었더라면, 그녀는 그 표본이 단지 다섯 명만을 포함했음을 알았을 것이다. 이 경우에서처럼, 표본이 다양한 결과를 보여 줄 만큼 충분히 크지 않다면, 그것은 오해를 불러일으킬 수 있다. 적은 표본만을 사용함으로써, 회사들은
그들이 원하는 어떤 결과든지 내놓을 수 있고 그들의 목적을 위해 그 결과를 이용할 수 있다.
p.76
People can also get the wrong idea from statistics when a sample is not random. For example, a restaurant may put survey cards on the tables, hoping to know what most customers think about its food, service, or atmosphere. However, few cards will be filled out by normal customers, because they don’t have any reason to do so. Only those with strongly positive or negative reactions are likely to respond to the survey. This method of choosing a sample is called “voluntary response sampling.” Such samples are biased in favor of strong opinions and underrepresent the moderate ones.
Therefore, when you see a statistic, remember that the sample is just as important as the statistic itself. How many people were in the sample? Who were they? If you don’t know, be careful not to leap to conclusions.
사람들은 또한 표본이 무작위가 아닐 때 통계로부터 잘못된 이해를 할 수 있다. 예를 들어, 한 식당이 자신들의 음식, 서비스, 분위기에 대해 대부분의 고객들이 어떻게 생각하는지를 알고자 식탁 위에 설문조사 카드를 올려놓을 수 있다. 그러나 일반적인 고객들로부터 작성되는 카드는 거의 없을 것인데, 왜냐하면 그들은 그렇게 할 이유가 전혀 없기 때문이다. 오직 강하게 긍정적이거나 부정적인 의견을 가진 고객들만이 그 조사에 응할 가능성이 크다. 표본을 고르는 이러한 방식은 ‘자발적 응답 표본 추출’이라 불린다. 이러한 표본들은 강한 의견에 유리하게 편향되고 중간의 의견들을 실제보다 적게 표시한다.
따라서, 당신이 통계 자료를 볼 때, 표본이 그 통계 자료만큼이나 중요하다는 것을 기억하라. 얼마나 많은 사람들이 표본에 있었는가? 그들은 누구였는가? 만약 당신이 모른다면, 성급히 결론을 내리지 않도록 주의하라.
p.77
The Trap of Averages
ABC Corporation wants to hire some employees. In order to look like a well-paying company and to recruit competent candidates, the company decides to distribute a press release that says the average yearly salary of its employees is $57,000, which is quite high. However, the fact is that more than half of its employees earn no more than $30,000 or less a year, and the
most common salary for employees is only $20,000.
Did the company spread false information? How is this possible? It’s because the company used the trap of averages. Averages can show different pictures depending on which type is chosen. To understand the meaning of different
types of averages, let’s look at the illustration on the next page.
평균의 함정
ABC 기업은 몇몇 직원들을 고용하기를 원한다. 보수가 좋은 회사로 보이고 유능한 지원자들을 모집하기 위해, 그 회사는 자사 직원들의 평균 연봉이 $57,000임을 나타내는 보도 자료를 배포하기로 결정하는데, 이는 꽤 높은 금액이다. 그러나 실제로는 회사 직원들의 절반 이상이 일 년에 겨우 $30,000나 그 미만을 받으며, 직원들에게 가장 흔한 연봉은 고작 $20,000에 불과하다.
회사가 거짓 정보를 퍼뜨린 것인가? 어떻게 이것이 가능한가? 그것은 회사가 평균의 함정을 사용했기 때문이다. 어떤 유형이 선택되는지에 따라 평균은 다른 상황을 보여 줄 수 있다. 평균의 서로 다른 유형들의 의미를 이해하기 위해, 다음 페이지에 있는 삽화를 살펴보자.
p.78
Most often, the term “average” indicates the “mean.” It is calculated by adding all the values in a group and dividing the result by the number of group members. However, the mean is not
the only kind of average. There are two more kinds: the “median” and the “mode.” The median is the number that is exactly in the middle of all the other figures. In this case it is $30,000, because 12 employees are making more than $30,000 and 12 are making less. The mode is the number that appears most frequently—$20,000 in this case. As you can see in the illustration, there’s only a handful of people that are earning an average salary of $57,000 or higher. However, because the company wanted to be perceived as a well-paying one, it used the mean, which results in a deceptively high average salary.
An average is convincing because it is so simple. To avoid being tricked, however, you have to know what sort of average is being reported. You also need to find out the distribution of the values in order to get a more accurate idea of the real data.
일반적으로 ‘평균’이라는 용어는 ‘산술 평균’을 가리킨다. 그것은 한 집단에 속한 모든 값을 더하고 그 결과를 그 집단 구성원의 수로 나눔으로써 계산된다. 그러나 산술 평균이 평균의 유일한 종류는 아니다. 두 종류가 더 있다. ‘중앙값’과 ‘최빈값’이다. 중앙값은 모든 다른 수치들의 정확히 중간에 있는 숫자이다. 이 경우에 그것은 $30,000인데, 왜냐하면 12명의 직원들이 $30,000보다 많이 벌고 12명의 직원들이 그보다 적게 벌기 때문이다. 최빈값은 가장 빈번하게 나타나는 숫자이며, 이 경우
에는 $20,000이다. 당신이 삽화에서 볼 수 있는 것처럼, 평균 연봉인 $57,000나 그 이상을 버는 사람들은 오직 소수에 불과하다. 그러나 그 회사는 보수가 좋은 곳으로 인식되고 싶었기 때문에 산술 평균을 사용했고, 이는 결국 기만적으로 높은 평균 연봉이 된다.
평균은 매우 간단하기 때문에 설득력이 있다. 그러나 속임수에 당하지 않기 위해서 당신은 어떤 종류의 평균이 이야기되고 있는지를 알아야 한다. 당신은 또한 실제 자료에 대한 더 정확한 이해를 얻기 위해서 값의 분포를 알아낼 필요가 있다.
p.79
Same Data, Different Graphs
In mass media, graphs are often used because they display data more efficiently than tables of raw data do. However, graphs can be misleading, too. Let’s look at the two graphs below.
The two graphs shown here illustrate how data can be misrepresented. In the first graph, the vertical axis goes all the way up to 100 and all the way down to 0, which makes the decrease in the percentage look modest. In the other graph, only 10 percentage points are shown, from 65 to 75, which makes the change seem much more extreme. Notable is the fact that the two
graphs are based on exactly the same data. So, if you want to point out the seriousness of skipping breakfast, you can use the second graph. In fact, you can make nearly any graph more convincing in favor of your argument by cutting off the graph at a certain point.
Hence, whenever you see a graph, you should check the units on the vertical and horizontal axes to see what the highest and lowest values are. Don’t simply assume the visual impact is the same as the real story. Check whether the graph is presented in a specific way to emphasize a point.
같은 자료, 다른 도표
대중 매체에서, 도표들은 원 자료의 표보다 자료를 더 효율적으로 보여 주기 때문에 자주 사용된다. 그러나 도표 역시 오해를 불러일으킬 수 있다. 아래의 두 도표를 살펴보자.
여기 제시된 두 도표는 자료가 어떻게 잘못 표현될 수 있는지를 보여준다. 첫 번째 도표에서, 세로축은 위로는 100까지, 아래로는 0까지 이어지는데, 이는 백분율의 감소를 완만하게 보이도록 만든다. 다른 도표에서는 65부터 75까지 단지 10퍼센트 포인트만 제시되는데, 이는 그 변화를 훨씬 더 급격하게 보이도록 만든다. 두 도표가 정확히 같은 자료를 기초로 하고 있다는 사실이 주목할 만하다. 따라서, 만약 당신이 아침 식사를 거르는 것의 심각성을 지적하고 싶다면, 당신은 두 번째 도표를 사용할 수 있다. 사실, 당신은 특정한 지점에서 도표를 잘라내서 거의 어떤 도표든지 당신의 주장에 유리하도록 더 설득력 있게 만들 수 있다.
그러므로 당신은 도표를 볼 때마다 가장 높은 값과 가장 낮은 값이 무엇인지 알아보기 위해 세로축과 가로축의 단위를 확인해야 한다. 시각적인 효과가 실제 내용과 같다고 단순히 추측하지 마라. 도표가 어떤 주장을 강조하기 위해 특정한 방식으로 제시되고 있는지 확인하라.
p.80
Look with a Critical Eye
When people state opinions in articles, speeches, debates, or advertisements, they often give some statistics to support or reinforce their point. If these statistics are found through proper research methods, then they are objective facts. However, many statistics that you see and hear could just be numbers that are meant to convince you of a certain view. Therefore, the next time you come across some statistics, don’t blindly accept any data that is presented. Look at the statistics in detail with a critical eye, and then judge whether or not they are convincing.
비판적인 시각으로 보라
사람들이 기사, 연설, 토론 또는 광고에서 의견을 말할 때, 그들은 종종 자신의 의견을 뒷받침하거나 강화하기 위해 몇몇 통계 자료를 제시한다. 만약 이러한 통계 자료들이 적절한 연구 방법을 통해 얻어지면, 이는 객관적인 사실이 된다. 하지만, 당신이 보고 듣는 많은 통계 자료들은 당신에게 특정한 견해를 납득시키기 위한 의도를 가진 숫자에 불과할 수도 있다. 따라서, 다음번에 어떤 통계 자료를 보게 되면, 제시되는 어떤 자료라도 맹목적으로 받아들이지 마라. 비판적인 시각으로 통계 자료를 자세히 살펴보고, 그런 다음 그것이 설득력이 있는지 아닌지를 판단하라.