XỬ LÝ DỮ LIỆU MỘT CÁCH HỢP LÝ
Rất có khả năng sự thiên vị đã có sẵn ngay từ lúc ban đầu của quá trình thu thập dữ liệu.

From the beginning of the data-collection process, there is a possibility that bias exists.

Dữ liệu rất quan trọng trong quá trình tìm kiếm thông tin. Trước đó, chúng ta đã nói nhiều về cách dữ liệu có thể trở nên cần thiết trong quá trình tìm hiểu tin tức. Trong một số trường hợp, các dữ liệu quan trọng có thể giúp ta thấy được bức tranh toàn cảnh, nhưng nó cũng có thể bị sử dụng sai cách làm sai lệch nhận thức của chúng ta về sự thật.
Data is very important when we’re trying to look for the most accurate information that can help us make good decisions for ourselves and the people around us. Earlier we talked a lot about how data can become essential to understanding the news, current events, and new developments in research. But just as much as data is important to see the whole picture, it can also be used as a way to skew our perceptions of the truth.

Như chúng tôi đã đề cập trước đó, mỗi người đều có thành kiến cá nhân. Tuy là bình thường, nhưng điều này có thể có hại, vì sự thiên vị khiến chúng ta đưa ra những khái quát hoặc giả định rộng rãi về con người, cộng đồng và thông tin. Những người thu thập và/hoặc phân tích dữ liệu cũng có thể có thành kiến hoặc mục đích riêng khi thực hiện nghiên cứu.
 As we mentioned earlier, everyone has a personal bias. This is normal, but can be harmful, as bias causes us to make broad generalizations or assumptions about people, communities, and information. People who collect and/or analyze data may also have their own biases or purposes for conducting research or a study.
 

Dữ liệu cũng có thể được thu thập từ một nhóm người không được lựa chọn ngẫu nhiên đúng cách và không mang tính đại diện chính xác.
Data can also be collected from a group of people that is not properly randomized and not accurately representative.

Ví dụ: Khi thực hiện nghiên cứu, một nhóm tập hợp sinh viên UBC không thể đại diện cho tất cả những người 20 tuổi ở Canada. Khi nghĩ về nghiên cứu và dữ liệu, điều quan trọng là phải xem xét cách thức và lý do nghiên cứu được thực hiện.
For example:
A study with a sample group of UBC students cannot claim to be representative of all 20 year-olds in Canada. When thinking about research and data, it’s important to consider how and why the study was done.

Nghiên cứu này có đến từ một cơ sở có uy tín không?
Does this study come from a reputable institution?

Nó được tài trợ bởi một công ty sẽ được hưởng lợi từ một kết quả nào đó?
Was it funded by a corporation that would benefit from a certain result?


Thành phần xã hội nào tạo nên nhóm người được nghiên cứu hoặc khảo sát?
What demographic makes up the group of people who were studied or surveyed?

Hãy nhớ rằng: Ngay cả khi dữ liệu được xem xét và nghiên cứu kỹ lưỡng, việc trình bày các dữ liệu này cũng có thể gây hiểu lầm hoặc không chính xác! Khi các phóng viên và nhà báo kết hợp dữ liệu và số liệu thống kê, thành kiến của họ có thể ảnh hưởng đến những gì họ chọn để đưa tin.
Remember: Even if the data is peer-reviewed and well researched, the interpretation of this data can be misleading or inaccurate! When reporters and journalists incorporate data and stats, their biases may affect what they choose to report on.

Có phải phóng viên chỉ đang đề cập đến một nghiên cứu hay không?
Is the writer only referring to one study?

Hoặc họ đang muốn làm nổi bật một nội dung cực đoan?
Does the reporter only highlight extreme results?  

Đồ thị có thể gây hiểu lầm
Graphs can be misleading

Biểu đồ trình bày dữ liệu một cách trực quan để giúp chúng ta hiểu thông tin nhanh hơn. Tuy nhiên, chúng ta phải chú ý đến cách tổ chức đồ thị để tránh bị nhầm lẫn.
Graphs present data visually to help us understand information more quickly. However, we must pay attention to how graphs are organized in order to not be misled.
 

  • Thang đo bị bóp méo có thể ảnh hưởng đến cách bạn cảm nhận thông tin trong biểu đồ.
    A distorted scale can affect how you perceive the information in a graph.

    • Ví dụ: Đây là cùng một thông tin, được tổ chức khác nhau trên trục y. Kết quả có thể dễ dàng bị phóng đại bởi vì chúng tôi tự động giả định rằng kích thước của các thanh tương ứng với các giá trị. 
      Example: This is the same information, organized differently on the y-axis. Results can easily be exaggerated because we automatically assume that the size of the bars is proportionate to the values.

Cũng có thể có sự không đồng nhất trong trục x trên biểu đồ đường làm thay đổi cách thông tin xuất hiện. Chúng ta cũng nên biết thời điểm dữ liệu được trình bày.
There can also be inconsistencies in the x-axis on a line graph that change how the information appears. We should also be aware of when the data is dated.
 

  • Biểu đồ có thể hiển thị điều gì nếu các điểm dữ liệu trước và sau khi biểu đồ bắt đầu / kết thúc được hiển thị?
    What might the graph show if data points before and after the graph begins/ends were shown?

Để biết thêm về chủ đề này, hãy xem video sau. (Bật phụ đề tiếng Việt)
To learn more, view this video. (Turn on Vietnamese subtitles)

d2.png
Số liệu thống kê có thể gây hiểu nhầm
Statistics can be misleading

Mẫu số liệu là một tập hợp con của một nhóm tổng thể lớn hơn mà các nhà nghiên cứu đang cố gắng mô tả. Dữ liệu được thu thập từ mẫu này, từ đó số liệu thống kê được diễn giải. Những con số được diễn giải từ thống kê có thể được cho rằng là chúng nói lên toàn bộ câu chuyện, nhưng có thể có những biến ẩn chưa được xem xét đến. Cùng một tập hợp thông tin và dữ liệu có thể được nhóm lại và chia thành nhiều loại khác nhau, dẫn đến các kết luận khác nhau dựa trên cùng một tập dữ liệu. Điều này có thể được sử dụng để gây hiểu lầm.

A sample is a small subset of a larger group that researchers are attempting to describe. Data is collected from this sample, from which statistics are interpreted. The numbers interpreted from statistics might seem to tell the whole story, but there may be hidden variables that have not been taken into account. The same set of information and data can be grouped and divided into various categories, resulting in different conclusions with the same set of data. This can be used to mislead.

 Ví dụ: Khi nghiên cứu một mẫu công nhân trong một công ty, nhà nghiên cứu nhận thấy mối tương quan giữa chiều cao và mức lương. Họ kết luận rằng những người cao hơn kiếm được nhiều tiền hơn. Những biến nào bị thiếu?
For example: When studying a sample of workers in a company, the researcher sees a correlation between height and salary. They conclude that taller people earn more money. What variables are missing?

Nếu nhà nghiên cứu thu thập dữ liệu về giới tính, họ có thể thấy rằng, theo trung bình, nam giới cao hơn phụ nữ tại công ty này. Còn về tuổi đời và kinh nghiệm?
If the researcher collected data on gender, they might have seen that men are on average taller than women at this company. What about age and experience?

Cần có nghiên cứu sâu hơn để thu thập dữ liệu về nhiều biến số hơn trước khi đưa ra kết luận.
Further research collecting data on more variables is required before a conclusion can be made.
 


Để biết thêm về chủ đề này, hãy xem video sau. (Bật phụ đề tiếng Việt)
To learn more, view this video. (Turn on Vietnamese subtitles)

d2.png
Sự khác biệt giữa thông tin chính xác và thông tin đáng tin cậy là gì?
What is the difference between accurate information and credible information?

Thông tin chính xác là thông tin dựa trên sự thật và có thể được hỗ trợ bởi các nghiên cứu sâu rộng. Thông tin này là thông tinh mang tính khách quan. Khi xem tin tức, bạn luôn muốn tìm kiếm càng nhiều thông tin chính xác càng tốt, và thông tin chính xác nhất. Hãy coi thông tin chính xác là các mảnh ghép của một hình ảnh. Việc xác định thông tin chính xác giúp chúng ta thấy được bức tranh toàn cảnh hơn về một vấn đề.
Accurate information is information based on facts, and can be supported by extensive research. This information is unbiased. When browsing the news, you always want to look for as much accurate information as possible, and for the most accurate information. Think of accurate information as the puzzle pieces to an image. Identifying accurate information helps us see the bigger picture of an issue.

Thông tin đáng tin cậy là việc trình bày thông tin chính xác mà chúng ta có thể tin tưởng. Bởi vì chúng ta cập nhật tin tức về các sự kiện hằng ngày thông qua những bài báo đưa tin, có thể khó và mất thời gian để kiểm tra xem tất cả thông tin có chính xác hay không. Nhiều cơ quan thông tấn, phóng viên và nhà báo thường đưa tin tức dựa trên các số liệu thống kê, dữ liệu và thử nghiệm.
Credible information is the interpretation of accurate information that we can trust. Because people rely on news reporting on current events everyday, it can be difficult and time consuming to test if all information is accurate. Many news agencies, reporters, and journalists will often report news that is an interpretation of statistics, data, and testing.
 

Trong khi thông tin chính xác có thể được coi là bằng chứng, thông tin đáng tin cậy có thể được coi là cách diễn giải, trình bày những bằng chứng ấy một cách có lý, có ý nghĩa. Nếu thông tin chính xác bị trình bày một cách sai lệch, bạn vẫn sẽ có thông tin không chính xác hoặc sai.
While accurate information can be thought of as the evidence, credible information can be thought of as the interpretation that tries to make sense of the evidence. If accurate information is misinterpreted, you will still have inaccurate or false information.