2020년 10월 4일 잉글랜드 보건청(PHE)이 "신종 코로나바이러스 감염(COVID-19)의 양성 진단 데이터 1만 5841건을 일시적으로 소실했다"고 발표했습니다. 이 수수께끼 같은 데이터 소실에 대해 그 원인은 Excel에 있다고 영국의 주요 언론사들이 지적하고 있습니다.

PHE statement on delayed reporting of COVID-19 cases - GOV.UK
https://www.gov.uk/government/news/phe-statement-on-delayed-reporting-of-covid-19-cases


How Excel may have caused loss of 16,000 Covid tests in England | Health policy | The Guardian
https://www.theguardian.com/politics/2020/oct/05/how-excel-may-have-caused-loss-of-16000-covid-tests-in-england

Covid: how Excel may have caused loss of 16,000 test results in England

Public Health England data error blamed on limitations of Microsoft spreadsheet

www.theguardian.com


How does the PHE statistics error change the UK Covid picture? | Society | The Guardian
https://www.theguardian.com/society/2020/oct/05/how-does-the-phe-statistics-error-change-the-uk-covid-picture

How does the PHE statistics error change the UK Covid picture?

15,841 coronavirus cases were not included in official figures, in latest testing data controversy

www.theguardian.com


Botched Excel import may have caused loss of 15,841 UK COVID-19 cases | Ars Technica
https://arstechnica.com/tech-policy/2020/10/excel-glitch-may-have-caused-uk-to-underreport-covid-19-cases-by-15841/

Botched Excel import may have caused loss of 15,841 UK COVID-19 cases

Agency reportedly lost data after exceeding maximum rows for a spreadsheet.

arstechnica.com


PHE는 2020년 10월 4일에 "약 1만 6000인 분량의 COVID-19 양성 진단 데이터가 일시적으로 사라졌다"고 밝혔습니다. 소실된 데이터의 4분의 3은 2020년 9월 25일부터 10월 2일까지 취득된 데이터로, 소실된 데이터(이미지 빨간색 부분)와 성공적으로 저장된 데이터(회색 부분)의 양을 그래프로 시각화하면 아래와 같습니다.


이 데이터 소실의 원인에 대해 PHE는 "보고용 대시보드에 데이터를 자동 전송하는 과정에서 문제가 있었다"고만 설명합니다. 그러나 영국의 언론사들에 따르면, 이 자동 전송 프로세스의 문제는, 실제로는 Excel의 문제라는 것.

각지의 의료기관에서 수집된 검사 데이터는 CSV형식으로 저장되어 PHE로 전송됩니다. PHE 측은 받은 CSV파일을 Excel에서 관리하고 있었는데, 사용중인 Excel 버전이 오래된 것이어서 저장형식으로 'XLS'를 채택하고 있다고 합니다.

XLS는 Excel 2003 이전의 Excel에서 표준이었던 파일 저장형식으로, 6만 5536행 이상의 데이터를 저장할 수 없다는 한계가 존재했습니다. PHE가 각지의 의료기관에서 수집된 CSV파일의 데이터를 통합한 결과, 스프레드시트가 6만 5536행을 넘어버려 데이터 소실로 이어졌다고 볼 수 있습니다.


영국은 2020년 10월 3일에 COVID-19의 신규 감염자가 1만 명을 처음 넘어서 '감염 제2파'가 확산되고 있는 것으로 알려져 있습니다. 이번 데이터 소실로 인해 영국 내에서 운용되고 있는 코로나19 접촉 확인 앱에 일시적 소실 기간의 데이터가 제대로 전달되지 않았다는 문제가 발생했습니다. 이에 언론사들은 PHE를 비난하고 있습니다.

일시적으로 소실된 데이터는 2020년 10월 3일 오전 1시에 전부 복구되었다고 하며, 앞으로 이런 오류가 발생하지 않도록 예방조치를 하겠다고 PHE는 코멘트했습니다.

Posted by 말총머리
,