Excel에서 '1-1'을 입력하면 자동으로 '1월 1일'로 변환해주는 기능은 때로는 유용하지만, 단순히 '1-1'을 입력하고 싶을 경우 괜한 참견이라고 느낄 수도 있습니다. 실제로 이 기능이 '인간의 유전자의 약어를 마음대로 날짜로 변환해 버린다'는 문제로 유전자 학자를 괴롭히고 있으며, 결국 과학자 측이 유전자 이름을 변경할 예정이라고 보도되고 있습니다.

Scientists rename human genes to stop Microsoft Excel from misreading them as dates - The Verge
https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates

Scientists rename human genes to stop Microsoft Excel from misreading them as dates

Microsoft Excel: 1 — Human Genetics: 0.

www.theverge.com


Excel이 문자열을 마음대로 변경하여 사용자의 의도하지 않은 표현으로 바꾸어 버리는 문제는 진작부터 유전자 학자를 괴롭히고 있었으며, 예를 들어 인간의 세포 내에 존재하는 단백질의 일종인 'Septin 2'의 명칭(유전자 기호)인 'SEPT2'를 '2-Sep(9월 2일)'로, 'Membrane-Associated Ring Finger(C3HC4) 1, E3 Ubiquitin Protein Ligase'라는 유전자의 기호인 'MARCH1'는 '1-Mar(3월 1일)'가 되어 버립니다.

2016년에 발표된 연구에서는, 유전자를 다룬 논문 3597건 중 Excel이 원인으로 보이는 실수가 발견된 논문은 704건으로 약 20%의 논문이 Excel의 자동변환 기능의 영향이 나타나고 있는 사실을 알고 있었습니다.

실제로 Excel에서 'MAR1'라고 입력하면 ....


'1-Mar'가 되어 버렸습니다.


Excel에서 이러한 자동변환이 발생하면 표시뿐만이 아니라 데이터 자체가 바뀌어 버리기 때문에 나중에 수정하는 것은 어렵습니다. 유전자 학자는 셀 서식설정에서 '문자열' 변경하는 등 대응해 왔지만, 다른 사람이 같은 Excel 파일을 열면 마음대로 자동변환되어 버리는 등의 문제가 남아 해결에 고심하고 있다고 합니다.

그래서 인간 유전자 분석기구의 인간게놈 명명법위원회(HGNC)는 2020년 8월 3일에 새로운 지침을 발표하고 '데이터 처리 및 검색에 영향을 미치는 기호'를 바꾸는 것을 선언. 따라서 향후 'SEPT2'는 'SEPTIN2'로, 'MARCH1'는 'MARCHF1'로 기호가 변경되고, 앞으로 새로 발견된 유전자의 명칭은 Excel의 자동변환을 고려하여 결정한다고 합니다.

HGNC의 조정자인 블루 포드 씨에 따르면, 가이드라인이 발표되기 전부터 유전자 이름 변경은 이루어지고 있었으며, 지난 1년 동안에 27종류의 유전자가 이름을 바뀌었다고 합니다.

블루 포드 씨는 IT계 뉴스사이트 The Verge와의 인터뷰에서 "유전자 이름을 가볍게 변경하지는 않지만 변경되는 것 자체가 드문 일이 아닙니다"라고 설명하고 있습니다.

Posted by 말총머리
,