배경
역사적으로 과학 연구는 남녀/암수간 차이를 고려하지 않고 남성 모델에 편중되었다. 21세기의 도래 이후 이러한 비뚤림(bias)은 비과학적이고 동시에 비윤리적이라는 인식이 점차 높아지고 있지만[1,2], 연구에서 남성을 표준으로 간주하는 경향은 여전히 젠더 불형평성의 주된 요인으로 남아 있다[3].
성별과 젠더의 차이를 고려하는 것은 과학 연구에 필수적이다[3,4]. 그러나 임상 및 사회과학에서 여성 및 다양한 젠더의 참여자가 과소 표집되거나 심지어 배제되는 현상은 여전히 문제가 되고 있다[5,6]. 이처럼 건강을 결정하는 요인으로서 성별 및 젠더가 중요하다는 인식이 높아지고 있음에도 불구하고, 젠더 격차는 여성 및 다양한 젠더의 사람들에게 여전히 존재하며 불균형적인 위험(예를 들면, 오진 또는 부적절한 치료 등)을 초래한다[6]. 뿐만 아니라, 성별과 젠더의 차이는 공학, 기술, 그리고 사회경제학적 연구 결과에도 영향을 미친다[7,8].
현재 많은 연구비 발주 기관들은 연구 대상자 간 성별 및 젠더의 균형을 맞추거나 그렇지 않을 경우 발생한 불균형에 관해 정당한 근거를 제시할 것을 요구하고 있다. 미국 국립보건원(NIH)의 ‘생물학적 변수로서의 성별에 관한 미국 국립보건원 정책’(‘NIH Policy on Sex as a Biological Variable’) 및 ‘여성건강연구를 위한 범 기관 차원의 미국 국립보건원 전략 방안’(‘Trans-NIH Strategic Plan for Women’s Health Research’)이 그 예시이다[9]. 규제 기관들도 임상시험에서 소외된 소수집단이 포함될 수 있도록 임상시험 의뢰자 대상 지침[10]을 발표하였다. 또한 연구 참여자가 성별과 젠더, 인종, 민족, 연령 및 성적 성향과 관련하여 실제 환자 모집단을 보다 정확하게 대표해야 한다는 필요성이 점점 더 강조되고 있다[11]. 이러한 정책은 긍정적인 효과를 거두고 있다. 임상시험 참여자의 지리적, 인종적/민족적, 그리고 젠더 다양성을 다룬 미국 식품의약국(FDA) 연례 보고서에 따르면, 여성의 임상시험 참여율은 2015년 43%에서 2019년에 51%로 증가했다[12].
많은 논문에서 연구 참여자의 성별이나 젠더를 명시하지 않는다는 사실을 인지하고 2015년에 유럽과학학술지편집인협의회(European Association of Science Editors, EASE) 전문가들이 협력하여 “연구 설계, 데이터 분석, 결과 및 해석에서 성별 및 젠더를 보고하는 포괄적인 절차”인 SAGER(Sex and Gender Equity in Research) 지침을 개발했다[5]. SAGER 지침에 대한 지지는 신속히 나타났지만 지침의 준수와 편집 정책으로의 채택은 더뎠다. 이는 아마도 의무화에 대한 우려, 편집인의 시간 부족, 그리고 기술적 장벽(전자 투고 시스템에 저자들이 따라야 할 새로운 요구 사항을 통합하는 문제 등)과 같은 이유와 일부 관련 있을 것이다[13]. 현재 대규모의 변화가 일어나고 있으며, Elsevier와 Springer Nature와 같은 대형 출판사들은 수백 개의 학술지에서 편집 및 심사 지침에 SAGER 지침을 반영하는 작업을 진행하고 있다[14,15].
SAGER(Sex and Gender Equity in Research) 지침의 이행
The Lancet 학술지들은 국제의학학술지편집인협의회(International Committee of Medical Journal Editors)가 발행한 일반적인 지침을 준수하고 있지만[16], 저자를 위한 안내에 성별 및 젠더에 관한 보고를 현재 명시하지 않고 있다. 그럼에도 SAGER 지침의 요건을 가장 효과적으로 적용하기 위해 내규를 점차적으로 발전시켜왔다. 예를 들어, 인구사회적 자료표에서 특정 젠더만이 아닌 모든 젠더의 숫자 보고를 요구하고 있으며 성별 및 젠더 데이터 수집 방법과 참여자들의 자발적인 선택을 위해 제공되는 선택안에 관한 정보 제시를 장려한다.
2021년, The Lancet Rheumatology, The Lancet Haematology, The Lancet Psychiatry 편집위원회는 시범 프로그램을 도입했다. 이는 생물학적 성별, 젠더, 그리고 인종에 따른 인구사회적 자료 보고에 더욱 주의를 기울이고 성별 및 젠더를 세분화한 데이터가 연구결과, 이상 반응 및 환자 보고 지표에 추가되도록 저자들에게 요청하기 위함이었다[17,18]. 이 일환으로 The Lancet Rheumatology와 The Lancet Haematology 편집인은 모든 주요 논문의 SAGER 지침의 준수 여부를 모니터링했으며 저자들이 성별 및 젠더별로 세분화한 결과 및 이상 반응(일반적으로 부록에 포함되는) 데이터를 보고하도록 권장하였다. 그러나 항상 적절하거나 유용한 것은 아님을 인정하기에(예를 들어 대상자 수가 매우 작은 경우) 이러한 데이터를 추가할지 여부는 저자의 재량에 맡겼다. 이 시범 프로그램의 주요 목표는 SAGER 지침을 기존 편집인 업무 과정에 통합하는 것이 실현 가능한지와 저자들이 이러한 추가적인 요청을 얼마나 따라주는지를 가늠하려는 것이었다.
The Lancet Rheumatology 편집인들은 다음 다섯 가지 항목에 중점을 두었다: (1) 초록에 성별과 젠더에 관한 데이터의 수록, (2) 인구사회적 자료를 제시하는 표에 성별 또는 젠더에 관한 모든 보고된 데이터의 수록, (3) 성별과 젠더에 따라 세분화된 이상 반응 데이터의 수록, (4) 성별 및 젠더에 따라 세분화된 환자 보고 지표 데이터의 수록, 그리고 (5) 성별과 젠더에 따른 자료분석 수록이다. 저자의 호응 정도에 대한 지표로, 이 시범 프로그램 시행을 발표하기 전(2021년 1월~5월)과 후(2021년 6월~8월)에 출판된 논문 중 위의 다섯 가지 항목을 충족하는 논문의 비율을 계산했다[17]. 이 단계에서 실행 가능성에 대한 공식적 측정방법(예를 들면 편집인이 원고를 검토하고 저자에게 데이터를 요청하거나 출판사가 수정된 자료를 구현하는 데 소요되는 추가적인 시간 등)은 포함하지 않았다.
전반적으로 저자들은 추가적인 요청에 호의적이었으며 성별 및 젠더에 따라 세분화한 자료를 논문에 어떻게 포함할지 편집위원회와 생산적인 논의를 하는 것에도 적극적이었다. 2021년 1월부터 5월 사이에 출판된 20편의 논문이 성별과 젠더와 관한 데이터를 전혀 초록에 포함하지 않은 반면, 2021년 6월부터 2022년 8월 사이에 출판된 56편의 논문 중 46편(82%)은 초록에 이를 명시했다(그림 1). 이상 반응을 보고한 논문의 경우, 성별 및 젠더에 따른 세분화된 자료가 2021년 1월부터 5월 사이에 발행된 논문의 0%(13편 중 0편)이었던 반면 2021년 6월부터 2022년 8월 사이에 발행된 논문의 28%(18편 중 5편)로 증가했다. 마찬가지로, 성별 및 젠더 분석을 포함한 논문도 5%(20편 중 1편)에서 41%(59편 중 24편)로 증가했다. 단, 시범 프로그램 개시 전이나 후에도 환자 보고 지표에 성별 및 젠더를 세분화한 자료를 포함한 연구는 없었으며, 이는 해당되는 논문이 현저히 적은(개시 전 3편, 개시 후 6편) 것과 관련이 있을 수 있다. 반면 인구 사회적 특성 표에 성별 및 젠더 관련 자료를 포함한 논문의 비율은 시범 프로그램 개시 전에도 이미 높았으며, 개시 후에 그 비율은 더욱 증가했다(그림 1).
궁극적으로 의미 있는 데이터의 생성을 위해서는 성별과 젠더에 대한 고려가 새로운 임상시험 및 연구 설계(그리고 해당 연구의 통계 분석)에 반드시 통합돼야 한다. 따라서 진행 중이거나 완료된 연구에 대한 보고를 개선하려는 노력은 고무적이며 이는 저자, 규제 기관, 그리고 정책 입안자들의 인식 고양에도 도움이 되기를 기대한다.
SAGER(Sex and Gender Equity in Research) 체크리스트 개발 및 사용
시범 프로그램을 진행하면서 우리는 SAGER 지침의 활용과 준수 여부를 모니터링하는 데 체크리스트가 유용하다는 것을 깨닫게 되었다. 따라서 SAGER 논문의 표[5]를 CONSORT 체크리스트[19]의 구조에 맞도록 변환하였다. 인간 대상 연구(표 1)와 응용과학 및 세포생물학 분야와 같이 인간 참여자를 포함하지 않는 연구(표 2) 각각에 적용할 수 있는 체크리스트 두 종류를 만들었다.
또한 원 SAGER 표에는 포함되지 않았으나 세 종 Lancet 학술지 시범 프로그램에서 시험한 내용에 따라 다음 요건들을 포함하였다: (연구결과 또는 데이터와 분석에 대한 사전 명시 여부와 관계없이) 모든 참가자의 젠더 또는 성별 데이터를 초록과 기초 인구학적 특성 표 모두에 포함하는 것, 그리고 부록에 성별과 젠더에 따라 세분화된 데이터와 분석을 포함하는 것이다.
SAGER 체크리스트는 저자들에게 제공되어야 하며 성별 및 젠더 데이터 보고에 대한 안내가 학술지의 ‘투고 규정’에 명시되어야 한다. 저자에게 명확한 안내를 제공하는 것은 연구에서 성별과 젠더 고려의 중요성에 대한 인식을 높이고 학술지의 기대 사항을 정확하게 전달하는 데 도움이 될 것이다.
편집인의 관점에서 SAGER 체크리스트는 심사와 학술지 출판의 작업 단계별로 학술지의 업무 흐름에 따라 다양하게 사용될 수 있다. 현 단계에서 Lancet 학술지들은 초기 심사 완료 후 저자에게 수정 원고 제출을 요청할 때 체크리스트를 사용하며, 편집인은 게재 결정에 대한 통지에 성별 및 젠더 보고와 관련된 요구사항을 저자들에게 전달하고 있다. 성별 및 젠더 데이터와 분석에 대한 전문가 검토가 중요하다는 점을 고려할 때, 사실 초기 심사 의뢰 “전”에 체크리스트를 사용하여 투고 원고를 스크리닝 하는 것이 이상적이다. 이런 접근은 논문 수정 단계에서 심사자의 부담 가중이 될 수 있는(예를 들면 한번 더 심사해야 하는 상황) 새로운 보고 요건이 도입된다는 우려를 피할 수 있게 한다. 하지만 심사 전의 SAGER 지침 집행이 저자의 호응 정도에 따라 작업 진행에 병목현상을 야기할 수도 있다.
체크리스트의 모든 항목이 모든 연구에 적용되지 않을 수 있다. 사실 각 항목은 결과를 보고하는 시점이 아니라 연구 설계 단계에서 고려되어야 바람직하다. 설계 단계에서 성별 및 젠더 차원을 포함하지 않은 연구는 이러한 문제들을 통계적으로 유의미하게 다룰 수 있는 기반이 충족되지 않을 경우, 성별 또는 젠더에 따른 세분화 데이터와 분석을 적절하게 논의 및 신중하게 해석해야 한다. 이러한 데이터는 기술적 보고 및 가설 설정에 충분히 유효할 수 있으므로, 논문의 부록에 데이터를 포함시키는 것이 유용하고 잠재적으로 유익하다고 생각한다.
논의
출판된 논문에 SAGER 지침을 적용하려는 본 연구진의 노력은 성공적이었으며, 심사 과정에 체크리스트가 사용됨으로써 (1) 학술지 편집인들이 용어 표준화에 기여할 수 있도록 돕고, (2) 성별 및 젠더를 변수로 포함함으로써 성별/젠더에 기반한 선정기준의 정당성을 보장할 수 있는 보고 권고 사항(best reporting practices)을 지지하며, (3) 학계의 인식을 높일 것으로 기대한다.
최근 학술지 편집인들은 연구자들이 연구의 포용성(inclusion) 및 다양성(diversity)에 대한 세부 사항을 보다 공개하는 의식 고양 및 기회 마련을 위해 다른 전략을 채택하기도 했다. Cell Press는 2021년 1월부터 저자들이 논문의 과학적 내용의 다양성뿐만 아니라 저자됨(authorship)과 각 저자의 연구에 기여한 바를 포함할 수 있도록 포용성 및 다양성 양식 작성을 가능하게 하였다. 저자들은 해당 답변에 따라 출판될 논문에 포용성 및 다양성에 관한 문구를 포함할 수 있다. 이는 연구 수행 및 보고의 투명성을 높이고 학계에서 포용성 및 다양성에 대한 인식을 제고하기 위해 이런 문구를 명시하는 논문을 부각하려는 것이다[20]. New England Journal of Medicine도 마찬가지로 저자는 논문의 온라인 출판에 맞춰서 연구 대상자의 질병, 문제, 또는 상태와 연구 대상자의 대표성에 대한 배경 정보를 부록 표(supplement table)에 작성하도록 하고 있다[11]. 이와 같은 새로운 요구사항은 연구 설계의 투명성과 환자 모집단의 대표성 확보에 대한 강화로, 진일보하고 있음을 나타낸다.
성별과 젠더, 그리고 정체성 관련한 여러 차원 간의 복합적인 상호작용은 불평등의 원인이 되고 있다. 포용적인 연구와 교차의학(intersectional medicine)은 정체성의 다양한 요소들이 (성별, 젠더, 인종, 민족, 성적 성향, 장애, 그리고 사회경제 및 문화적 요인 등이) 개인에게 어떻게 영향을 미치는지 이해하는 데 힘써야 한다. 이런 점에서 SAGER 체크리스트는 차후 SAGER 지침의 수정보완을 위한 모델이 될 수 있으며 이는 성별과 젠더가 정체성 관련한 다른 중요한 요소와 통합되고 이들 간의 교차성이 건강에 어떤 영향을 미치는지 확인할 수 있기를 기대한다.
데이터와 데이터 사이언스는 점점 더 우리 세계를 형성하고 연구 및 의료 분야에 폭넓은 변화를 가져오고 있다. 데이터 사이언스에서 성별과 젠더를 포함하여 정체성의 다양한 측면들을 통합 개선하는 것이 시급하다. 인공지능이 연구 성과에 혁신을 가져올 것이라 약속했지만, 이러한 알고리즘은 학습된 데이터만큼만 유효할 뿐이다. 예를 들어, 연구 대상자가 모집단을 대표한다는 가정이 잘못되면 기존의 비뚤림이 악화되고 잘못된 연관성이 도출될 수 있다. 성별 또는 인종으로 편중된 데이터에 기반하여 알고리즘을 개발했기 때문에[21,22] 개발된 진단 알고리즘이 여성 또는 유색 인종을 대상으로 실험했을 때 성과가 부진한 사례가 많이 있다. 이처럼 대표성 있는 데이터를 사용하지 않는 것은 대변되지 못한 집단(underrepresented)에 영향을 미치며 연구의 적용 가능성을 제한한다. SAGER 체크리스트는 이러한 유형의 연구에도 적용될 수 있으며, 현재 형식으로도 데이터의 대표성과 알고리즘의 적용 가능성을 판단할 수 있도록 도움이 되는 핵심 항목을 이미 제공하고 있다.
진정으로 포용적인 연구의 실현은 연구 설계에서 시작된다. 연구 설계에 새로운 항목이 적용되려면 연구지원 기관, 연구자, 기관연구윤리위원회 및 데이터를 생성하는 기타 조직들의 지지와 함께 정책 입안자, 옹호자, 그리고 사회 전반의 지원이 필요하다[18,23,24].
교차연구(intersectional research)가 표준이 될 때까지, 저자와 편집인이 SAGER 지침을 준수하여 보고할 수 있도록 이 체크리스트가 도움이 되기를 기대한다. 과학은 모두를 위한 것이며, 성별과 젠더에 관한 포괄적인 보고를 한다면 포용성을 고려하지 않은 연구의 부적절함을 드러낼 것이다.