종합 멀티인 HyperKvasir

과학 데이터 7권, 기사 번호: 283(2020) 이 기사 인용

22,000회 액세스

109 인용

48 알트메트릭

측정항목 세부정보

최근 인공지능(AI)이 의학계의 화두다. 그러나 법적 제한과 훈련 데이터에 수동으로 레이블을 지정하는 번거롭고 지루한 프로세스에 대한 의료 인력 부족으로 인해 의료 데이터가 드물고 얻기 어려운 경우가 많습니다. 이러한 제약으로 인해 질병이나 기타 병변 감지와 같은 자동 분석을 위한 시스템을 개발하기가 어렵습니다. 이러한 측면에서 이 기사에서는 현재 이용 가능한 최대 위장관 이미지 및 비디오 데이터 세트인 HyperKvasir를 소개합니다. 데이터는 노르웨이의 Bærum 병원에서 실제 위 및 대장 내시경 검사 중에 수집되었으며 부분적으로 경험이 풍부한 위장 내시경 의사가 라벨을 붙였습니다. 데이터 세트에는 110,079개의 이미지와 374개의 비디오가 포함되어 있으며 해부학적 랜드마크는 물론 병리학적 및 정상 소견을 나타냅니다. 이미지와 비디오 프레임의 총 개수는 약 100만 개입니다. 초기 실험은 인공 지능 기반 컴퓨터 지원 진단 시스템의 잠재적 이점을 보여줍니다. HyperKvasir 데이터세트는 위내시경 및 대장내시경 검사뿐만 아니라 다른 의학 분야에서도 더 나은 알고리즘과 컴퓨터 보조 검사 시스템을 개발하는 데 중요한 역할을 할 수 있습니다.

측정

소화관 내강 • 결장 내강

기술 유형

위장내시경 • 대장내시경

샘플 특성 - 유기체

현명한 사람

보고된 데이터를 설명하는 기계 액세스 가능 메타데이터 파일: https://doi.org/10.6084/m9.figshare.12759833

인간의 위장관(GI)에는 사소한 불편함부터 매우 치명적인 질병까지 다양한 비정상적인 점막 소견이 나타날 수 있습니다. 예를 들어, 세계보건기구(WHO)의 암 전문 기관인 국제 암 연구 기관(https://gco.iarc.fr/today/fact-sheets-cancers)에 따르면 위장관암은 전 세계적으로 매년 약 350만 건의 새로운 사례가 발생합니다. 이러한 암 유형은 일반적으로 총 사망률이 약 63%이고 연간 사망자 수는 220만 명입니다1,2,3.

내시경 검사는 현재 위장관 검사를 위한 최고의 표준 절차이지만, 그 효과는 작업자 성능의 변화로 인해 상당히 제한됩니다4,5,6. 예를 들어, 이는 결장에서 평균 20%의 폴립 누락률을 유발합니다7. 따라서 향상된 내시경 성능, 고품질의 임상 검사 및 체계적인 검진은 위장관 질환 관련 이환율과 사망을 예방하는 중요한 요소입니다. 최근 인공 지능(AI) 기반 지원 시스템의 등장으로 의료 전문가에게 대규모로 고품질 진료를 제공하는 데 필요한 도구를 제공할 수 있는 가능성이 나타났습니다8,9. 효율적인 AI 기반 시스템의 핵심은 이미지에서 암 전 병변이나 암을 감지하는 것과 같은 실제 문제를 해결하도록 모델을 가르치는 고품질 데이터와 알고리즘의 조합입니다. 오늘날의 AI 기반 시스템은 주로 기계 학습(ML)이라는 AI의 하위 분야를 사용하고 있습니다. 이는 일반적으로 특정 작업을 제대로 수행하려면 수천 개의 데이터 샘플에 대한 교육이 필요합니다. 그러나 건강 데이터는 법적인 제약과 데이터 수집의 구조적 문제로 인해 희귀하고 얻기 어려운 경우가 많습니다. 그럼에도 불구하고 내시경 진단을 목표로 하는 유망한 AI 솔루션이 점점 더 많이 개발되고 있습니다. CVC18,19 및 ASU-Mayo 폴립 데이터베이스20와 같이 이러한 시스템에 사용되는 데이터 세트는 ML 연구의 맥락에서 다소 작습니다. 기타 비의료 ML 영역에서는 ImageNet21과 같은 데이터 세트가 1,400만 개의 이미지로 구성됩니다. 표 1은 우리가 아는 한 인간 위장관의 기존 이미지 및 비디오 데이터 세트에 대한 개요를 제공합니다. 관찰할 수 있듯이, 이는 다소 작으며 종종 폴립으로 제한됩니다. 이들 중 일부는 최근에 사용할 수 없게 되었습니다.

소식