论文题目:Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images
论文下载: [点击下载](/download/Application of artificial intelligence using a convolutional neural.pdf)
测试集:13584张胃癌图片,包含2639个胃癌病变(经组织学验证)
测试集: 2296张胃癌图片,包含69个病人,77个胃癌病变(62 cases had 1 gastric cancer lesion, 6 had 2 lesions, and 1 had 3 lesions),每个病人18~69张图片。
速度: 共用49s 检测2296张图片
overall sensitivity: 92.2% (71/77) 71个胃癌病变成功被检测出来
positive predictive value: 30.6%=71/(71+161) 161个非癌性病变误检测,过半误检测为胃炎
结果:
实验:将训练集resize到300*300,送入网络fine-tune参数,然后检测测试集,检测胃癌病变区域。将其用矩形框框出。
- 714张图片被诊断出胃癌 714/2639=31.1%
- 测试集中52个(67.5%)是早期胃癌T1, 25个(32.5%)是advanced cancer T2,T3,T4
- 平均肿瘤大小是24mm(3到170mm)
思考:
准确率该如何计算,如果单看被检测所有的测试集图片,只有不到1/3的图片被检测出有胃癌。
但是如果按照检测的胃癌病变,一共有71/77个病变被检测出来!
我想了下,主要是因为一个病变包含多张图片,作者认为只要某个病变的一张图片被正确诊断,就认为该病变被成功检测出来。类似于多示例学习。
但是这样的话,误诊的也很高,这个161个非癌性病变被误诊是怎么算出来的???医生对误诊的区域进行手动分类统计???
评论区