समाचारं

एआइ मानववैद्यैः पूर्णतया पराजितः अस्ति! अध्ययनेन ज्ञातं यत् बृहत् आदर्शेषु नैदानिकनिर्णयः त्वरितरूपेण असुरक्षितः च भवति, यत्र न्यूनतमः सटीकतादरः केवलं १३ भवति

2024-07-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


किं ChatGPT इत्यादीनां बृहत् मॉडलानां कारणेन मानववैद्याः क्रमेण परित्यक्ताः भविष्यन्ति?

एषा चिन्ता निराधारा नास्ति। किन्तु गूगलस्य बृहत् मॉडल् (Med-PaLM 2) सहजतया USMLE उत्तीर्णं कृत्वा चिकित्साविशेषज्ञस्य स्तरं प्राप्तवान् ।

तथापि नूतनेन अध्ययनेन ज्ञायते यत् -चिकित्साशास्त्रीयदृष्ट्या २.मानववैद्याः वर्तमानस्य कृत्रिमबुद्धेः (AI) प्रतिरूपं पूर्णतया पराजयितुं शक्नुवन्ति, व्यक्तिगत "बेरोजगारी" इत्यस्य विषये अधिकं चिन्तायाः आवश्यकता नास्ति ।

"नैदानिकनिर्णयनिर्माणे बृहत्भाषाप्रतिमानानाम् सीमानां मूल्याङ्कनं शमनं च" इति शीर्षकेण सम्बद्धं शोधपत्रं अद्यैव वैज्ञानिकपत्रिकायां नेचर मेडिसिन् इत्यस्मिन् प्रकाशितम्


अध्ययनेन ज्ञातं यत् अत्यन्तं उन्नताः बृहत्भाषाप्रतिमानाः (LLM) अपि सर्वेषां रोगिणां कृते सटीकं निदानं कर्तुं न शक्नुवन्ति तथा च मानववैद्यानां अपेक्षया महत्त्वपूर्णतया दुष्टतरं प्रदर्शनं कर्तुं न शक्नुवन्ति -

वैद्यानाम् निदानस्य सटीकता ८९% आसीत्, एलएलएम इत्यस्य निदानस्य सटीकता केवलं ७३% आसीत् । एकस्मिन् चरमप्रकरणे (पित्ताशयशोथनिदानं) एलएलएम केवलं १३% समये एव सम्यक् आसीत् ।

अतः अपि आश्चर्यं यत् एलएलएम इत्यस्य निदानसटीकता यथा यथा प्रकरणस्य विषये अधिका सूचना ज्ञायते तथा तथा न्यूनीभवति, कदाचित् एतादृशपरीक्षाणां आवश्यकता अपि भवति यत् रोगी कृते गम्भीरं स्वास्थ्यजोखिमं जनयितुं शक्नोति।

आपत्कालीनचिकित्सकरूपेण एलएलएम कथं भवति ?

यद्यपि एलएलएम यूएसएमएलई सहजतया उत्तीर्णं कर्तुं शक्नोति तथापिचिकित्सा अनुज्ञापत्रपरीक्षा तथा नैदानिकप्रकरणचुनौत्यं केवलं अभ्यर्थीनां सामान्यचिकित्साज्ञानस्य परीक्षणार्थं उपयुक्तानि सन्ति, तथा च दैनिकजटिलचिकित्सानिर्णयकार्यस्य अपेक्षया दूरं न्यूनानि कठिनानि सन्ति।

नैदानिकनिर्णयः बहुचरणीयप्रक्रिया अस्ति यस्याः प्रमाणाधारितं रोगीनिदानं चिकित्सानिर्णयं च प्राप्तुं विषमस्रोतानां आँकडानां संग्रहणं एकीकरणं च तथ्यानां सततं मूल्याङ्कनं च आवश्यकं भवति

नैदानिकनिदानस्य एलएलएम-क्षमतायाः अग्रे अन्वेषणार्थं म्यूनिखस्य तकनीकीविश्वविद्यालयस्य शोधदलेन तेषां सहकारिभिः च चिकित्सासूचनाबाजारसघनसेवादत्तांशकोशस्य (MIMIC-IV) आधारेण २४०० वास्तविकरोगीप्रकरणानाम् ४ सामान्योदररोगाणां च कवरं कृत्वा एकं आँकडाधारं निर्मितम् .यथार्थं नैदानिकवातावरणं अनुकरणं कृत्वा आपत्कालीनकक्षात् चिकित्सापर्यन्तं प्रक्रियां पुनः प्रदर्शयन्तु , तस्मात् चिकित्सानिर्णयकर्तृत्वेन तस्य उपयुक्ततायाः आकलनं भवति ।


चित्र |.दत्तांशसमूह स्रोतः मूल्याङ्कनरूपरेखा च। इदं दत्तांशसमूहं MIMIC-IV आँकडाकोषे वास्तविकप्रकरणात् प्राप्तं भवति तथा च अस्पताले प्रवेशस्य समये अभिलेखितं व्यापकं इलेक्ट्रॉनिकस्वास्थ्यअभिलेखदत्तांशं समाविष्टं भवति। मूल्याङ्कनरूपरेखा वास्तविकजीवनस्य नैदानिकपरिवेशं प्रतिबिम्बयति तथा च अनेकमापदण्डेषु एलएलएम-सम्बद्धं व्यापकं मूल्याङ्कनं प्रदाति, यत्र निदानसटीकता, निदानस्य उपचारस्य च मार्गदर्शिकानां अनुपालनं, निर्देशानां अनुसरणं कर्तुं स्थिरता, प्रयोगशालापरिणामानां व्याख्यानस्य क्षमता, निर्देशेषु परिवर्तनस्य प्रतिक्रिया च सन्ति , सूचनामात्रायां सूचनाक्रमे च परिवर्तनं प्रति दृढता। आईसीडी, रोगानाम् अन्तर्राष्ट्रीयवर्गीकरणम्, कम्प्यूटर्ड् टोमोग्राफी, अल्ट्रासाउण्ड्, मैग्नेटिक रेजोनेन्स कोलेंजिओपैनक्रियाटोग्राफी;

शोधदलेन लामा २ इत्यस्य तस्य व्युत्पन्नस्य च परीक्षणं कृतम्, यत्र सामान्यसंस्करणं (यथा लामा २ चैट्, ओपन असिस्टेन्ट्, विजार्डएलएम) तथा च चिकित्साक्षेत्र-संरेखितमाडल (यथा क्लिनिकल् कैमल् तथा मेडिट्रॉन्) च सन्ति

MIMIC-दत्तांशस्य गोपनीयता-समस्यानां, आँकडा-उपयोग-समझौतानां च कारणात्, OpenAI अथवा Google इत्यादीनां बाह्य-एपिआइ-कृते आँकडानां उपयोगः कर्तुं न शक्यते, अतः ChatGPT, GPT-4, Med-PaLM इत्यादीनां परीक्षणं न कृतम् उल्लेखनीयं यत्, Llama 2, Clinical Camel, Meditron च चिकित्सालाइसेंसपरीक्षासु जैवचिकित्साप्रश्नाउत्तरपरीक्षासु च ChatGPT प्रदर्शनस्य मेलनं कृतवन्तः वा अतिक्रान्तवन्तः वा।

परीक्षण नियन्त्रण समूह आपत्कालीन-अनुभवस्य भिन्न-भिन्न-वर्षस्य (क्रमशः २, ३, ४, २९ वर्षाणि) द्वयोः देशयोः चत्वारः चिकित्सकाः समाविष्टाः आसन् । परिणामेषु ज्ञातं यत् एलएलएम-संस्थायाः चिकित्सानिदानं मानववैद्यानाम् अपेक्षया दूरं दुर्बलतरं भवति ।

1. एलएलएम इत्यस्य निदानप्रदर्शनं नैदानिकस्य अपेक्षया महत्त्वपूर्णतया न्यूनं भवति

चिकित्सकानाम् परिणामैः ज्ञायते यत् वर्तमानः एलएलएम सर्वेषां रोगानाम् समग्रप्रदर्शने वैद्यानां अपेक्षया महत्त्वपूर्णतया न्यूनः अस्ति (P < 0.001),निदानस्य सटीकता अन्तरं १६% तः २५% पर्यन्तं भवति । . यद्यपि सरलपरिशिष्टशोथस्य निदानं प्रति आदर्शः उत्तमं प्रदर्शनं करोति तथापि पित्ताशयशोथ इत्यादीनां अन्येषां विकृतिविज्ञानानाम् निदानं दुर्बलं करोति विशेषतः मेडिट्रॉन् प्रतिरूपं पित्ताशयशोथस्य निदानं विफलं भवति तथा च प्रायः "पित्तपत्थरस्य" रोगिणां निदानं करोति

व्यावसायिकचिकित्सा एलएलएम समग्रप्रदर्शने अन्येभ्यः आदर्शेभ्यः महत्त्वपूर्णतया अधिकं प्रदर्शनं न करोति , तथा च यदा LLM इत्यनेन स्वयमेव सर्वाणि सूचनानि संग्रहीतुं आवश्यकं भवति तदा तस्य कार्यक्षमतायाः अधिकं क्षयः भविष्यति ।


चित्र |.सर्वसूचनाः प्रदत्ताः इति शर्तेन निदानस्य सटीकता। आँकडा MIMIC-CDM-FI (n=80) इत्यस्य उपसमूहस्य आधारेण भवति, प्रत्येकस्य पट्टिकायाः ​​उपरि औसतनिदानसटीकता दर्शिता अस्ति, ऊर्ध्वाधररेखा च मानकविचलनं प्रतिनिधियति एलएलएमस्य औसतप्रदर्शनं महत्त्वपूर्णतया दुर्बलं (P < 0.001) आसीत्, विशेषतः पित्तकोशिकाशोथः (P < 0.001) तथा डाइवर्टिक्युलिटिसः (P < 0.001) च ।


चित्र |.स्वायत्त नैदानिकनिर्णयपरिदृश्येषु निदानसटीकता। पूर्णसूचनाप्रदानपरिदृश्यस्य तुलने आदर्शनिर्णयस्य समग्रसटीकतायां महती न्यूनता अभवत् । एलएलएम एपेण्डिसाइटिसस्य निदानं सर्वोत्तमं प्रदर्शनं कृतवान् परन्तु पित्तकोशिकाशोथः, डाइवर्टिक्युलाइटिसः, अग्नाशयशोथः इति त्रयः विकृतिषु दुर्बलं प्रदर्शनं कृतवान् ।

2. LLM इत्यस्य चिकित्सानिर्णयाः त्वरितरूपेण असुरक्षिताः च भवन्ति

शोधदलेन तत् ज्ञातम्एलएलएम निदानमार्गदर्शिकानां अनुसरणं दुर्बलं करोति तथा च महत्त्वपूर्णरोगीसूचनाः सहजतया चूकति। . रोगिणां कृते आवश्यकप्रयोगशालापरीक्षायाः आदेशे अपि स्थिरतायाः अभावः अस्ति । प्रयोगशालापरिणामानां व्याख्याने अपि एलएलएम-नगरस्य महत्त्वपूर्णाः दोषाः सन्ति । एतेन ज्ञायते यत् ते रोगी प्रकरणं पूर्णतया न अवगत्य त्वरितनिदानं कुर्वन्ति, येन रोगी स्वास्थ्याय गम्भीरः जोखिमः भवति।


चित्र |.एलएलएम अनुशंसित उपचार पद्धतीनां मूल्याङ्कनम्। इष्टचिकित्सापद्धतिः नैदानिकमार्गदर्शिकानां आधारेण निर्धारिता आसीत् तथा च आँकडासमूहे रोगिभिः वास्तवतः प्राप्तानां उपचारानां आधारेण। ८०८ रोगिणां मध्ये Llama 2 Chat इत्यनेन ६०३ जनानां सम्यक् निदानं कृतम् । एतेषु ६०३ रोगिषु Llama 2 Chat इत्यनेन ९७.५% समये एपेन्डेक्टोमी इत्यस्य सम्यक् अनुशंसा कृता ।

3. एलएलएम इत्यस्य अद्यापि चिकित्सकानाम् व्यापकं चिकित्सापरिवेक्षणस्य आवश्यकता वर्तते

अतिरिक्ते,वर्तमानकाले सर्वे एलएलएम मूलभूतचिकित्सामार्गदर्शनस्य अनुसरणं कर्तुं दुर्बलं प्रदर्शनं कुर्वन्ति , प्रत्येकं २-४ प्रकरणेषु दोषः भवति, प्रत्येकं २-५ प्रकरणेषु अस्तित्वहीनमार्गदर्शनस्य आविष्कारः भवति ।


चित्र |.विभिन्नदत्तांशराशिषु LLM प्रदर्शनम्। अध्ययनेन सर्वेषां निदानसूचनानाम् उपयोगेन प्रत्येकस्य मॉडलस्य कार्यप्रदर्शनस्य तुलना कृता वर्सेस् केवलं एकस्याः निदानपरीक्षायाः उपयोगेन वर्तमानरोगस्य इतिहासः च। प्रायः सर्वेषां रोगानाम् कृते MIMIC-CDM-FI दत्तांशसमूहे सर्वाणि सूचनानि प्रदातुं इष्टतमं प्रदर्शनं न अभवत् । एतेन ज्ञायते यत् एलएलएम प्रमुखतथ्येषु ध्यानं दातुं असमर्थः भवति तथा च यदा अत्यधिकसूचना प्रदत्ता भवति तदा कार्यप्रदर्शनस्य अवनतिः भवति ।

अध्ययनेन इदमपि ज्ञातं यत् प्रत्येकस्य प्रतिरूपस्य कृते उत्तमं प्रदर्शनं प्रदाति इति सूचनायाः क्रमः प्रत्येकस्य विकृतिविज्ञानस्य कृते भिन्नः भवति, यत् निःसंदेहं प्रतिरूपस्य अनन्तरं अनुकूलनस्य कठिनतां अधिकं वर्धयति विस्तृतचिकित्सकस्य पर्यवेक्षणं पूर्वमूल्यांकनं च विना कार्यं विश्वसनीयतया कर्तुं न शक्यते । समग्रतया, तेषां निर्देशानां अनुसरणं, सूचनायाः संसाधनस्य क्रमे, प्रासंगिकसूचनायाः संसाधने च विस्तृताः अभावाः सन्ति, अतः ते सम्यक् कार्यं कुर्वन्ति इति सुनिश्चित्य महत्त्वपूर्णचिकित्सापरिवेक्षणस्य आवश्यकता वर्तते

यद्यपि अध्ययनेन एलएलएम-रोगस्य नैदानिकनिदानस्य विविधाः समस्याः ज्ञाताः तथापि एलएलएम-रोगस्य चिकित्साशास्त्रे अद्यापि महती प्रतिज्ञा अस्ति तथा च चिकित्सा-इतिहासस्य परीक्षणपरिणामानां च आधारेण निदानार्थं अधिकं उपयुक्ता भवितुम् अर्हति शोधदलस्य मतं यत्...अस्मिन् शोधकार्ये निम्नलिखितपक्षद्वये अधिकविस्तारस्य स्थानं वर्तते।

  • आदर्शसत्यापनं परीक्षणं च : वास्तविकनैदानिकपरिवेशेषु तस्य प्रभावशीलतां सुनिश्चित्य एलएलएमस्य अधिकव्यापकसत्यापनं परीक्षणं च अग्रे शोधं केन्द्रीक्रियते।

  • बहुविषयकसहकार्यम् : अनुशंसितं यत् एआइ-विशेषज्ञाः चिकित्सकैः सह निकटतया कार्यं कुर्वन्ति येन नैदानिक-अभ्यासाय उपयुक्तं एलएलएम-विकासः अनुकूलनं च भवति तथा च व्यावहारिक-अनुप्रयोगेषु समस्यानां समाधानं भवति।

एआइ स्वास्थ्यसेवायां कथं बाधां जनयति ?

न केवलं उपर्युक्तं शोधं, अपितु राष्ट्रियस्वास्थ्यसंस्थानां (NIH) तेषां सहकारिणां च दलेन अपि एतादृशी समस्याः प्राप्ताः - यदा २०७ इमेज चैलेन्जप्रश्नानां उत्तरं दत्तम्,यद्यपि GPT-4V समीचीननिदानस्य चयनं कर्तुं बहु स्कोरं करोति तथापि प्रायः चिकित्साप्रतिमानां वर्णने निदानस्य पृष्ठतः कारणानि व्याख्याने च त्रुटिं करोति

यद्यपि ए.आइ.

यथा - गूगलः प्रकाशयतिचिकित्सा एआई बृहत् मॉडल Med-PaLM2 , इत्यस्य शक्तिशालिनः निदानं चिकित्साक्षमता च अस्ति, तथा च MedQA परीक्षणसमूहे "विशेषज्ञ"स्तरं प्राप्तुं प्रथमं विशालं प्रतिरूपं अपि अस्ति ।


सिङ्घुआ विश्वविद्यालयस्य शोधदलेन प्रस्तावितम्“एजेण्ट् हॉस्पिटल” २. , रोगचिकित्सायाः सम्पूर्णप्रक्रियायाः अनुकरणं कर्तुं शक्नोति, तस्य मूललक्ष्यं च वैद्य एजेण्टं अनुकरणीयवातावरणे रोगानाम् उपचारं कथं कर्तव्यमिति शिक्षितुं, अपि च आत्मविकासं प्राप्तुं सफलविफलप्रकरणेभ्यः अनुभवं निरन्तरं सञ्चयितुं शक्नोति


हार्वर्ड-चिकित्साविद्यालयः मानवविकृतिविज्ञानस्य नूतनसाधनस्य विकासस्य नेतृत्वं करोतिदृश्य भाषा सामान्य एआइ सहायक——PathChat , यत् प्रायः ९०% प्रकरणेषु बायोप्सी-खण्डेभ्यः रोगानाम् सम्यक् पहिचानं कर्तुं शक्नोति, तथा च तस्य कार्यक्षमता सामान्य-एआइ-माडलस्य, वर्तमानकाले विपण्यां विद्यमानानाम् GPT-4V इत्यादीनां व्यावसायिक-चिकित्सा-माडलस्य च अपेक्षया उत्तमम् अस्ति


चित्र |.दत्तांशसमूहं तथा PathChat निर्माणं सूक्ष्मरूपेण ट्यून कर्तुं निर्देशाः

अद्यैव ओपनएआइ-सङ्घस्य मुख्यकार्यकारी सैम आल्टमैन् थ्रिव् एआइ हेल्थ इति नूतनकम्पन्योः स्थापनायां भागं गृहीतवान्, यस्याः उद्देश्यं एआइ-प्रौद्योगिक्याः उपयोगेन जनानां दैनन्दिन-अभ्यासेषु सुधारं कर्तुं, दीर्घकालीन-रोगाणां मृत्युदरं न्यूनीकर्तुं च सहायतां कर्तुं वर्तते

ते अवदन् ।अति-व्यक्तिगत एआई प्रौद्योगिकी एतत् जनानां जीवनाभ्यासेषु प्रभावीरूपेण सुधारं कर्तुं शक्नोति, तस्मात् दीर्घकालीनरोगाणां निवारणं प्रबन्धनं च कर्तुं शक्नोति, चिकित्सा आर्थिकभारं न्यूनीकरोति, जनानां समग्रस्वास्थ्यं च सुधारयितुं शक्नोति

अद्यत्वे चिकित्सा-उद्योगे एआइ-इत्यस्य अनुप्रयोगः क्रमेण प्रारम्भिक-प्रयोग-चरणात् व्यावहारिक-अनुप्रयोग-पदे संक्रमणं कृतवान्, परन्तु अद्यापि बहु दूरं गन्तुं शक्नोति यत् एतत् चिकित्सकानाम् क्षमतावर्धनं, चिकित्सा-निर्णय-निर्माणं, अथवा प्रत्यक्षतया अपि तस्य स्थाने स्थापयन्तु।