مروری ساختارمند بر تأثیر Generative AI، LLMها و مدلهای تصویری مولد بر گزارشنویسی، تصویربرداری و آموزش رادیولوژی
با پیشرفت سریع هوش مصنوعی مولد (Generative AI)، رادیولوژی وارد مرحلهای نوین از تحول شده است؛ مرحلهای که در آن نقش رادیولوژیست از «تفسیرگر تصویر» به مدیر هوشمند دادههای بالینی، تصویری و متنی ارتقا مییابد. برخلاف تصور اولیه، این فناوری نهتنها تهدیدی برای حرفه رادیولوژی نیست، بلکه بهعنوان یک تقویتکننده توان تخصصی انسان عمل میکند.
سه حوزه کلیدی تحول در رادیولوژی با Generative AI
1- گزارشنویسی و تولید متن (Reporting & Text Generation)
مدلهای زبانی بزرگ مانند ChatGPT-4o، Claude Opus و Gemini توانستهاند تحولی اساسی در فرآیند گزارشنویسی ایجاد کنند:
تبدیل گزارشهای تخصصی به زبان ساده برای بیماران مطالعات نشان دادهاند که بخش بزرگی از بیماران در درک گزارشهای رادیولوژی دچار مشکل هستند. LLMها میتوانند گزارشهای CT و MRI را بدون حذف اطلاعات حیاتی، به زبانی قابل فهم برای عموم ترجمه کنند و نقش «مترجم پزشکی» را ایفا نمایند.
تولید خودکار بخش Impression از روی Findings بخش Impression یکی از زمانبرترین قسمتهای گزارش است. مدلهای مولد قادرند با خواندن یافتهها، یک Impression ساختاریافته، منسجم و بالینی تولید کنند. مطالعات نشان میدهد GPT-4 از نظر دقت، پوشش بالینی و انسجام، عملکردی نزدیک به ارزیابی رادیولوژیستها دارد؛ اگرچه همچنان نظارت انسانی ضروری است.
نکته مهم: پدیده hallucination بهویژه در مدلهای قدیمیتر دیده میشود و اهمیت Human-in-the-Loop را برجسته میکند.
2- تولید، بازسازی تصویر و دادههای مصنوعی (Image Generation & Reconstruction)
برخلاف تصور عمومی، هدف AI مولد در رادیولوژی «خلق تصویر جعلی بیمار» نیست؛ بلکه تمرکز بر بهبود کیفیت، آموزش و تشخیص دقیقتر است.
تولید دادههای مصنوعی (Synthetic Data Generation) کمبود تصاویر بیماریهای نادر یکی از چالشهای اصلی آموزش AI است. مدلهای Diffusion میتوانند تصاویر مصنوعی ولی واقعگرایانه X-ray یا MRI تولید کرده و دقت مدلهای تشخیصی را افزایش دهند.
تشخیص ناهنجاری با یادگیری از دادههای سالم (Anomaly Detection) در این رویکرد، مدل ابتدا الگوی بافت سالم را یاد میگیرد و سپس هر انحراف از این الگو را بهعنوان ضایعه یا آنومالی شناسایی میکند. مطالعات نشان دادهاند که Diffusion Models در تشخیص ضایعات مغزی، از روشهای کلاسیک بدونناظر مانند Autoencoder و GAN عملکرد دقیقتر و سریعتری دارند.
با این حال، برای کاربرد بالینی گسترده، نیاز به کالیبراسیون، دیتاستهای چندمرکزی و کنترل خطا وجود دارد.
3- آموزش و ارزیابی دانش پزشکی (Education & Knowledge Assessment)
هوش مصنوعی مولد بهسرعت در حال تبدیلشدن به یک دستیار آموزشی قدرتمند برای دانشجویان و رزیدنتهای رادیولوژی است.
عملکرد در آزمونهای بورد رادیولوژی مطالعات معتبر نشان دادهاند که GPT-4 در آزمونهای سبک بورد رادیولوژی (مانند RITE) عملکردی نزدیک یا حتی بالاتر از میانگین رزیدنتها دارد، بهویژه در سؤالات مبتنی بر *clinical reasoning*.
استدلال بالینی و پاسخ به سؤالات پیچیده برخلاف تصور «حفظمحور بودن»، LLMها قادر به استدلال مرحلهای، رد گزینههای غلط و توضیح منطق پاسخ صحیح هستند. با این حال، در سؤالاتی که نیاز به درک مستقیم تصویر، آرتیفکتها و مهارت بصری ظریف دارند، همچنان از انسان ضعیفترند.
لینک دسترسی به مقالات: https://pubs.rsna.org/doi/10.1148/ryai.240628https://pubs.rsna.org/doi/abs/10.1148/radiol.230806