پرش لینک ها

نقش هوش مصنوعی مولد در بازتعریف آینده رادیولوژی

مروری ساختارمند بر تأثیر Generative AI، LLMها و مدل‌های تصویری مولد بر گزارش‌نویسی، تصویربرداری و آموزش رادیولوژی

با پیشرفت سریع هوش مصنوعی مولد (Generative AI)، رادیولوژی وارد مرحله‌ای نوین از تحول شده است؛ مرحله‌ای که در آن نقش رادیولوژیست از «تفسیرگر تصویر» به مدیر هوشمند داده‌های بالینی، تصویری و متنی ارتقا می‌یابد. برخلاف تصور اولیه، این فناوری نه‌تنها تهدیدی برای حرفه رادیولوژی نیست، بلکه به‌عنوان یک تقویت‌کننده توان تخصصی انسان عمل می‌کند.

1- گزارش‌نویسی و تولید متن (Reporting & Text Generation)

مدل‌های زبانی بزرگ مانند ChatGPT-4o، Claude Opus و Gemini توانسته‌اند تحولی اساسی در فرآیند گزارش‌نویسی ایجاد کنند:

تبدیل گزارش‌های تخصصی به زبان ساده برای بیماران مطالعات نشان داده‌اند که بخش بزرگی از بیماران در درک گزارش‌های رادیولوژی دچار مشکل هستند. LLMها می‌توانند گزارش‌های CT و MRI را بدون حذف اطلاعات حیاتی، به زبانی قابل فهم برای عموم ترجمه کنند و نقش «مترجم پزشکی» را ایفا نمایند.

تولید خودکار بخش Impression از روی Findings بخش Impression یکی از زمان‌برترین قسمت‌های گزارش است. مدل‌های مولد قادرند با خواندن یافته‌ها، یک Impression ساختاریافته، منسجم و بالینی تولید کنند. مطالعات نشان می‌دهد GPT-4 از نظر دقت، پوشش بالینی و انسجام، عملکردی نزدیک به ارزیابی رادیولوژیست‌ها دارد؛ اگرچه همچنان نظارت انسانی ضروری است.

نکته مهم: پدیده hallucination به‌ویژه در مدل‌های قدیمی‌تر دیده می‌شود و اهمیت Human-in-the-Loop را برجسته می‌کند.

برخلاف تصور عمومی، هدف AI مولد در رادیولوژی «خلق تصویر جعلی بیمار» نیست؛ بلکه تمرکز بر بهبود کیفیت، آموزش و تشخیص دقیق‌تر است.

تولید داده‌های مصنوعی (Synthetic Data Generation) کمبود تصاویر بیماری‌های نادر یکی از چالش‌های اصلی آموزش AI است. مدل‌های Diffusion می‌توانند تصاویر مصنوعی ولی واقع‌گرایانه X-ray یا MRI تولید کرده و دقت مدل‌های تشخیصی را افزایش دهند.

تشخیص ناهنجاری با یادگیری از داده‌های سالم (Anomaly Detection) در این رویکرد، مدل ابتدا الگوی بافت سالم را یاد می‌گیرد و سپس هر انحراف از این الگو را به‌عنوان ضایعه یا آنومالی شناسایی می‌کند. مطالعات نشان داده‌اند که Diffusion Models در تشخیص ضایعات مغزی، از روش‌های کلاسیک بدون‌ناظر مانند Autoencoder و GAN عملکرد دقیق‌تر و سریع‌تری دارند.

با این حال، برای کاربرد بالینی گسترده، نیاز به کالیبراسیون، دیتاست‌های چندمرکزی و کنترل خطا وجود دارد.

هوش مصنوعی مولد به‌سرعت در حال تبدیل‌شدن به یک دستیار آموزشی قدرتمند برای دانشجویان و رزیدنت‌های رادیولوژی است.

عملکرد در آزمون‌های بورد رادیولوژی مطالعات معتبر نشان داده‌اند که GPT-4 در آزمون‌های سبک بورد رادیولوژی (مانند RITE) عملکردی نزدیک یا حتی بالاتر از میانگین رزیدنت‌ها دارد، به‌ویژه در سؤالات مبتنی بر *clinical reasoning*.

استدلال بالینی و پاسخ به سؤالات پیچیده برخلاف تصور «حفظ‌محور بودن»، LLMها قادر به استدلال مرحله‌ای، رد گزینه‌های غلط و توضیح منطق پاسخ صحیح هستند. با این حال، در سؤالاتی که نیاز به درک مستقیم تصویر، آرتیفکت‌ها و مهارت بصری ظریف دارند، همچنان از انسان ضعیف‌ترند.

لینک دسترسی به مقالات: https://pubs.rsna.org/doi/10.1148/ryai.240628https://pubs.rsna.org/doi/abs/10.1148/radiol.230806

پیام بگذارید