استفاده از DCNN ها برای تمایز گرافیک و تصاویر عکاسی تولید شده توسط کامپیوتر

سوزان مک اینتاش ، عضو هیئت علمی CDS و استادیار بالینی علوم کامپیوتر در NYU ، با Qi Cui از دانشگاه علوم و فناوری اطلاعات نانجینگ و مرکز مهندسی جیانگشو نظارت شبکه و Huiyu Sun NYU به منظور کشف راه های تمایز بین تصاویر گرافیکی (CG) و عکاسی (PI) کامپیوتری از طریق استفاده از شبکه های عصبی پیچیده عمیق (DCNN).

تشخیص تصاویر CG از همتایان اصلی آنها بسیار دشوار شده است. چشم های انسان نیز با این وظیفه مبارزه می کنند. در خط مقدم پزشکی قانونی تصویر شبکه های عصبی پیچیده عمیق (DCNNs) قرار دارند که محققان در حال حاضر برای این منظور از آنها استفاده می کنند. هنگامی که با اتصالات میانبر بهینه سازی می شود ، DCNN ها دقت بالایی در این امر ارائه می دهند.

DCNN ها دارای ساختار سلسله مراتبی هستند ، تصاویر را به عنوان ورودی می گیرند و آنها را تحت فیلتر گذر بالا قرار می دهند. محققان ابتدا یک شبکه عصبی عمیق را با استفاده از کاتالوگ تصاویر آموزش دادند. این تصاویر آزمایشی تحت فیلترینگ با گذر بالا قرار می گیرند و پس از آن شبکه عصبی می تواند ویژگی های کلیدی را شناسایی کند. محور اصلی این فرایند استفاده از تفاوت های فیزیکی بین تصاویر و استفاده خاص از "نویز" بود. این استراتژی "نویز" طبیعی را که مخصوص تصاویر عکاسی است تشدید می کند. به دلیل کیفیت "روان" تصاویر CG ، نویز یک شاخص مناسب برای مشروعیت است. هنگامی که DCNN یک فایل مدل را از این مجموعه آزمایشی تصاویر ایجاد کرد ، ورودی واقعی از طریق همان فرآیند فیلترینگ اجرا شده و با مدل مقایسه می شود. در نهایت ، تصویر به دو صورت CG یا PI طبقه بندی می شود.

محققان یک آزمایش اولیه را با استفاده از CaffeNet انجام دادند که تنها 83٪ دقت متوسط را تولید کرد. هنگامی که با اتصالات کوتاه مدت اصلاح شد ، CaffeNet به حداکثر متوسط 87٪ رسید. با افزودن اتصالات کوتاه به CNN 50 لایه ، دقت متوسط به 98٪ افزایش یافت.

توسط سابرینا دی سیلوا

تصاویر استفاده متوسط

ایلقار دوشنبه 1 شهریور 1400 ساعت 03:05

دانستنی های جالب

دانستنی های جالب