گالری عکس: نرمافزار پردازش تصویر گوگل چگونه خواب میبیند؟
به راحتی میشود تصویر زیر را با نوعی نقاشی سورئال اشتباه گرفت، اما این تصویر در واقع خیالبافیِ نرمافزار تشخیص عکس پیشرفتهی گوگل را به نمایش میگذارد.
نرمافزار پردازش تصویر گوگل، مانند یک هنرمند، این تصویر را تقریباً از هیچ تولید کرده است. چگونه ممکن است یک ماشین بتواند چیزی را به نمایش بگذارد که شبیه به یک اثر هنری باشد؟ بخشی از پاسخ این است که این ماشین در واقع یک مغزِ مصنوعی است. همراه جریان باشید.
دوران تمرین
شبکههای عصبی مصنوعی، سیستمهایی هستند که از ۱۰ الی ۳۰ لایه از نورونهای ترکیبی تشکیل شدهاند. مهندسان گوگل توضیح دادهاند که به منظور تمرین دادن چنین شبکهای، عکسهایی را به لایهی ورودی میدهند، این لایه با لایهی بعدی گفتوگو میکند و لایهی بعدی با لایهی بعد. و همینطور تا اطلاعات به لایهی خروجی برسد.
این لایهها با یکدیگر همکاری میکنند تا یک تصویر را تشخیص بدهند. لایهی اول مهمترین اطلاعات، یعنی شکل کلّی تصویر، را دریافت میکند. وظیفهی لایهی بعدی دریافت جزئیات بیشتری دربارهی شکلهای موجود در تصویر است. و لایهی نهایی مشخص میکند که موضوع عکس چیست.
در این قسمت تصویری را پیش و پس از عبورش از نرمافزار گوگل میبینیم:
به سوی ابرها
جستوجو به دنبال شکلهای آشنا در ابرها، دیگر فقط مختص انسانها نیست.
مهندسان گوگل نرمافزارشان را طوری تمرین دادهاند که در میلیونها عکسی که به شبکهی عصبی مصنوعی داده میشود، بتواند الگوهای آشنا را پیدا کند. این نرمافزار میتواند در عکسهایی که هدف جستوجو وجود ندارد، الگوهایی مشابه را بیابد. در این قسمت نرمافزار گوگل، همانند یک انسان خیالباف، شکل حیوانات مختلف را در میان ابرها تشخیص داده است. این الگوها به این دلیل به وجود آمدهاند که شبکهی عصبی برای تشخیص تصاویر حیوانات آموزش دیده است.
پرهیبهای مشابه
چگونگی آموزش دیدن ماشین، مشخصکنندهی پیشفرضهای آن در تشخیص دادنِ طرحهایی خاص در عکسهای ناآشنا است.
در این قسمت، عکسی از یک افق کوهستانی به یک معبد تبدیل شده، درخت به یک ساختمان تغییر شکل یافته و یک گیاه آفتابگردان به یک پرنده بدل شده است.
تصاویر نهایی شاید طرح کلی تصاویر اولیه را داشته باشند، اما از آنجا که همهی جزئیات عکسهای اول در کتابخانهی تصویرِ نرمافزار (یا ذهن آن) وجود ندارد، در نتیجه نرمافزار خودش این جزئیات را تولید میکند.
اغراق
وقتی نرمافزار چیزی را تشخیص میدهد، در تصویر نهایی حضور آن چیز را بزرگنمایی میکند. حتی وقتی نرمافزار موفق میشود به درستی حیواناتی را که برای تشخیصشان آموزش دیده، تشخیص بدهد، به نظر میرسد برای تشخیص دادن الگوهای مشابه بیش از حد اشتیاق دارد. به ویژه وقتی که مهندسان تصویری را که خود ماشین تولید کرده بود دوباره به خودش میدهند و میخواهند دوباره الگوهای مشابه را پیدا کند.
در این تصویر نرمافزار موفق شده است اسب را تشخیص بدهد، اما در بخشهای دیگرِ عکس اولیه هم توانسته است حیوانات بسیار دیگری را هم تشخیص بدهد.
تغییر شکل
اگر یک عکس را چندین بار به این شبکهی عصبی بدهید، این هوش مصنوعی، عکس را به الگوها و شکلهایی تبدیل میکند که برای تشخیص دادنشان آموزش دیده است.
در این قسمت هم عکسی از یک منظرهی تابستانی به تصویر توهمآلودی تبدیل شده است که در آن ابرها به شکل سگ هستند.
بداههپردازی ماشین
در افراطیترین حالت، این شبکهی عصبی میتواند تصویری از نویزهای تصادفی را به چیزی تبدیل کند که با آن آشنایی دارد. در این قسمت این ماشین در تصویری بیالگو از تعدادی پیکسل، تعداد بسیار زیادی پنجرهی هلالی تشخیص داده است.
ماشین در خدمت خلاقیت
این تصویر هم در ابتدا منظرهای از چند ساختمان بود و اکنون به نقاشیهای ونگوک میماند.
گوگل مشغول توسعه دادن این تکنولوژی است تا بتواند نرمافزار تشخیص عکس خود را تقویت کند. سرویسهای عکس در آینده احتمالا میتوانند اشیا، اماکن و چهرههای موجود در عکس را تشخیص بدهند.
مهندسان میگویند این نرمافزار شاید روزی بتواند به هنرمندان کمک کند تا روشهای جدیدی برای بیان خلاقیتشان کشف کنند.