ابزار هوش مصنوعی آنالیز تصاویر گوگل چیست؟

ابزار جدید گوگل قادر است که به آنالیز تصاویر بپردازد. هوش مصنوعی این ابزار قادر است که به توصیف تصویر پرداخته و ارتباط آن با موضوعات مختلف را بیان کند. این ابزار نشان دهنده نحوه کار هوش مصنوعی و الگوریتم های یادگیری ماشینی گوگل در درک تصاویر است. این ابزار جزیی از محصولان Cloud Vision گوگل می باشد.

آیا ابزار Cloud Vision جزییات الگوریتم گوگل را بازتاب می دهد؟

اغلب ابزارهایی که گوگل در سال های اخیر معرفی کرده، نحوه کار آن در رتبه بندی نتایج جستجو را بازتاب نداده است.  بنابریان این ابزار نیز احتمالا تصویری از چگونگی رتبه بندی تصاویر را ارئه نخواهد داد.

با این حال، این ابزار اطلاعات خوبی از نحوه کار هوش مصنوعی گوگل در فهم تصاویر شما ارائه می دهد. از این اطلاعات می توانید در بهبود تصاویر سایت استفاده کنید، چرا که تصاویر، جزیی از مفاهیم اصلی محتوای یک صفحه به شمار می روند. این ابزار در اینجا قابل دسترس است.

ابزار جدید گوگل چیست؟

این ابزار پیش نمایشی از API محصول Cloud Vision گوگل است. با استفاده از این API می توان ویژگی آنالیز تصاویر را به اپلیکیشن ها و وب سایت ها اضافه نمود. این ابزار به شما امکان می دهد تا تصاویر را در آن آپلود کرده و تفسیر هوش مصنوعی گوگل از آن را مشاهده کنید.

این ابزار دارای هفت نوع طبقه بندی برای دسته بندی تصاویر آپلود شده است:

  • Faces
  • Objects
  • Lables
  • Web Entities
  • Text
  • Properties
  • Safe Search

1. Faces

تب Faces آنالیزی از احساس چهره موجود در تصویر را نمایش می دهد. البته در میزان دقت آنالیز انجام شده جای تردید وجود دارد. همانطور که در تصویر زیر مشاهده می کنید، آقای جان مولر در حال خندیدن است، اما این حالت توسط ابزار گوگل شناسایی نشده است.

تب Faces

 2. Objects

تب Objects نمایش دهنده اشیا موجود در تصویر مانند عینک است. این تب در تست های ما بسیار خوب عمل کرد.

3. Labels

تب Labels جزییاتی درباره تصاویر آپلود شده مانند گوش، دهان یا حتی مفاهیم انتزاعی مانند پرتره یا عکاسی به نمایش می گذارد.

4. Web Entities

محتویات این تب عباراتیست که از طریق وب با تصویر آپلود شده در ارتباطند.

تب Web Entities

اگر گوگل از وب برای درک مفهوم عکس استفاده کند، بعید میدانیم که تحت تاثیر وب سایت های کپی کننده قرار بگیرد. چرا گوگل معمولا برای درک تصاویر از بیش از یک پارامتر استفاده می کند.

5. Properties

این بخش نمایش دهنده رنگ هاییست که در تصویر به کار رفته اند.

6. Safe Search

این تب به نمایش چگونگی رتبه بندی تصویر در جستجو های unsafe می پردازد. در صورتی که تصاویر با محتوای مخصوص بزرگسالان، مسائل پزشکی، خشونت و نژادپرستی در ارتباط باشند در این قسمت آنالیز می گردند.

در مثال بعدی توانایی گوگل در درک خواندن کلمات را تست کرده ایم.

مثالی از Google Cloud Vision

گوگل از توضیحات تصویر، متن جایگزین، نام فایل تصویر و محتای متنی حول و حوش آن در فهم و رتبه بندی آن تصویر استفاده می کند. گوگل تاکنون اشاره ای به تاثیر متن داخل تصاویر نکرده بود. همانطور که می بینید گوگل دارای قابلیت درک کلمات تایپ شده در تصاویر است.

لازم به ذکر است، در تست های دیگری که از تصاویر دارای متن فارسی نمودیم، گوگل قادر به شناسایی آنها نبود.

جمع بندی

این ابزار دارای قابلیت های جالبیست که به ما ایده خوبی از نحوه درک تصاویر توسط گوگل میدهد. شما می توانید با استفاده از نتایج آن اطلاعات خوبی کسب کرده و در نتیجه تصاویر وب سایت را بهینه تر از پیش کنید.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *