في خطوة أثارت ضجة واسعة، أعلنت شركة OpenAI هذا الأسبوع عن أحدث نماذجها: o3 و o4-mini، وهما نماذج متطورة تعتمد على أسلوب جديد يُعرف بـ"نماذج التفكير المنطقي"، حيث يتم تفكيك الطلب إلى أجزاء متعددة يتم التعامل معها واحدًا تلو الآخر، الهدف هو دفع النموذج إلى التفكير بعمق للوصول إلى نتائج أكثر دقة مقارنة بالنماذج السابقة، بحسب lifehacker.
موضوعات مقترحة
لكن بعيدًا عن الاستخدامات التقليدية، برزت وظيفة مثيرة لهذه النماذج الجديدة على مواقع التواصل الاجتماعي، وهي "تخمين الموقع من خلال الصور"، أو ما يُعرف باسم geoguessing، حيث يستطيع المستخدم رفع صورة عشوائية ويطلب من ChatGPT تحديد موقعها، فيقوم النموذج بتحليل أدق التفاصيل المرئية ليصل إلى استنتاج منطقي عن مكان التقاطها.
ChatGPT ينجح في تحليل الصور دون الاعتماد على بيانات مخفية
وفقًا لتقارير نشرها موقع TechCrunch، فإن بعض المستخدمين أكدوا أن النموذج لا يعتمد على أي بيانات "ميتاداتا" مخفية داخل الصور، حيث يقومون بحذف هذه البيانات يدويًا قبل رفع الصور. وهذا يعني أن النموذج يعتمد فقط على التحليل البصري والمنطقي، وربما بعض عمليات البحث على الإنترنت.
ما يميز هذه التقنية أن النموذج يشرح للمستخدم طريقة تفكيره، فقد يشير مثلًا إلى لون لوحة سيارة معين يرمز إلى دولة ما، أو إلى وجود لافتة مكتوبة بلغة محددة، أو حتى نمط معماري يرتبط بمنطقة معينة في العالم.
تجارب ميدانية تثبت فعالية محدودة لكنها مثيرة للاهتمام
من أجل التحقق من دقة النموذج، قرر كاتب التقرير تجربة o3 باستخدام صور من Google Street View. عندما عرض صورة لطريق سريع في مينيسوتا تطل على أفق مدينة مينيابوليس، تمكن النموذج من تحديد المدينة والطريق خلال دقيقة واحدة فقط. كما تعرّف بسهولة على معلم شهير في باريس هو "البانثيون"، وذكر أن الصورة تعود لفترة الترميم عام 2015.
لكن التحدي الحقيقي كان عند استخدام صور من مواقع أقل شهرة، مثل زاوية شارع عشوائي في مدينة سبرينغفيلد بولاية إلينوي. ظهرت قدرات النموذج التحليلية بوضوح، حيث قام بقص الصورة إلى عدة أجزاء للتركيز على تفاصيل مثل نمط البناء، تصميم الكنيسة، وحتى شكل مقاعد الحدائق.
ورغم تحليله العميق، فقد أخفق النموذج في تحديد الموقع بدقة، وبدأ في التشتت بين مدن مختلفة مثل سبرينغفيلد بولاية ميزوري، وأوماها، وحتى قصر الحاكم في توبيكا، ما يشير إلى أن قدرته على "الاستنتاج الجغرافي" لا تزال غير مثالية.
نموذج GPT-4o ليس أقل كفاءة.. ولكن المخاوف حقيقية
في المقابل، أظهرت تجارب أن نموذج GPT-4o قادر على تقديم نتائج مماثلة، بل وأسرع في بعض الحالات، مثلما حدث عندما تعرف على أفق مينيابوليس أو ظن أن صورة من كانساس تعود لولاية أيوا. رغم أن التقديرات لم تكن دائمًا صحيحة، إلا أنها أتت بسرعة وبقدر من المنطق.
هذا التساوي في الأداء بين النموذجين يثير بعض التساؤلات، خاصة في ظل المخاوف من استخدام هذه التقنية لتحديد مواقع أشخاص من خلال صور يشاركونها دون نية الكشف عن موقعهم، ما يفتح الباب أمام تحديات تتعلق بالخصوصية والأمان الرقمي.
OpenAI ترد على المخاوف.. ونصائح للمستخدمين
في ردها على هذه المخاوف، أوضحت شركة OpenAI أنها صممت النماذج الجديدة مثل o3 و o4-mini لدعم مجالات إيجابية مثل الوصول الرقمي، البحث العلمي، وتحديد المواقع في حالات الطوارئ. وأكدت أنها أضافت قيودًا تمنع النماذج من تمييز الأفراد أو تقديم معلومات خاصة، إلى جانب مراقبة الاستخدام لرصد أي انتهاكات لسياسات الخصوصية.
لكن تبقى الحقيقة أن هذه التكنولوجيا قادرة على تقديم معلومات دقيقة بدرجة كافية أحيانًا، وهو ما قد يستغله البعض بطرق لا تتماشى مع الأهداف المعلنة.